


还剩27页未读,
继续阅读
2019届二轮复习(理)概率统计综合学案(全国通用)
展开
【母题原题1】【2018新课标1,理20】某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为,且各件产品是否为不合格品相互独立.
(1)记20件产品中恰有2件不合格品的概率为,求的最大值点.
(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的作为的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.
(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为,求;
(ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
.
所以.
(ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为400元.
由于,故应该对余下的产品作检验.
点睛:该题考查的是有关随机变量的问题,在解题的过程中,一是需要明确独立重复试验成功次数对应的概率公式,再者就是对其用函数的思想来研究,应用导数求得其最小值点,在做第二问的时候,需要明确离散型随机变量的可取值以及对应的概率,应用期望公式求得结果,再有就是通过期望的大小关系得到结论.
【母题原题2】【2017新课标1,理19】为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)试说明上述监控生产过程方法的合理性;
(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得xi=9.97,s=≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(-3+3)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量 服从正态分布N(μ,σ2),则P(μ-3σ< <μ+3σ)=0.997 4.
0.997 416≈0.959 2,≈0.09.
因此σ的估计值为≈0.09.
【母题原题3】【2016新课标1,理19】某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数.
(Ⅰ)求X的分布列;
(Ⅱ)若要求P(X≤n)≥0.5,确定n的最小值;
(Ⅲ)以购买易损零件所需费用的期望值为决策依据,在n=19与n=20之中选其一,应选用哪个?
【解析】(Ⅰ)由柱状图 并以频率代替概率 可得,一台机器在三年内需更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2.
从而P(X=16)=0.2×0.2=0.04;
X
16
17
18
19
20
21
22
P
0.04
0.16
0.24
0.24
0.2
0.08
0.04
(Ⅱ)由(Ⅰ)知P(X≤18)=0.44,P(X≤19)=0.68,故n的最小值为19.
(Ⅲ)记Y表示2台机器在购买易损零件上所需的费用(单位:元).
当n=19时 ,
EY=19×200×0.68+(19×200+500)×0.2+(19×200+2×500)×0.08+(19×200+3×500)×0.04=4 040.
当n=20时 ,
EY=20×200×0.88+(20×200+500)×0.08+(20×200+2×500)×0.04=4 080.
可知当n=19时所需费用的期望值小于n=20时所需费用的期望值,故应选n=19.
【热点剖析】从近几年的高考试题来看,频率分布直方图、茎叶图、平均数、方差、分布列是高考的热点,题型既有选择题、填空题,又有解答题,客观题考查知识点较单一,解答题考查得较为全面,常常和概率、平均数等知识结合在一起,考查学生应用知识解决问题的能力.独立性检验、回归分析高考对此部分内容考查有加强趋势,主要是以考查独立性检验、回归分析为主,并借助解决一些简单的实际问题来考查一些基本的统计思想,在高考中多为选择、填空题,也有解答题出现.频率分布直方图、茎叶图、平均数、方差,离散型随机变量的分布列与期望仍然是考查的热点,同时应注意和概率、平均数、分布列,期望,二项分布,正态分布等知识的结合,同时应注意独立性检验在实际生活中的应用,有可能涉及一道与独立检验有关的大题.
【经验分享】
1.进行分层抽样时应注意以下几点:
(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠;
(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性应相同;
(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.
2.在作茎叶图时,容易出现茎两边的数字不是从小到大的顺序排列,从而导致结论分析错误,在使用茎叶图整理数据时,要注意:一是数据不能遗漏,二是数据最好按从小到大顺序排列,对三组以上的数据,也可使用茎叶图,但没有表示两组记录那么直观、清晰.
3.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.
4.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.
5.r的大小只说明是否相关并不能说明拟合效果的好坏,R2才是判断拟合效果好坏的依据.
6.独立性检验的随机变量K2=2.706是判断是否有关系的临界值,K2<2.076应判断为没有充分证据显示X与Y有关系,而不能作为小于90 的量化值来判断.
7. 概率计算题的核心环节就是把一个随机事件进行类似本题的分拆,这中间有三个概念,事件的互斥,事件的对立和事件的相互独立,在概率的计算中只要弄清楚了这三个概念,根据实际情况对事件进行合理的分拆,就能把复杂事件的概率计算转化为一个个简单事件的概率计算,达到解决问题的目的.
8.在解含有相互独立事件的概率题时,首先把所求的随机事件分拆成若干个互斥事件的和,其次将分拆后的每个事件分拆为若干个相互独立事件的乘积,这两个事情做好了,问题的思路就清晰了,接下来就是按照相关的概率值进行计算的问题了,如果某些相互独立事件符合独立重复试验概型,就把这部分归结为用独立重复试验概型,用独立重复试验概型的概率计算公式解答.
9.相当一类概率应用题都是比如掷硬币、掷骰子、摸球等概率模型赋予实际背景后得出来的,我们在解题时就要把实际问题再还原为我们常见的一些概率模型,这就要根据问题的具体情况去分析,对照常见的概率模型,把不影响问题本质的因素去除,抓住问题的本质.
10.求解一般的随机变量的期望和方差的基本方法是:先根据随机变量的意义,确定随机变量可以取哪些值,然后根据随机变量取这些值的意义求出取这些值的概率,列出分布列,根据数学期望和方差的公式计算.
【知识整合】
一,统计初步
1.简单随机抽样
简单随机抽样是不放回抽样,被抽取样本的个体数有限,从总体中逐个地进行抽取,使抽样便于在实践中操作.每次抽样时,每个个体等可能地被抽到,保证了抽样的公平性.实施方法主要有抽签法和随机数法.
2.系统抽样
(1)定义:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样,也称作等距抽样.
(2)系统抽样的步骤:
①编号.采用随机的方式将总体中的个体编号.
②分段.先确定分段的间隔k.当(N为总体中的个体数,n为样本容量)是整数时,k=;当不是整数时,通过从总体中随机剔除一些个体使剩下的总体中个体总数N′能被n整除,这时k=.③确定起始个体编号.在第1段用简单随机抽样确定起始的个体编号S.
④按照事先确定的规则抽取样本.通常是将S加上间隔k,得到第2个个体编号S+k,再将(S+k)加上k,得到第3个个体编号S+2k,这样继续下去,获得容量为n的样本.其样本编号依次是:S,S+k,S+2k,…,S+(n-1)k.
3.分层抽样
(1)定义:当总体由有明显差别的几部分组成时,按某种特征在抽样时将总体中的各个个体分成互不交叉的层,然后按照各层在总体中所占的比例,从各层独立地抽取一定数量的个体合在一起作为样本,这种抽样的方法叫做分层抽样.
分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体中所占比例抽取.分层抽样要求对总体的内容有一定的了解,明确分层的界限和数目,分层要恰当.
(2)分层抽样的步骤
①分层;②按比例确定每层抽取个体的个数;③各层抽样(方法可以不同);④汇合成样本.
(3)分层抽样的优点
分层抽样充分利用了己知信息,充分考虑了保持样本结构与总体结构的一致性.使样本具有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着非常广泛的应用.
4.绘制频率分布直方图
把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.在频率分布直方图中,纵轴表示“频率/组距”,数据落在各小组内的频率用小矩形的面积表示,各小矩形的面积总和等于1.
5.茎叶图
统计中还有一种被用来表示数据的图叫做茎叶图.茎是指中间的一列数,叶是从茎的旁边生长出来的数.在样本数据较少、较为集中,且位数不多时,用茎叶图表示数据的效果较好,它较好的保留了原始数据信息,方便记录与表示,但当样本数据较多时,茎叶图就不太方便.
6.平均数、中位数和众数
(1)平均数:一组数据的总和除以数据的个数所得的商就是平均数.
(2)中位数:如果将一组数据按从小到大的顺序依次排列,当数据有奇数个时,处在最中间的一个数是这组数据的中位数;当数据有偶数个时,处在最中间两个数的平均数,是这组数据的中位数.
(3)众数:出现次数最多的数(若有两个或几个数据出现得最多,且出现的次数一样,这些数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数).
(4)在频率分布直方图中,最高小长方形的中点所对应的数据值即为这组数据的众数.而在频率分布直方图上的中位数左右两侧的直方图面积应该相等,因而可以估计其近似值.平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
7.方差、标准差
(1)设样本数据为x1,x2,…,xn样本平均数为,则s2=[(x1-)2+(x2-)2+…+(xn-)2]=[(x12+x22+…+xn2)-n2]叫做这组数据的方差,用来衡量这组数据的波动大小,一组数据方差越大,说明这组数据波动越大.把样本方差的算术平方根叫做这组数据的样本标准差.
(2)数据的离散程度可以通过极差、方差或标准差来描述,其中极差反映了一组数据变化的最大幅度.方差则反映一组数据围绕平均数波动的大小.
8.两个变量的线性相关
(1)散点图
将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,表示具有相关关系的两个变量的一组数据的图形叫做散点图.利用散点图可以判断变量之间有无相关关系.
(2)正相关、负相关
如果散点图中各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.
反之,如果两个变量的散点图中点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.
9.回归分析
对具有相关关系的两个变量进行统计分析的方法叫回归分析.其基本步骤是:①画散点图,②求回归直线方程,③用回归直线方程作预报.
(1)回归直线:观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
(2)回归直线方程的求法——最小二乘法.
设具有线性相关关系的两个变量x、y的一组观察值为(xi,yi)(i=1,2,…,n),则回归直线方程=+x的系数为:
其中=i,=i,(,)称作样本点的中心.
,表示由观察值用最小二乘法求得的a,b的估计值,叫回归系数.
10.独立性检验
(1)若变量的不同“值”表示个体所属的不同类别,则这些变量称为分类变量.
(2)两个分类变量X与Y的频数表,称作2×2列联表.
二.随机事件的概率
1.随机事件和确定事件:在一定的条件下所出现的某种结果叫做事件.
(1)在条件下,一定会发生的事件叫做相对于条件的必然事件.
(2)在条件下,一定不会发生的事件叫做相对于条件的不可能事件.
(3)必然事件与不可能事件统称为确定事件.
(4)在条件下可能发生也可能不发生的事件,叫做随机事件.
(5)确定事件和随机事件统称为事件,一般用大写字母表示.
2.频率与概率
(1)在相同的条件下重复次试验,观察某一事件是否出现,称次试验中事件出现的次数为事件出现的频数,称事件出现的比例为事件出现的频率.
(2)对于给定的随机事件,如果随着试验次数的增加,事件发生的频率稳定在某个常数上,把这个常数记作,称为事件的概率,简称为的概率.
3.互斥事件与对立事件
互斥事件的定义:在一次试验中,不可能同时发生的两个事件叫做互斥事件.即为不可能事件(),则称事件与事件互斥,其含义是:事件与事件在任何一次试验中不会同时发生.
一般地,如果事件中的任何两个都是互斥的,那么就说事件彼此互斥.
对立事件:若不能同时发生,但必有一个发生的两个事件叫做互斥事件;即为不可能事件,而为必然事件,那么事件与事件互为对立事件,其含义是:事件与事件在任何一次试验中有且仅有一个发生.
互斥事件和对立事件的区别和联系:对立事件是互斥事件,但是互斥事件不一定是对立事件.两个事件互斥是两个事件对立的必要非充分条件.
4.事件的关系与运算
定义
符号表示
包含关系
如果事件发生,则事件一定发生,这时称事件包含事件 (或称事件包含于事件)
(或)
相等关系]
若且,那么称事件与事件相等
并事件
(和事件)
若某事件发生当且仅当事件发生或事件发生,则称此事件为事件与事件的并事件(或和事件)
(或)
交事件
(积事件)
若某事件发生当且仅当事件发生且事件发生,则称此事件为事件与事件的交事件(或积事件)
(或)
互斥事件
若为不可能事件,那么称事件与事件互斥
对立事件
若为不可能事件,为必然事件,那么称事件与事件互为对立事件
且
5.随机事件的概率
事件的概率:在大量重复进行同一试验时,事件发生的频率总接近于某个常数,在它附近摆动,这时就把这个常数叫做事件的概率,记作.
由定义可知,显然必然事件的概率是,不可能事件的概率是.
5.概率的几个基本性质
(1)概率的取值范围:.
(2)必然事件的概率:.
(3)不可能事件的概率:.
(4)互斥事件的概率加法公式:
①(互斥),且有.
② (彼此互斥).
(5)对立事件的概率:.
三.古典概型
1. 一次试验连同其中可能出现的每一个结果称为一个基本事件,通常此试验中的某一事件A由几个基本事件组成.如果一次试验中可能出现的结果有n个,即此试验由n个基本事件组成,而且所有结果出现的可能性都相等,那么每一基本事件的概率都是.如果某个事件A包含的结果有m个,那么事件A的概率P(A)=.
基本事件的特点
(1)任何两个基本事件是互斥的.
(2)任何事件都可以表示成基本事件的和(除不可能事件).
2.古典概型:具有以下两个特点的概率模型称为古典概率模型,简称古典概型.
①试验中所有可能出现的基本事件只有有限个,即有限性.
②每个基本事件发生的可能性相等,即等可能性.
概率公式:P(A)=.
四.几何概型
1.(1)随机数的概念:
随机数是在一定范围内随机产生的数,并且得到这个范围内任何一个数的机会是均等的. ]
(2)随机数的产生方法
①利用函数计算器可以得到0 1之间的随机数;
②在Scilab语言中,应用不同的函数可产生0 1或a b之间的随机数.
2.几何概型
(1)定义:如果某个事件发生的概率只与构成该事件区域的长度(面积或体积等)成比例,则称这样的概率模型为为几何概率模型,简称几何概型.
(2)特点:①无限性:在一次试验中,可能出现的结果有无限多个;
②等可能性:每个结果的发生具有等可能性.
(3)几何概型的解题步骤:
首先是判断事件是一维问题还是二维、三维问题(事件的结果与一个变量有关就是一维的问题,与两个变量有关就是二维的问题,与三个变量有关就是三维的问题);接着,如果是一维的问题,先确定试验的全部结果和事件构成的区域长度(角度、弧长等),最后代公式
;如果是二维、三维的问题,先设出二维或三维变量,再列出试验的全部结果和事件分别满足的约束条件,作出两个区域,最后计算两个区域的面积或体积代公式.
(4)求几何概型时,注意首先寻找到一些重要的临界位置,再解答.一般与线性规划知识有联系.
3.几种常见的几何概型
(1)设线段l是线段L的一部分,向线段L上任投一点.若落在线段l上的点数与线段L的长度成正比,而与线段l在线段l上的相对位置无关,则点落在线段l上的概率为:
P=l的长度/L的长度
(2)设平面区域g是平面区域G的一部分,向区域G上任投一点,若落在区域g上的点数与区域g的面积成正比,而与区域g在区域G上的相对位置无关,则点落在区域g上概率为:
P=g的面积/G的面积
(3)设空间区域上v是空间区域V的一部分,向区域V上任投一点.若落在区域v上的点数与区域v的体积成正比,而与区域v在区域v上的相对位置无关,则点落在区域V上的概率为:
P=v的体积/V的体积
五.条件概率
1.条件概率及其性质
(1)对于任何两个事件和,在已知事件发生的条件下,事件发生的概率叫做条件概率,用符号来表示,其公式为.
在古典概型中,若用表示事件中基本事件的个数,则.
(2)条件概率具有的性质:
①;
② 如果和是两互斥事件,则.
2.相互独立事件
(1)对于事件、,若的发生与的发生互不影响,则称、是相互独立事件.
(2)若与相互独立,则,
.
(3)若与相互独立,则与,与,与也都相互独立.
(4)若,则与相互独立.
3.独立重复试验
独立重复试验是指在相同条件下可重复进行的,各次之间相互独立的一种试验,在这种试验中每一次试验只有两种结果,即要么发生,要么不发生,且任何一次试验中发生的概率都是一样的.
六.离散型随机变量的分布列
离散型随机变量的分布列
(1)随机变量
如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量,随机变量常用字母X,Y,ξ,η等表示.
(2)离散型随机变量
对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.
若是随机变量,,其中是常数,则也是随机变量.
2.常见离散型随机变量的分布列
(1)两点分布:
若随机变量服从两点分布,即其分布列为
0
1
其中,则称离散型随机变量服从参数为的两点分布.其中称为成功概率.
(2)超几何分布:
在含有件次品的件产品中,任取件,其中恰有件次品,则事件{}发生的概率为,,其中,且,称分布列为超几何分布列.
0
1
…
m
…
(3)设离散型随机变量可能取得值为,,…,,…,取每一个值 ()的概率为,则称表
…
…
…
…
为随机变量X的概率分布列,简称X的分布列.有时为了表达简单,也用等式,表示的分布列.
分布列的两个性质
①,;②.
七.二项分布:
1.离散型随机变量的二项分布:在一次随机试验中,某事件可能发生也可能不发生,在次独立重复试验中这个事件发生的次数是一个随机变量.如果在一次试验中某事件发生的概率是,那么在次独立重复试验中这个事件恰好发生次的概率是,(…, )于是得到随机变量的概率分布如下:
…
…
…
…
由于恰好是二项展开式
中的各项的值,所以称这样的随机变量服从二项分布,记作,其中,为参数,并记=.…
2.二项分布的期望与方差:若,则 ,
八.正态分布
1.总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线.
它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于总体密度曲线,直线及轴所围图形的面积.
2.正态分布密度函数:
,(,)
其中π是圆周率;是自然对数的底;是随机变量的取值;为正态分布的均值;是正态分布的标准差.正态分布一般记为
正态分布的定义及表示
函数,其中实数和(>0)为参数.我们称的图像为正态分布密度曲线,简称正态曲线.
如果对于任何实数,随机变量满足则称随机变量服从正态分布,正态分布完全由参数确定,因此正态分布常记作,如果随机变量服从正态分布,则记为 .正态分布)是由均值和标准差唯一决定的分布
3.正态曲线有以下性质:
(1)曲线位于轴上方,与轴不相交;
(2)曲线是单峰的,它关于直线对称;
(3)曲线在处达到峰值;
(4)曲线与轴围成的图形的面积为1;
(5)当一定时,曲线随着的变化而沿轴平移;
(6)当一定时,曲线的形状由确定,越小,曲线越“瘦高”,表示总体的分布越集中;越大,曲线越“矮胖”,表示总体的分布越分散.
4.正态总体在三个特殊区间内取值的概率值
①P(μ-σ
②P(μ-2σ
③P(μ-3σ
5.标准正态曲线:标准正态曲线:当μ=0、σ=l时,正态总体称为标准正态总体,其相应的函数表示式是,(-∞<x<+∞),其相应的曲线称为标准正态曲线 .标准正态总体N(0,1)在正态总体的研究中占有重要的地位任何正态分布的概率问题均可转化成标准正态分布的概率问题.,以及标准正态总体在任一区间(a,b)内取值概率.
6.一般正态分布与标准正态分布的转化
由于一般的正态总体其图像不一定关于y轴对称,对于任一正态总体,其取值小于x的概率.只要会用它求正态总体在某个特定区间的概率即可.
7.“小概率事件”和假设检验的基本思想
“小概率事件”通常指发生的概率小于5 的事件,认为在一次试验中该事件是几乎不可能发生的.这种认识便是进行推断的出发点.关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5 的犯错误的可能.
课本是借助于服从正态分布的有关零件尺寸的例子来介绍假设检验的基本思想.进行假设检验一般分三步:
第一步,提出统计假设.课本例子里的统计假设是这个工人制造的零件尺寸服从正态分布;
第二步,确定一次试验中的取值a是否落入范围(μ-3σ,μ+3σ);
第三步,作出推断.如果a∈(μ-3σ,μ+3σ),接受统计假设;如果,由于这是小概率事件,就拒绝统计假设.
1.【山东、湖北部分重点中学2018年高考冲刺模拟试卷(二)】我校为了更好地管理学生用手机问题,根据学生每月用手机时间(每月用手机时间总和)的长短将学生分为三类: 第一类的时间区间在,第二类的时间区间在,第三类的时间区间在(单位:小时),并规定属于第三类的学生要进入“思想政治学习班”进行思想和心理的辅导.现对我校二年级1014名学生进行调查,恰有14人属于第三类,这14名学生被学校带去政治学习.由剩下的1000名学生用手机时间情况,得到如图所示频率分布直方图.
(I) 求这1000名学生每月用手机时间的平均数;
(II)利用分层抽样的方法从1000名选出10位学生代表,若从该10名学生代表中任选两名学生,求这两名学生用手机时间属于不同类型的概率;
(III)若二年级学生长期保持着这一用手机的现状,学校为了鼓励学生少用手机,连续10个月,每个月从这1000名学生中随机抽取1名,若取到的是第一类学生,则发放奖品一份,设为获奖学生人数,求的数学期望与方差.
2.【福建省三明市第一中学2018届高三模拟卷(一)】某市政府为了节约生活用电,计划在本市试行居民生活费定额管理,即确定一户居民月用电量标准,用电量不超过的部分按平价收费,超出的部分按议价收费.为此,政府调查了100户居民的月平均用电量(单位:度),以,,,,,,分组的频率分布直方图如图所示.
(1)根据频率分布直方图的数据,求直方图中的值并估计该市每户居民平均用电量的值;
(2)用频率估计概率,利用(1)的结果,假设该市每户居民月平均用电量服从正态分布
(i)估计该市居民月平均用电量介于度之间的概率;
(ii)利用(i)的结论,从该市所有居民中随机抽取3户,记月平均用电量介于度之间的户数为,求的分布列及数学期望.
所以的分布列为
0
1
2
3
所以
点睛:“求期望”,一般利用离散型随机变量的数学期望的定义求期望.对于某些实际问题中的随机变量,如果能够断定它服从某常见的典型分布(如二项分布),则此随机变量的期望可直接利用这种典型分布的期望公式()求得.因此,应熟记常见的典型分布的期望公式,可加快解题速度.
3.【山东省肥城市2018届高三适应性训练数学】某地区某长产品近几年的产量统计如表:
年份
2012
2013
2014
2015
2016
2017
年份代码
1
2
3
4
5
6
年产量(万吨)
6.6
6.7
7
7.1
7.2
7.4
(1)根据表中数据,建立关于的线性回归方程;
(2)若近几年该农产品每千克的价格(单位:元)与年产量满足的函数关系式为,且每年该农产品都能售完.
①根据(1)中所建立的回归方程预测该地区2018()年该农产品的产量;
②当()为何值时,销售额最大?
附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为:,.
为7.56万吨.
点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,写出回归方程,回归直线方程恒过点.
4.【山东省潍坊市青州市2018届高三第三次高考模拟考试】某房产中介公司2017年9月1日正式开业,现对其每个月的二手房成交量进行统计,表示开业第个月的二手房成交量,得到统计表格如下:
(1)统计中常用相关系数来衡量两个变量之间线性关系的强弱.统计学认为,对于变量,如果,那么相关性很强;如果,那么相关性一般;如果,那么相关性较弱.通过散点图初步分析可用线性回归模型拟合与的关系.计算的相关系数,并回答是否可以认为两个变量具有很强的线性相关关系(计算结果精确到0.01)
(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程(计算结果精确到0.01),并预测该房产中介公司2018年6月份的二手房成交量(计算结果四舍五入取整数).
(3)该房产中介为增加业绩,决定针对二手房成交客户开展抽奖活动.若抽中“一等奖”获6千元奖金;抽中“二等奖”获3千元奖金;抽中“祝您平安”,则没有奖金.已知一次抽奖活动中获得“一等奖”的概率为,获得“二等奖”的概率为,现有甲、乙两个客户参与抽奖活动,假设他们是否中奖相互独立,求此二人所获奖金总额(千元)的分布列及数学期望.
参考数据:,,,,.
参考公式:
【解析】分析:(1)根据相关系式公式,即可求解相关系数,并作出判断;
(2)计算回归系数得出回归方程,再根据回归方程估计成交量,即可作答;
(3)根据相互独立事件的概率计算随机变量的各种可能取值对应的概率,从而得出分布列,求解数学期望.
,.
所以,奖金总额的分布列如下表:
0
3
6
9
12
千元.
点睛:本题主要考查统计知识的应用以及回归直线方程的应用和随机变量的分布列和数学期望,解答本题,首先要准确确定所研究对象的基本事件空间、基本事件个数,再利用二项何分布的概率公式,求得概率,得到分布列和求得数学期望,本题属中等难度的题目,计算量不是很大,能很好的考查考生数学应用意识、基本运算求解能力等.
5.【重庆市西南大学附中高2018级第四次月考】某测试团队为了研究“饮酒”对“驾车安全”的影响,随机选取名驾驶员先后在无酒状态、酒后状态下进行“停车距离”测试.测试的方案:电脑模拟驾驶,以某速度匀速行驶,记录下驾驶员的“停车距离”(驾驶员从看到意外情况到车子完全停下所需要的距离).无酒状态与酒后状态下的试验数据分别列于表1和表2.
表1
停车距离(米)
频数
24
42
24
9
1
表2
平均每毫升血液酒精含量毫克
10
30
50
70
90
平均停车距离米
30
50
60
70
90
回答以下问题.
(1)由表1估计驾驶员无酒状态下停车距离的平均数;
(2)根据最小二乘法,由表2的数据计算关于的回归方程;
(3)该测试团队认为:驾驶员酒后驾车的平均“停车距离”大于(1)中无酒状态下的停车距离平均数的倍,则认定驾驶员是“醉驾”.请根据(2)中的回归方程,预测当每毫升血液酒精含量大于多少毫克时为“醉驾”?(精确到个位)
(附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为,)
∴预测当每毫升血液酒精含量大于毫克时为“醉驾”
点睛:本题考查线性回归直线方程,解题时根据所给公式计算即可,属于基础题.
6.【四川省双流中学2018届高三考前第二次模拟考试】为推动实施健康中国战略,树立国家大卫生、大健康概念,手机APP也推出了多款健康运动软件,如“微信运动”,杨老师的微信朋友圈内有600位好友参与了“微信运动”,他随机选取了40位微信好友(女20人,男20人),统计其在某一天的走路步数,其中,女性好友的走路步数数据记录如下:
5860
8520
7326
6798
7325
8430
3216
7453
11754
9860
8753
6450
7290
4850
10223
9763
7988
9176
6421
5980
男性好友走路的步数情况可分为五个类别:(说明:“”表示大于等于0,小于等于2000,下同),,,,,且,,三种类别人数比例为,将统计结果绘制如图所示的条形图,若某人一天的走路步数超过8000步被系统认定为“卫健型”,否则被系统认定为“进步型”.
若以杨老师选取的好友当天行走步数的频率分布来估计所有微信好友每日走路步数的概率分布,请估计杨老师的微信好友圈里参与“微信运动”的600名好友中,每天走路步数在5001 10000步的人数;
请根据选取的样本数据完成下面的列联表并据此判断能否有以上的把握认定“认定类型”与“性别”有关?
卫健型
进步型
总计
男
20
女
20
总计
40
若按系统认定类型从选取的样本数据中在男性好友中按比例选取10人,再从中任意选取3人,记选到“卫健型”的人数为,女性好友中按比例选取5人,再从中任意选取2人,记选到“卫健型”的人数为,求事件“”的概率.
附:,
(2)根据题意选取的40个样本数据的列联表为:
卫健型
进步型
总计
男
14
6
20
女
8
12
20
总计
22
18
40
得:,
故没有95 以上的把握认为“认定类型”与“性别”有关.
(3)在男性好友中“卫健型”与“进步型”的比例为,则选取10人,恰好选取“卫健型”7人,“进步型”3人;在女性好友中“卫健型”与“进步型”的比例为,选取5人,恰好选取“卫健型”2人,“进步型”3人;
“”包含“,”,“,”,“,”,“,”,
,,
,,
故.
点睛:本题考查独立检验,考查离散型随机变量的分布列和数学期望的求法,考查推理论证能力、运算求解能力,考查化归转化思想、是中档题,解答概率题目关键是理解清楚题意,分清楚二项分布和超几何分布.
7.【2018年天津市南开中学高三模拟考试】现有4个人去参加某娱乐活动,该活动有甲、乙两个游戏可供参加者选择.为增加趣味性,约定:每个人通过掷一枚质地均的骰子决定自己去参加哪个游戏,掷出点数为1或2的人去参加甲游戏,掷出点数大于2的人去参加乙游戏.
(1)求这4个人中恰有2人去参加甲游戏的概率;
(2)用分别表示这4个人中去参加甲、乙游戏的人数,记,求随机变量的分布列与数学期望.
,,
所以的分布列是
所以随机变量的数学期望.
点睛:该题考查的是有关概率的问题,涉及到的知识点有古典概型及其概率计算公式,离散型随机变量的分布列及其期望,在解题的过程中,需要认真审题,正确使用公式计算结果.
8.【四川省成都市第七中学2018届高三下学期三诊模拟考试】中央政府为了应对因人口老龄化而造成的劳动力短缺等问题,拟定出台“延迟退休年龄政策”.为了了解人们]对“延迟退休年龄政策”的态度,责成人社部进行调研.人社部从 上年龄在15∽65岁的人群中随机调查100人,调査数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:
年龄
支持“延迟退休”的人数
15
5
15
28
17
(1)由以上统计数据填列联表,并判断能否在犯错误的概率不超过0.05的前提下认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异;
45岁以下
45岁以上
总计
支持
不支持
总计
(2)若以45岁为分界点,从不支持“延迟退休”的人中按分层抽样的方法抽取8人参加某项活动.现从这8人中随机抽2人
①抽到1人是45岁以下时,求抽到的另一人是45岁以上的概率.
②记抽到45岁以上的人数为,求随机变量的分布列及数学期望.
参考数据:
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
,其中
【解析】分析:(1)由统计数据填写列联表,计算观测值,对照临界值得出结论;
(2)①求抽到1人是45岁以下的概率,再求抽到1人是45岁以上的概率,
②根据题意知的可能取值,计算对应的概率值,写出随机变量的分布列,计算数学期望值.
详解:(1)由频率分布直方图知45岁以下与45岁以上各50人,故填充列联表如下:
45岁以下
45岁以上
总计
支持
35
45
80
不支持
15
5
20
总计
50
50
100
故随机变量的分布列为:
0
1
2
所以.
点睛:本题考查了离散型随机变量的分布列与数学期望的计算问题,也考查了古典概型的概率计算问题,是中档题.
9.【山东省实验中学2015级第二次模拟考试】随着经济的发展,人民的收入水平逐步提高,为了解北京市居民的收入水平,某报社随机调查了名居民的月收入,得到如下的频率分布直方图:
(1)求的值及这名居民的平均月收入(同一组中的数据用该组区间的中点值作代表)
(2)①通过大数据分析,北京人的月收入服从正态分布,其中,,求北京人收入落在的概率;
②将频率视为概率,若北京某公司一部门有人,记这人中月收入落在的人数为,求的数学期望. ]
附:若,则
②由频率分布直方图可知由频率分布直方图可知
所以,
所以.
点睛:频率分布直方图问题需要注意:
在频率分布直方图中,小矩形的高表示频率/组距,而不是频率;利用频率分布直方图求众数、中位数和平均数时,应注意三点:①最高的小长方形底边中点的横坐标即是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
10.【河北省石家庄二中2018届高三三模】某市为准备参加省中学生运动会,对本市甲、乙两个田径队的所有跳高运动员进行了测试,将全体运动员的成绩绘制成频率分布直方图.同时用茎叶图表示甲,乙两队运动员本次测试的成绩(单位:,且均为整数),由于某些原因,茎叶图中乙队的部分数据丢失,但已知所有运动员中成绩在以上(包括)的只有两个人,且均在甲队.规定:跳高成绩在以上(包括)定义为“优秀”.
(1)求甲,乙两队运动员的总人数及乙队中成绩在(单位:)内的运动人数;
(2)在甲,乙两队所有成绩在以上的运动员中随机选取人,已知至少有人成绩为“优秀”,求两人成绩均“优秀”的概率;
(3)在甲,乙两队中所有的成绩为“优秀”的运动员中随机选取人参加省中学生运动会正式比赛,求所选取运动员中来自甲队的人数的分布列及期望.
【解析】分析:由频率分布直方图可知,成绩在以上的运动员频数为2,频率为,由此求出全体运动员总人数,由成绩在内频率求出运动员人数,再减去甲队人数,即可求出乙队人数;
(2)分别求出“至少有人成绩为优秀”和“两人成绩均优秀”的概率;再根据条件概率
∴,,,
∴的分布列为:
0
1
2
∴.
点睛:随机变量分布列及数学期望问题要善于灵活运用三个性质:一是pi≥0(i=1,2,…);二是,三是p1+p2+…+pn=1检验分布列的正误
【母题原题1】【2018新课标1,理20】某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为,且各件产品是否为不合格品相互独立.
(1)记20件产品中恰有2件不合格品的概率为,求的最大值点.
(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的作为的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.
(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为,求;
(ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
.
所以.
(ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为400元.
由于,故应该对余下的产品作检验.
点睛:该题考查的是有关随机变量的问题,在解题的过程中,一是需要明确独立重复试验成功次数对应的概率公式,再者就是对其用函数的思想来研究,应用导数求得其最小值点,在做第二问的时候,需要明确离散型随机变量的可取值以及对应的概率,应用期望公式求得结果,再有就是通过期望的大小关系得到结论.
【母题原题2】【2017新课标1,理19】为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)试说明上述监控生产过程方法的合理性;
(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得xi=9.97,s=≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(-3+3)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量 服从正态分布N(μ,σ2),则P(μ-3σ< <μ+3σ)=0.997 4.
0.997 416≈0.959 2,≈0.09.
因此σ的估计值为≈0.09.
【母题原题3】【2016新课标1,理19】某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数.
(Ⅰ)求X的分布列;
(Ⅱ)若要求P(X≤n)≥0.5,确定n的最小值;
(Ⅲ)以购买易损零件所需费用的期望值为决策依据,在n=19与n=20之中选其一,应选用哪个?
【解析】(Ⅰ)由柱状图 并以频率代替概率 可得,一台机器在三年内需更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2.
从而P(X=16)=0.2×0.2=0.04;
X
16
17
18
19
20
21
22
P
0.04
0.16
0.24
0.24
0.2
0.08
0.04
(Ⅱ)由(Ⅰ)知P(X≤18)=0.44,P(X≤19)=0.68,故n的最小值为19.
(Ⅲ)记Y表示2台机器在购买易损零件上所需的费用(单位:元).
当n=19时 ,
EY=19×200×0.68+(19×200+500)×0.2+(19×200+2×500)×0.08+(19×200+3×500)×0.04=4 040.
当n=20时 ,
EY=20×200×0.88+(20×200+500)×0.08+(20×200+2×500)×0.04=4 080.
可知当n=19时所需费用的期望值小于n=20时所需费用的期望值,故应选n=19.
【热点剖析】从近几年的高考试题来看,频率分布直方图、茎叶图、平均数、方差、分布列是高考的热点,题型既有选择题、填空题,又有解答题,客观题考查知识点较单一,解答题考查得较为全面,常常和概率、平均数等知识结合在一起,考查学生应用知识解决问题的能力.独立性检验、回归分析高考对此部分内容考查有加强趋势,主要是以考查独立性检验、回归分析为主,并借助解决一些简单的实际问题来考查一些基本的统计思想,在高考中多为选择、填空题,也有解答题出现.频率分布直方图、茎叶图、平均数、方差,离散型随机变量的分布列与期望仍然是考查的热点,同时应注意和概率、平均数、分布列,期望,二项分布,正态分布等知识的结合,同时应注意独立性检验在实际生活中的应用,有可能涉及一道与独立检验有关的大题.
【经验分享】
1.进行分层抽样时应注意以下几点:
(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠;
(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性应相同;
(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.
2.在作茎叶图时,容易出现茎两边的数字不是从小到大的顺序排列,从而导致结论分析错误,在使用茎叶图整理数据时,要注意:一是数据不能遗漏,二是数据最好按从小到大顺序排列,对三组以上的数据,也可使用茎叶图,但没有表示两组记录那么直观、清晰.
3.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.
4.根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.
5.r的大小只说明是否相关并不能说明拟合效果的好坏,R2才是判断拟合效果好坏的依据.
6.独立性检验的随机变量K2=2.706是判断是否有关系的临界值,K2<2.076应判断为没有充分证据显示X与Y有关系,而不能作为小于90 的量化值来判断.
7. 概率计算题的核心环节就是把一个随机事件进行类似本题的分拆,这中间有三个概念,事件的互斥,事件的对立和事件的相互独立,在概率的计算中只要弄清楚了这三个概念,根据实际情况对事件进行合理的分拆,就能把复杂事件的概率计算转化为一个个简单事件的概率计算,达到解决问题的目的.
8.在解含有相互独立事件的概率题时,首先把所求的随机事件分拆成若干个互斥事件的和,其次将分拆后的每个事件分拆为若干个相互独立事件的乘积,这两个事情做好了,问题的思路就清晰了,接下来就是按照相关的概率值进行计算的问题了,如果某些相互独立事件符合独立重复试验概型,就把这部分归结为用独立重复试验概型,用独立重复试验概型的概率计算公式解答.
9.相当一类概率应用题都是比如掷硬币、掷骰子、摸球等概率模型赋予实际背景后得出来的,我们在解题时就要把实际问题再还原为我们常见的一些概率模型,这就要根据问题的具体情况去分析,对照常见的概率模型,把不影响问题本质的因素去除,抓住问题的本质.
10.求解一般的随机变量的期望和方差的基本方法是:先根据随机变量的意义,确定随机变量可以取哪些值,然后根据随机变量取这些值的意义求出取这些值的概率,列出分布列,根据数学期望和方差的公式计算.
【知识整合】
一,统计初步
1.简单随机抽样
简单随机抽样是不放回抽样,被抽取样本的个体数有限,从总体中逐个地进行抽取,使抽样便于在实践中操作.每次抽样时,每个个体等可能地被抽到,保证了抽样的公平性.实施方法主要有抽签法和随机数法.
2.系统抽样
(1)定义:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样,也称作等距抽样.
(2)系统抽样的步骤:
①编号.采用随机的方式将总体中的个体编号.
②分段.先确定分段的间隔k.当(N为总体中的个体数,n为样本容量)是整数时,k=;当不是整数时,通过从总体中随机剔除一些个体使剩下的总体中个体总数N′能被n整除,这时k=.③确定起始个体编号.在第1段用简单随机抽样确定起始的个体编号S.
④按照事先确定的规则抽取样本.通常是将S加上间隔k,得到第2个个体编号S+k,再将(S+k)加上k,得到第3个个体编号S+2k,这样继续下去,获得容量为n的样本.其样本编号依次是:S,S+k,S+2k,…,S+(n-1)k.
3.分层抽样
(1)定义:当总体由有明显差别的几部分组成时,按某种特征在抽样时将总体中的各个个体分成互不交叉的层,然后按照各层在总体中所占的比例,从各层独立地抽取一定数量的个体合在一起作为样本,这种抽样的方法叫做分层抽样.
分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体中所占比例抽取.分层抽样要求对总体的内容有一定的了解,明确分层的界限和数目,分层要恰当.
(2)分层抽样的步骤
①分层;②按比例确定每层抽取个体的个数;③各层抽样(方法可以不同);④汇合成样本.
(3)分层抽样的优点
分层抽样充分利用了己知信息,充分考虑了保持样本结构与总体结构的一致性.使样本具有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着非常广泛的应用.
4.绘制频率分布直方图
把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.在频率分布直方图中,纵轴表示“频率/组距”,数据落在各小组内的频率用小矩形的面积表示,各小矩形的面积总和等于1.
5.茎叶图
统计中还有一种被用来表示数据的图叫做茎叶图.茎是指中间的一列数,叶是从茎的旁边生长出来的数.在样本数据较少、较为集中,且位数不多时,用茎叶图表示数据的效果较好,它较好的保留了原始数据信息,方便记录与表示,但当样本数据较多时,茎叶图就不太方便.
6.平均数、中位数和众数
(1)平均数:一组数据的总和除以数据的个数所得的商就是平均数.
(2)中位数:如果将一组数据按从小到大的顺序依次排列,当数据有奇数个时,处在最中间的一个数是这组数据的中位数;当数据有偶数个时,处在最中间两个数的平均数,是这组数据的中位数.
(3)众数:出现次数最多的数(若有两个或几个数据出现得最多,且出现的次数一样,这些数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数).
(4)在频率分布直方图中,最高小长方形的中点所对应的数据值即为这组数据的众数.而在频率分布直方图上的中位数左右两侧的直方图面积应该相等,因而可以估计其近似值.平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
7.方差、标准差
(1)设样本数据为x1,x2,…,xn样本平均数为,则s2=[(x1-)2+(x2-)2+…+(xn-)2]=[(x12+x22+…+xn2)-n2]叫做这组数据的方差,用来衡量这组数据的波动大小,一组数据方差越大,说明这组数据波动越大.把样本方差的算术平方根叫做这组数据的样本标准差.
(2)数据的离散程度可以通过极差、方差或标准差来描述,其中极差反映了一组数据变化的最大幅度.方差则反映一组数据围绕平均数波动的大小.
8.两个变量的线性相关
(1)散点图
将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,表示具有相关关系的两个变量的一组数据的图形叫做散点图.利用散点图可以判断变量之间有无相关关系.
(2)正相关、负相关
如果散点图中各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.
反之,如果两个变量的散点图中点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.
9.回归分析
对具有相关关系的两个变量进行统计分析的方法叫回归分析.其基本步骤是:①画散点图,②求回归直线方程,③用回归直线方程作预报.
(1)回归直线:观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
(2)回归直线方程的求法——最小二乘法.
设具有线性相关关系的两个变量x、y的一组观察值为(xi,yi)(i=1,2,…,n),则回归直线方程=+x的系数为:
其中=i,=i,(,)称作样本点的中心.
,表示由观察值用最小二乘法求得的a,b的估计值,叫回归系数.
10.独立性检验
(1)若变量的不同“值”表示个体所属的不同类别,则这些变量称为分类变量.
(2)两个分类变量X与Y的频数表,称作2×2列联表.
二.随机事件的概率
1.随机事件和确定事件:在一定的条件下所出现的某种结果叫做事件.
(1)在条件下,一定会发生的事件叫做相对于条件的必然事件.
(2)在条件下,一定不会发生的事件叫做相对于条件的不可能事件.
(3)必然事件与不可能事件统称为确定事件.
(4)在条件下可能发生也可能不发生的事件,叫做随机事件.
(5)确定事件和随机事件统称为事件,一般用大写字母表示.
2.频率与概率
(1)在相同的条件下重复次试验,观察某一事件是否出现,称次试验中事件出现的次数为事件出现的频数,称事件出现的比例为事件出现的频率.
(2)对于给定的随机事件,如果随着试验次数的增加,事件发生的频率稳定在某个常数上,把这个常数记作,称为事件的概率,简称为的概率.
3.互斥事件与对立事件
互斥事件的定义:在一次试验中,不可能同时发生的两个事件叫做互斥事件.即为不可能事件(),则称事件与事件互斥,其含义是:事件与事件在任何一次试验中不会同时发生.
一般地,如果事件中的任何两个都是互斥的,那么就说事件彼此互斥.
对立事件:若不能同时发生,但必有一个发生的两个事件叫做互斥事件;即为不可能事件,而为必然事件,那么事件与事件互为对立事件,其含义是:事件与事件在任何一次试验中有且仅有一个发生.
互斥事件和对立事件的区别和联系:对立事件是互斥事件,但是互斥事件不一定是对立事件.两个事件互斥是两个事件对立的必要非充分条件.
4.事件的关系与运算
定义
符号表示
包含关系
如果事件发生,则事件一定发生,这时称事件包含事件 (或称事件包含于事件)
(或)
相等关系]
若且,那么称事件与事件相等
并事件
(和事件)
若某事件发生当且仅当事件发生或事件发生,则称此事件为事件与事件的并事件(或和事件)
(或)
交事件
(积事件)
若某事件发生当且仅当事件发生且事件发生,则称此事件为事件与事件的交事件(或积事件)
(或)
互斥事件
若为不可能事件,那么称事件与事件互斥
对立事件
若为不可能事件,为必然事件,那么称事件与事件互为对立事件
且
5.随机事件的概率
事件的概率:在大量重复进行同一试验时,事件发生的频率总接近于某个常数,在它附近摆动,这时就把这个常数叫做事件的概率,记作.
由定义可知,显然必然事件的概率是,不可能事件的概率是.
5.概率的几个基本性质
(1)概率的取值范围:.
(2)必然事件的概率:.
(3)不可能事件的概率:.
(4)互斥事件的概率加法公式:
①(互斥),且有.
② (彼此互斥).
(5)对立事件的概率:.
三.古典概型
1. 一次试验连同其中可能出现的每一个结果称为一个基本事件,通常此试验中的某一事件A由几个基本事件组成.如果一次试验中可能出现的结果有n个,即此试验由n个基本事件组成,而且所有结果出现的可能性都相等,那么每一基本事件的概率都是.如果某个事件A包含的结果有m个,那么事件A的概率P(A)=.
基本事件的特点
(1)任何两个基本事件是互斥的.
(2)任何事件都可以表示成基本事件的和(除不可能事件).
2.古典概型:具有以下两个特点的概率模型称为古典概率模型,简称古典概型.
①试验中所有可能出现的基本事件只有有限个,即有限性.
②每个基本事件发生的可能性相等,即等可能性.
概率公式:P(A)=.
四.几何概型
1.(1)随机数的概念:
随机数是在一定范围内随机产生的数,并且得到这个范围内任何一个数的机会是均等的. ]
(2)随机数的产生方法
①利用函数计算器可以得到0 1之间的随机数;
②在Scilab语言中,应用不同的函数可产生0 1或a b之间的随机数.
2.几何概型
(1)定义:如果某个事件发生的概率只与构成该事件区域的长度(面积或体积等)成比例,则称这样的概率模型为为几何概率模型,简称几何概型.
(2)特点:①无限性:在一次试验中,可能出现的结果有无限多个;
②等可能性:每个结果的发生具有等可能性.
(3)几何概型的解题步骤:
首先是判断事件是一维问题还是二维、三维问题(事件的结果与一个变量有关就是一维的问题,与两个变量有关就是二维的问题,与三个变量有关就是三维的问题);接着,如果是一维的问题,先确定试验的全部结果和事件构成的区域长度(角度、弧长等),最后代公式
;如果是二维、三维的问题,先设出二维或三维变量,再列出试验的全部结果和事件分别满足的约束条件,作出两个区域,最后计算两个区域的面积或体积代公式.
(4)求几何概型时,注意首先寻找到一些重要的临界位置,再解答.一般与线性规划知识有联系.
3.几种常见的几何概型
(1)设线段l是线段L的一部分,向线段L上任投一点.若落在线段l上的点数与线段L的长度成正比,而与线段l在线段l上的相对位置无关,则点落在线段l上的概率为:
P=l的长度/L的长度
(2)设平面区域g是平面区域G的一部分,向区域G上任投一点,若落在区域g上的点数与区域g的面积成正比,而与区域g在区域G上的相对位置无关,则点落在区域g上概率为:
P=g的面积/G的面积
(3)设空间区域上v是空间区域V的一部分,向区域V上任投一点.若落在区域v上的点数与区域v的体积成正比,而与区域v在区域v上的相对位置无关,则点落在区域V上的概率为:
P=v的体积/V的体积
五.条件概率
1.条件概率及其性质
(1)对于任何两个事件和,在已知事件发生的条件下,事件发生的概率叫做条件概率,用符号来表示,其公式为.
在古典概型中,若用表示事件中基本事件的个数,则.
(2)条件概率具有的性质:
①;
② 如果和是两互斥事件,则.
2.相互独立事件
(1)对于事件、,若的发生与的发生互不影响,则称、是相互独立事件.
(2)若与相互独立,则,
.
(3)若与相互独立,则与,与,与也都相互独立.
(4)若,则与相互独立.
3.独立重复试验
独立重复试验是指在相同条件下可重复进行的,各次之间相互独立的一种试验,在这种试验中每一次试验只有两种结果,即要么发生,要么不发生,且任何一次试验中发生的概率都是一样的.
六.离散型随机变量的分布列
离散型随机变量的分布列
(1)随机变量
如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量,随机变量常用字母X,Y,ξ,η等表示.
(2)离散型随机变量
对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.
若是随机变量,,其中是常数,则也是随机变量.
2.常见离散型随机变量的分布列
(1)两点分布:
若随机变量服从两点分布,即其分布列为
0
1
其中,则称离散型随机变量服从参数为的两点分布.其中称为成功概率.
(2)超几何分布:
在含有件次品的件产品中,任取件,其中恰有件次品,则事件{}发生的概率为,,其中,且,称分布列为超几何分布列.
0
1
…
m
…
(3)设离散型随机变量可能取得值为,,…,,…,取每一个值 ()的概率为,则称表
…
…
…
…
为随机变量X的概率分布列,简称X的分布列.有时为了表达简单,也用等式,表示的分布列.
分布列的两个性质
①,;②.
七.二项分布:
1.离散型随机变量的二项分布:在一次随机试验中,某事件可能发生也可能不发生,在次独立重复试验中这个事件发生的次数是一个随机变量.如果在一次试验中某事件发生的概率是,那么在次独立重复试验中这个事件恰好发生次的概率是,(…, )于是得到随机变量的概率分布如下:
…
…
…
…
由于恰好是二项展开式
中的各项的值,所以称这样的随机变量服从二项分布,记作,其中,为参数,并记=.…
2.二项分布的期望与方差:若,则 ,
八.正态分布
1.总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线.
它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于总体密度曲线,直线及轴所围图形的面积.
2.正态分布密度函数:
,(,)
其中π是圆周率;是自然对数的底;是随机变量的取值;为正态分布的均值;是正态分布的标准差.正态分布一般记为
正态分布的定义及表示
函数,其中实数和(>0)为参数.我们称的图像为正态分布密度曲线,简称正态曲线.
如果对于任何实数,随机变量满足则称随机变量服从正态分布,正态分布完全由参数确定,因此正态分布常记作,如果随机变量服从正态分布,则记为 .正态分布)是由均值和标准差唯一决定的分布
3.正态曲线有以下性质:
(1)曲线位于轴上方,与轴不相交;
(2)曲线是单峰的,它关于直线对称;
(3)曲线在处达到峰值;
(4)曲线与轴围成的图形的面积为1;
(5)当一定时,曲线随着的变化而沿轴平移;
(6)当一定时,曲线的形状由确定,越小,曲线越“瘦高”,表示总体的分布越集中;越大,曲线越“矮胖”,表示总体的分布越分散.
4.正态总体在三个特殊区间内取值的概率值
①P(μ-σ
6.一般正态分布与标准正态分布的转化
由于一般的正态总体其图像不一定关于y轴对称,对于任一正态总体,其取值小于x的概率.只要会用它求正态总体在某个特定区间的概率即可.
7.“小概率事件”和假设检验的基本思想
“小概率事件”通常指发生的概率小于5 的事件,认为在一次试验中该事件是几乎不可能发生的.这种认识便是进行推断的出发点.关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5 的犯错误的可能.
课本是借助于服从正态分布的有关零件尺寸的例子来介绍假设检验的基本思想.进行假设检验一般分三步:
第一步,提出统计假设.课本例子里的统计假设是这个工人制造的零件尺寸服从正态分布;
第二步,确定一次试验中的取值a是否落入范围(μ-3σ,μ+3σ);
第三步,作出推断.如果a∈(μ-3σ,μ+3σ),接受统计假设;如果,由于这是小概率事件,就拒绝统计假设.
1.【山东、湖北部分重点中学2018年高考冲刺模拟试卷(二)】我校为了更好地管理学生用手机问题,根据学生每月用手机时间(每月用手机时间总和)的长短将学生分为三类: 第一类的时间区间在,第二类的时间区间在,第三类的时间区间在(单位:小时),并规定属于第三类的学生要进入“思想政治学习班”进行思想和心理的辅导.现对我校二年级1014名学生进行调查,恰有14人属于第三类,这14名学生被学校带去政治学习.由剩下的1000名学生用手机时间情况,得到如图所示频率分布直方图.
(I) 求这1000名学生每月用手机时间的平均数;
(II)利用分层抽样的方法从1000名选出10位学生代表,若从该10名学生代表中任选两名学生,求这两名学生用手机时间属于不同类型的概率;
(III)若二年级学生长期保持着这一用手机的现状,学校为了鼓励学生少用手机,连续10个月,每个月从这1000名学生中随机抽取1名,若取到的是第一类学生,则发放奖品一份,设为获奖学生人数,求的数学期望与方差.
2.【福建省三明市第一中学2018届高三模拟卷(一)】某市政府为了节约生活用电,计划在本市试行居民生活费定额管理,即确定一户居民月用电量标准,用电量不超过的部分按平价收费,超出的部分按议价收费.为此,政府调查了100户居民的月平均用电量(单位:度),以,,,,,,分组的频率分布直方图如图所示.
(1)根据频率分布直方图的数据,求直方图中的值并估计该市每户居民平均用电量的值;
(2)用频率估计概率,利用(1)的结果,假设该市每户居民月平均用电量服从正态分布
(i)估计该市居民月平均用电量介于度之间的概率;
(ii)利用(i)的结论,从该市所有居民中随机抽取3户,记月平均用电量介于度之间的户数为,求的分布列及数学期望.
所以的分布列为
0
1
2
3
所以
点睛:“求期望”,一般利用离散型随机变量的数学期望的定义求期望.对于某些实际问题中的随机变量,如果能够断定它服从某常见的典型分布(如二项分布),则此随机变量的期望可直接利用这种典型分布的期望公式()求得.因此,应熟记常见的典型分布的期望公式,可加快解题速度.
3.【山东省肥城市2018届高三适应性训练数学】某地区某长产品近几年的产量统计如表:
年份
2012
2013
2014
2015
2016
2017
年份代码
1
2
3
4
5
6
年产量(万吨)
6.6
6.7
7
7.1
7.2
7.4
(1)根据表中数据,建立关于的线性回归方程;
(2)若近几年该农产品每千克的价格(单位:元)与年产量满足的函数关系式为,且每年该农产品都能售完.
①根据(1)中所建立的回归方程预测该地区2018()年该农产品的产量;
②当()为何值时,销售额最大?
附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为:,.
为7.56万吨.
点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,写出回归方程,回归直线方程恒过点.
4.【山东省潍坊市青州市2018届高三第三次高考模拟考试】某房产中介公司2017年9月1日正式开业,现对其每个月的二手房成交量进行统计,表示开业第个月的二手房成交量,得到统计表格如下:
(1)统计中常用相关系数来衡量两个变量之间线性关系的强弱.统计学认为,对于变量,如果,那么相关性很强;如果,那么相关性一般;如果,那么相关性较弱.通过散点图初步分析可用线性回归模型拟合与的关系.计算的相关系数,并回答是否可以认为两个变量具有很强的线性相关关系(计算结果精确到0.01)
(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程(计算结果精确到0.01),并预测该房产中介公司2018年6月份的二手房成交量(计算结果四舍五入取整数).
(3)该房产中介为增加业绩,决定针对二手房成交客户开展抽奖活动.若抽中“一等奖”获6千元奖金;抽中“二等奖”获3千元奖金;抽中“祝您平安”,则没有奖金.已知一次抽奖活动中获得“一等奖”的概率为,获得“二等奖”的概率为,现有甲、乙两个客户参与抽奖活动,假设他们是否中奖相互独立,求此二人所获奖金总额(千元)的分布列及数学期望.
参考数据:,,,,.
参考公式:
【解析】分析:(1)根据相关系式公式,即可求解相关系数,并作出判断;
(2)计算回归系数得出回归方程,再根据回归方程估计成交量,即可作答;
(3)根据相互独立事件的概率计算随机变量的各种可能取值对应的概率,从而得出分布列,求解数学期望.
,.
所以,奖金总额的分布列如下表:
0
3
6
9
12
千元.
点睛:本题主要考查统计知识的应用以及回归直线方程的应用和随机变量的分布列和数学期望,解答本题,首先要准确确定所研究对象的基本事件空间、基本事件个数,再利用二项何分布的概率公式,求得概率,得到分布列和求得数学期望,本题属中等难度的题目,计算量不是很大,能很好的考查考生数学应用意识、基本运算求解能力等.
5.【重庆市西南大学附中高2018级第四次月考】某测试团队为了研究“饮酒”对“驾车安全”的影响,随机选取名驾驶员先后在无酒状态、酒后状态下进行“停车距离”测试.测试的方案:电脑模拟驾驶,以某速度匀速行驶,记录下驾驶员的“停车距离”(驾驶员从看到意外情况到车子完全停下所需要的距离).无酒状态与酒后状态下的试验数据分别列于表1和表2.
表1
停车距离(米)
频数
24
42
24
9
1
表2
平均每毫升血液酒精含量毫克
10
30
50
70
90
平均停车距离米
30
50
60
70
90
回答以下问题.
(1)由表1估计驾驶员无酒状态下停车距离的平均数;
(2)根据最小二乘法,由表2的数据计算关于的回归方程;
(3)该测试团队认为:驾驶员酒后驾车的平均“停车距离”大于(1)中无酒状态下的停车距离平均数的倍,则认定驾驶员是“醉驾”.请根据(2)中的回归方程,预测当每毫升血液酒精含量大于多少毫克时为“醉驾”?(精确到个位)
(附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为,)
∴预测当每毫升血液酒精含量大于毫克时为“醉驾”
点睛:本题考查线性回归直线方程,解题时根据所给公式计算即可,属于基础题.
6.【四川省双流中学2018届高三考前第二次模拟考试】为推动实施健康中国战略,树立国家大卫生、大健康概念,手机APP也推出了多款健康运动软件,如“微信运动”,杨老师的微信朋友圈内有600位好友参与了“微信运动”,他随机选取了40位微信好友(女20人,男20人),统计其在某一天的走路步数,其中,女性好友的走路步数数据记录如下:
5860
8520
7326
6798
7325
8430
3216
7453
11754
9860
8753
6450
7290
4850
10223
9763
7988
9176
6421
5980
男性好友走路的步数情况可分为五个类别:(说明:“”表示大于等于0,小于等于2000,下同),,,,,且,,三种类别人数比例为,将统计结果绘制如图所示的条形图,若某人一天的走路步数超过8000步被系统认定为“卫健型”,否则被系统认定为“进步型”.
若以杨老师选取的好友当天行走步数的频率分布来估计所有微信好友每日走路步数的概率分布,请估计杨老师的微信好友圈里参与“微信运动”的600名好友中,每天走路步数在5001 10000步的人数;
请根据选取的样本数据完成下面的列联表并据此判断能否有以上的把握认定“认定类型”与“性别”有关?
卫健型
进步型
总计
男
20
女
20
总计
40
若按系统认定类型从选取的样本数据中在男性好友中按比例选取10人,再从中任意选取3人,记选到“卫健型”的人数为,女性好友中按比例选取5人,再从中任意选取2人,记选到“卫健型”的人数为,求事件“”的概率.
附:,
(2)根据题意选取的40个样本数据的列联表为:
卫健型
进步型
总计
男
14
6
20
女
8
12
20
总计
22
18
40
得:,
故没有95 以上的把握认为“认定类型”与“性别”有关.
(3)在男性好友中“卫健型”与“进步型”的比例为,则选取10人,恰好选取“卫健型”7人,“进步型”3人;在女性好友中“卫健型”与“进步型”的比例为,选取5人,恰好选取“卫健型”2人,“进步型”3人;
“”包含“,”,“,”,“,”,“,”,
,,
,,
故.
点睛:本题考查独立检验,考查离散型随机变量的分布列和数学期望的求法,考查推理论证能力、运算求解能力,考查化归转化思想、是中档题,解答概率题目关键是理解清楚题意,分清楚二项分布和超几何分布.
7.【2018年天津市南开中学高三模拟考试】现有4个人去参加某娱乐活动,该活动有甲、乙两个游戏可供参加者选择.为增加趣味性,约定:每个人通过掷一枚质地均的骰子决定自己去参加哪个游戏,掷出点数为1或2的人去参加甲游戏,掷出点数大于2的人去参加乙游戏.
(1)求这4个人中恰有2人去参加甲游戏的概率;
(2)用分别表示这4个人中去参加甲、乙游戏的人数,记,求随机变量的分布列与数学期望.
,,
所以的分布列是
所以随机变量的数学期望.
点睛:该题考查的是有关概率的问题,涉及到的知识点有古典概型及其概率计算公式,离散型随机变量的分布列及其期望,在解题的过程中,需要认真审题,正确使用公式计算结果.
8.【四川省成都市第七中学2018届高三下学期三诊模拟考试】中央政府为了应对因人口老龄化而造成的劳动力短缺等问题,拟定出台“延迟退休年龄政策”.为了了解人们]对“延迟退休年龄政策”的态度,责成人社部进行调研.人社部从 上年龄在15∽65岁的人群中随机调查100人,调査数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:
年龄
支持“延迟退休”的人数
15
5
15
28
17
(1)由以上统计数据填列联表,并判断能否在犯错误的概率不超过0.05的前提下认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异;
45岁以下
45岁以上
总计
支持
不支持
总计
(2)若以45岁为分界点,从不支持“延迟退休”的人中按分层抽样的方法抽取8人参加某项活动.现从这8人中随机抽2人
①抽到1人是45岁以下时,求抽到的另一人是45岁以上的概率.
②记抽到45岁以上的人数为,求随机变量的分布列及数学期望.
参考数据:
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
,其中
【解析】分析:(1)由统计数据填写列联表,计算观测值,对照临界值得出结论;
(2)①求抽到1人是45岁以下的概率,再求抽到1人是45岁以上的概率,
②根据题意知的可能取值,计算对应的概率值,写出随机变量的分布列,计算数学期望值.
详解:(1)由频率分布直方图知45岁以下与45岁以上各50人,故填充列联表如下:
45岁以下
45岁以上
总计
支持
35
45
80
不支持
15
5
20
总计
50
50
100
故随机变量的分布列为:
0
1
2
所以.
点睛:本题考查了离散型随机变量的分布列与数学期望的计算问题,也考查了古典概型的概率计算问题,是中档题.
9.【山东省实验中学2015级第二次模拟考试】随着经济的发展,人民的收入水平逐步提高,为了解北京市居民的收入水平,某报社随机调查了名居民的月收入,得到如下的频率分布直方图:
(1)求的值及这名居民的平均月收入(同一组中的数据用该组区间的中点值作代表)
(2)①通过大数据分析,北京人的月收入服从正态分布,其中,,求北京人收入落在的概率;
②将频率视为概率,若北京某公司一部门有人,记这人中月收入落在的人数为,求的数学期望. ]
附:若,则
②由频率分布直方图可知由频率分布直方图可知
所以,
所以.
点睛:频率分布直方图问题需要注意:
在频率分布直方图中,小矩形的高表示频率/组距,而不是频率;利用频率分布直方图求众数、中位数和平均数时,应注意三点:①最高的小长方形底边中点的横坐标即是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
10.【河北省石家庄二中2018届高三三模】某市为准备参加省中学生运动会,对本市甲、乙两个田径队的所有跳高运动员进行了测试,将全体运动员的成绩绘制成频率分布直方图.同时用茎叶图表示甲,乙两队运动员本次测试的成绩(单位:,且均为整数),由于某些原因,茎叶图中乙队的部分数据丢失,但已知所有运动员中成绩在以上(包括)的只有两个人,且均在甲队.规定:跳高成绩在以上(包括)定义为“优秀”.
(1)求甲,乙两队运动员的总人数及乙队中成绩在(单位:)内的运动人数;
(2)在甲,乙两队所有成绩在以上的运动员中随机选取人,已知至少有人成绩为“优秀”,求两人成绩均“优秀”的概率;
(3)在甲,乙两队中所有的成绩为“优秀”的运动员中随机选取人参加省中学生运动会正式比赛,求所选取运动员中来自甲队的人数的分布列及期望.
【解析】分析:由频率分布直方图可知,成绩在以上的运动员频数为2,频率为,由此求出全体运动员总人数,由成绩在内频率求出运动员人数,再减去甲队人数,即可求出乙队人数;
(2)分别求出“至少有人成绩为优秀”和“两人成绩均优秀”的概率;再根据条件概率
∴,,,
∴的分布列为:
0
1
2
∴.
点睛:随机变量分布列及数学期望问题要善于灵活运用三个性质:一是pi≥0(i=1,2,…);二是,三是p1+p2+…+pn=1检验分布列的正误
相关资料
更多