(山东专用)2021版高考数学一轮复习第九章计数原理、概率、随机变量及其分布第九讲离散型随机变量的均值与方差、正态分布学案(含解析)
展开ZHI SHI SHU LI SHUANG JI ZI CE
知识梳理·双基自测
知识梳理
知识点一 离散型随机变量的均值与方差
若离散型随机变量X的分布列为P(X=xi)=pi,i=1,2,…,n.
(1)均值:称E(X)=__x1p1+x2p2+…+xipi+…+xnpn__为随机变量X的均值或数学期望.
(2)方差:称D(X)= (xi-E(X))2pi为随机变量X的方差,其算术平方根为随机变量X的__标准差__.
知识点二 均值与方差的性质
(1)E(aX+b)=__aE(X)+b__.
(2)D(aX+b)=__a2D(X)__.
*(3)D(X)=E(X2)-(E(X))2.
知识点三 两点分布与二项分布的期望与方差
(1)若X服从两点分布,则E(X)=__p__,D(X)=__p(1-p)__.
(2)若X~B(n,p),则E(X)=__np__,D(X)=__np(1-p)__.
知识点四 正态分布
(1)正态曲线:函数f(x)=e-,x∈(-∞,+∞),其中实数μ和σ(σ>0)为参数.我们称函数f(x)的图象为正态分布密度曲线,简称正态曲线,期望为μ、标准差为σ的正态分布通常记作__X~N(μ,σ2)__.
(2)正态曲线的性质:①曲线位于x轴__上方__,与x轴不相交;②曲线是单峰的,它关于直线__x=μ__对称;③曲线在__x=μ__处达到峰值;④曲线与x轴之间的面积为__1__;⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿着x轴平移;⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越__集中__;σ越大,曲线越“矮胖”,表示总体的分布越__分散__.
(3)正态总体在三个特殊区间内取值的概率值:
①P(μ-σ<X≤μ+σ)=__0.682_6__;
②P(μ-2σ<X≤μ+2σ)=__0.954_4__;
③P(μ-3σ<X≤μ+3σ)=__0.997_4__.
重要结论
计算均值与方差的基本方法
(1)已知随机变量的概率分布求它的均值、方差和标准差,可直接用定义或公式求;
(2)已知随机变量X的均值、方差,求X的线性函数Y=aX+b的均值、方差和标准差,可直接用均值及方差的性质求;
(3)如能分析所给随机变量服从常用的分布(如两点分布、二项分布等),则可直接利用它们的均值、方差公式来求.
双基自测
题组一 走出误区
1.(多选题)下列结论中正确的是( ABC )
A.随机变量的均值是常数,样本的平均数是随机变量,它不确定
B.随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离变量的平均程度越小
C.正态分布中的参数μ和σ完全确定了正态分布,参数μ是正态分布的均值,σ是正态分布的标准差
D.若X~N(0,1),则P(x<-) 题组二 走进教材
2.(P68A组T1)已知X的分布列为
X
-1
0
1
P
m
设Y=2X+3,则E(Y)的值为( A )
A. B.4
C.-1 D.1
[解析] E(X)=-+=-,
E(Y)=E(2X+3)=2E(X)+3=-+3=.
3.(P75B组T2改编)设随机变量ξ服从正态分布N(4,3),若P(ξa+1),则实数a等于( B )
A.7 B.6
C.5 D.4
[解析] 由题意知=4,∴a=6.
题组三 考题再现
4.(2019·南通模拟)已知随机变量X服从正态分布N(3,1),且P(X≥4)=0.158 7,则P(2
C.0.460 3 D.0.920 7
[解析] ∵随机变量X服从正态分布N(3,1),∴正态曲线的对称轴是直线x=3,∵P(X≥4)=0.158 7,∴P(2
[解析] 由题意得X~B(100,0.02),
∴D(X)=100×0.02×0.98=1.96.
KAO DIAN TU PO HU DONG TAN JIU
考点突破·互动探究
考点一 离散型随机变量的均值与方差的概念与性质——自主练透
例1 (1)(2018·课标Ⅲ,8)某群体中的每位成员使用移动支付的概率都为p,各成员的支付方式相互独立.设X为该群体的10位成员中使用移动支付的人数,D(X)=2.4,P(X=4) A.0.7 B.0.6
C.0.4 D.0.3
(2)(2020·甘肃兰州一中月考)从装有除颜色外完全相同的3个白球和m个黑球的布袋中随机摸取一球,有放回的摸取5次,设摸得白球数为X,已知E(X)=3,则D(X)=( B )
A. B.
C. D.
(3)(2019·浙江卷,7)设0 X
0
a
1
P
则当a在(0,1)内增大时,( D )
A.D(X)增大 B.D(X)减小
C.D(X)先增大后减小 D.D(X)先减小后增大
[解析] (1)由题知X~B(10,p),则D(X)=10×p×(1-p)=2.4,解得p=0.4或0.6.又∵P(X=4)
0.5,
∴p=0.6,故选B.
(2)由题意知,X~B(5,),
∴E(X)=5×=3,解得m=2,
∴X~B(5,),
∴D(X)=5××(1-)=.故选B.
(3)随机变量X的期望E(X)=0×+a×+1×=,
D(X)=[(0-)2+(a-)2+(1-)2]×
=(a2-a+1)
=(a-)2+,
当a∈(0,)时,D(X)单调递减,当x∈(,1)时,D(X)单调递增,故选D.
名师点拨 ☞
若X是随机变量,则Y=f(X)一般仍是随机变量,在求Y的期望和方差时,熟练应用期望和方差的性质,可以避免再求Y的分布列带来的烦琐运算.
〔变式训练1〕
(2019·辽宁省丹东质量测试)某种种子每粒发芽的概率都为0.85,现播种了1 000粒,对于没有发芽的种子,每粒需再补种2粒,补种的种子数记为X,则X的数学期望E(X)=__300__.
[解析] 设没有发芽的种子数为Y,则有X=2Y,
由题意可知Y服从二项分布,即
Y~B(1 000,0.15),E(Y)=1 000×0.15=150,
E(X)=2E(Y)=300.
考点二 求离散型随机变量的均值与方差——多维探究
角度1 二项分布的均值、方差问题
例2 (2019·沈阳模拟)某新建公司规定,招聘的职工须参加不小于80小时的某种技能培训才能上班.公司人事部门在招聘的职工中随机抽取200名参加这种技能培训的数据,按时间段[75,80),[80,85),[85,90),[90,95),[95,100](单位:小时)进行统计,其频率分布直方图如图所示.
(1)求抽取的200名职工中,参加这种技能培训时间不少于90小时的人数,并估计从招聘职工中任意选取一人,其参加这种技能培训时间不少于90小时的概率;
(2)从招聘职工(人数很多)中任意选取3人,记X为这3名职工中参加这种技能培训时间不少于90小时的人数,试求X的分布列和数学期望E(X)和方差D(X).
[解析] (1)依题意,培训时间在[90,95)小时的人数为200×0.06×5=60,
在[95,100)小时的人数为200×0.02×5=20,故满足题意职工人数为80人,所求概率估计为P==.
(2)依题意,随机变量X的可能取值为0,1,2,3,
P(X=0)=C()3=,
P(X=1)=C××()2=,
P(X=2)=C()2×=,
P(X=3)=C()3=,
则随机变量X的分布列为
X
0
1
2
3
P
∵X~B(3,),
∴E(X)=3×=,D(X)=3××=.
角度2 非二项分布的均值、方差问题
例3 (2019·青岛一模)为迎接2022年北京冬奥会,推广滑雪运动,某滑雪场开展滑雪促销活动,该滑雪场的收费标准是:滑雪时间不超过1小时免费,超过1小时的部分每小时收费标准为40元(不足1小时的部分按1小时计算).有甲、乙两人相互独立地来该滑雪场运动,设甲、乙不超过1小时离开的概率分别为,;1小时以上且不超过2小时离开的概率分别为,;两人滑雪时间都不会超过3小时.
(1)求甲、乙两人所付滑雪费用相同的概率;
(2)设甲、乙两人所付的滑雪费用之和为随机变量ξ,求ξ的分布列与均值E(ξ),方差D(ξ).
[解析] (1)两人所付费用相同,相同的费用可能为0,40,80元,
甲、乙两人2小时以上且不超过3小时离开的概率分别为(1--)=,(1--)=.
两人都付0元的概率为P1=×=,
两人都付40元的概率为P2=×=,
两人都付80元的概率为P3=×=,
则两人所付费用相同的概率为P=P1+P2+P3=++=.
(2)设甲、乙所付费用之和为ξ,ξ的可能取值为0,40,80,120,160,则
P(ξ=0)=×=,
P(ξ=40)=×+×=.
P(ξ=80)=×+×+×=,
P(ξ=120)=×+×=,
P(ξ=160)=×=.
所以ξ的分布列为
ξ
0
40
80
120
160
P
E(ξ)=0×+40×+80×+120×+160×=80.
D(ξ)=(0-80)2×+(40-80)2×+(80-80)2×+(120-80)2×+(160-80)2×=.
名师点拨 ☞
(1)求离散型随机变量ξ的均值与方差的步骤
①理解ξ的意义,写出ξ可能的全部取值;②求ξ取每个值的概率;③写出ξ的分布列;④由均值的定义求E(ξ);⑤由方差的定义求D(ξ).
(2)二项分布的期望与方差
如果ξ~B(n,p),则用公式E(ξ)=np,D(ξ)=np(1-p)求解,可大大减少计算量.
〔变式训练2〕
(1)(角度2)(2019·包头模拟)厂家在产品出厂前,需对产品做检验,厂家将一批产品发给商家时,商家按合同规定也需随机抽取一定数量的产品做检验,以决定是否接收这批产品.
①若厂家库房中的每件产品合格的概率为0.8,从中任意取出4件进行检验,求至少有1件是合格品的概率;
②若厂家发给商家20件产品,其中有3件不合格,按合同规定商家从这20件产品中任取2件,进行检验,只有2件都合格时才接收这批产品,否则拒收.求该商家可能检验出的不合格产品的件数ξ的分布列及数学期望E(ξ),并求该商家拒收这批产品的概率.
(2)(角度1)(2020·甘肃天水一中模拟)某商场举行有奖促销活动,顾客购买一定金额的商品后即可抽奖,每次抽奖都是从装有4个红球、6个白球的甲箱和装有5个红球、5个白球的乙箱中,各随机摸出1个球,在摸出的2个球中,若都是红球,则获一等奖;若只有1个红球,则获二等奖;若没有红球,则不获奖.
①求顾客抽奖1次能获奖的概率;
②若某顾客有3次抽奖机会,记该顾客在3次抽奖中获一等奖的次数为X,求X的分布列和数学期望.
[解析] (1)①记“厂家任取4件产品检验,其中至少有1件是合格品”为事件A,用对立事件来算,有P(A)=1-P()=1-0.24=0.998 4.
②ξ可能的取值为0,1,2,
P(ξ=0)==,P(ξ=1)==,
P(ξ=2)==,
故ξ的分布列为
ξ
0
1
2
P
E(ξ)=0×+1×+2×=.
记“商家任取2件产品检验,都合格”为事件B,则商家拒收这批产品的概率P=1-P(B)=1-=.
所以商家拒收这批产品的概率为.
(2)①记事件A1={从甲箱中摸出的1个球是红球},A2={从乙箱中摸出的1个球是红球},
B1={顾客抽奖1次获一等奖},B2={顾客抽奖1次获二等奖},C={顾客抽奖1次能获奖}.
因为P(A1)==,P(A2)==,
所以P(B1)=P(A1A2)=P(A1)·P(A2)=×=,
P(B2)=P(A1+A2)=P(A1)+P(A2)=P(A1)P()+P()P(A2)
=P(A1)[1-P(A2)]+[1-P(A1)]·P(A2)=×(1-)+(1-)×=.
故所求概率为P(C)=P(B1+B2)=P(B1)+P(B2)=+=.
②顾客抽奖3次可视为3次独立重复试验,
由(1)知,顾客抽奖1次获一等奖的概率为,
所以X~B(3,).
于是P(X=0)=C()3=,
P(X=1)=C()1()2=,
P(X=2)=C()2()1=,
P(X=3)=C()3=.
故X的分布列为
X
0
1
2
3
P
X的数学期望为E(X)=3×=.
考点三 均值与方差在决策中的应用——师生共研
例4 (2019·广东揭阳模拟)某地政府拟在该地一水库上建造一座水电站,用泄流水量发电,下图是根据该水库历年的日泄流量的水文资料画成的日泄流量K(单位:万立方米)的频率分布直方图(不完整),已知X∈[0,120],历年中日泄流量在区间[30,60)的年平均天数为156,一年按364天计.
(1)请把频率分布直方图补充完整;
(2)该水电站希望安装的发电机尽可能都运行,但每30万立方米的日泄流量才够运行一台发电机,如60≤X<90时才够运行两台发电机,若运行一台发电机,每天可获利润为4 000元;若不运行,则该台发电机每天亏损500元,以各段的频率作为相应段的概率,以水电站日利润的期望值为决策依据,问:为使水电站日利润的期望值最大,该水电站应安装多少台发电机?
[解析] (1)在区间[30,60)的频率为=,
==.
设在区间[0,30)上,=a,
则(a+++)×30=1,解得a=.
补充完整的频率分布直方图如图所示.
(2)记水电站日利润为Y元.由(1)知,无法运行发电机的概率为,恰好运行一台发电机的概率为,恰好运行两台发电机的概率为,恰好运行三台发电机的概率为.
①若安装一台发电机,则Y的所有可能取值为-500,4 000,其分布列为
Y
-500
4 000
P
E(Y)=-500×+4 000×=.
②若安装两台发电机,则Y的所有可能取值为-1 000,3 500,8 000,其分布列为
Y
-1 000
3 500
8 000
P
E(Y)=-1 000×+3 500×+8 000×=.
③若安装三台发电机,则Y的所有可能取值为-1 500,3 000,7 500,12 000,其分布列为
Y
-1 500
3 000
7 500
12 000
P
E(Y)=-1 500×+3 000×+7 500×+12 000×=.因为>>.
所以要使水电站日利润的期望值最大,该水电站应安装三台发电机.
名师点拨 ☞
利用均值与方差解决实际问题的方法
(1)对实际问题进行具体分析,将实际问题转化为数学问题,并将问题中的随机变量设出来.
(2)依据随机变量取每一个值时所表示的具体事件,求出其相应的概率.
(3)依据期望与方差的定义、公式求出相应的期望与方差值.
(4)依据期望与方差的意义对实际问题作出决策或给出合理的解释.
〔变式训练3〕
(2020·广东化州模拟)为回馈顾客,某商场拟通过摸球兑奖的方式对1 000位顾客进行奖励,规定:每位顾客从一个装有4个标有面值的球的袋中一次性随机摸出2个球,球上所标的面值之和为该顾客所获的奖励额.
(1)若袋中所装的4个球中有1个所标的面值为50元,其余3个均为10元,求:
①顾客所获的奖励额为60元的概率;
②顾客所获的奖励额的分布列及数学期望;
(2)商场对奖励总额的预算是60 000元,并规定袋中的4个球只能由标有面值10元和50元的两种球组成,或标有面值20元和40元的两种球组成.为了使顾客得到的奖励总额尽可能符合商场的预算且每位顾客所获的奖励额相对均衡,请对袋中的4个球的面值给出一个合适的设计,并说明理由.
[解析] (1)设顾客所获的奖励额为X(单位:元).
①依题意,P(X=60)==,
即顾客所获的奖励额为60元的概率为.
②依题意,X的所有可能取值为20,60.
P(X=60)=,P(X=20)==,
故X的分布列为
X
20
60
P
所以顾客所获的奖励额的数学期望为
E(X)=20×+60×=40(元).
(2)根据商场的预算,每位顾客的平均奖励额为=60(元),所以先寻找数学期望为60元的可能方案.
对于面值由10元和50元组成的情况,如果选择(10,10,10,50)的方案,
因为60元是面值之和的最大值,所以数学期望不可能为60元;
如果选择(50,50,50,10)的方案,因为60元是面值之和的最小值,所以数学期望也不可能为60元,
因此可能的方案是(10,10,50,50),记为方案1.
对于面值由20元和40元组成的情况,同理可排除(20,20,20,40)和(40,40,40,20)的方案,所以可能的方案是(20,20,40,40),记为方案2.
以下是对两个方案的分析:
对于方案1,即方案(10,10,50,50),设顾客所获的奖励额为X1(单位:元),则X1的分布列为
X1
20
60
100
P
所以X1的数学期望为
E(X1)=20×+60×+100×=60(元),
X1的方差为
D(X1)= (20-60)2×+(60-60)2×+(100-60)2×=(元).
对于方案2,即方案(20,20,40,40),设顾客所获的奖励额为X2(单位:元),则
同理可求得E(X2)=60(元),D(X2)=(元),
由于两种方案的奖励额的数学期望都符合要求,但方案2的奖励额的方差比方案1的小,顾客所获的奖励额相对均衡,所以应该选择方案2.
考点四 正态分布——自主练透
例5 (1)(2019·四川遂宁一诊)已知随机变量ξ服从正态分布N(μ,σ2),若P(ξ<2)=P(ξ>6)=0.15,则P(2≤ξ<4)=( B )
A.0.3 B.0.35
C.0.5 D.0.7
(2)(2020·山东新高考质量测评联盟联考)在2019年高中学生信息技术测试中,经统计,某校高二学生的测试成绩X~N(86,σ2),若已知P(80
C.0.36 D.0.14
[解析] (1)由P(ξ<2)=P(ξ>6)知,μ=4,
∴P(2≤ξ<4)=0.5-P(ξ<2)=0.5-0.15=0.35.故选B.
(2)由题意P(86
[引申]本例(2)中若有1 000名学生参加测试,则测试成绩在80分以上的人数为__860__.
[解析] 1 000×P(X>80)=1 000×[1-(0.5-0.36)]=860.
〔变式训练4〕
(1)(2020·山东潍坊期末)已知随机变量ξ服从正态分布N(1,σ2),且P(ξ<4)=0.9,则P(-2<ξ<1)=( C )
A.0.2 B.0.3
C.0.4 D.0.6
(2)(2019·云南昆明质检)某市一次高三年级数学统测,经抽样分析,成绩X近似服从正态分布N(84,σ2),且P(78
C.100 D.120
[解析] (1)由P(ξ<4)=0.9,得P(ξ≥4)=0.1.
又正态曲线关于x=1对称.
则P(ξ≤-2)=P(ξ≥4)=0.1,
所以P(-2<ξ<1)==0.4.故选C.
(2)由题意知P(X≥90)=P(x≤78)
=0.5-P(78
名师点拨 ☞
关于正态总体在某个区间内取值的概率求法
(1)熟记P(μ-σ
MING SHI JIANG TAN SU YANG TI SHENG
名师讲坛·素养提升
正态分布的实际应用问题
例6 (2020·广西柳州铁路一中、玉林一中联考)从某公司生产线生产的某种产品中抽取1 000件,测量这些产品的一项质量指标,由检测结果得如图所示的频率分布直方图:
(1)求这1 000件产品质量指标的样本平均数和样本方差s2(同一组中的数据用该组区间的中点值作代表);
(2)由直方图可以认为,这种产品的质量指标值Z服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2.
①利用该正态分布,求P(175.6
附:≈12.2,若Z~N(μ,σ2),则P(μ-σ
=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200
s2=(170-200)2×0.02+(180-200)2×0.09+(190-200)2×0.22+(200-200)2×0.33+(210-200)2×0.24+(220-200)2×0.08+(230-200)2×0.02=150.
即样本平均数为200,样本方差为150.
(2)①由(1)可知,μ=200,σ=≈12.2,
∴Z~N(200,12.22),∴P(175.6
题意得X~B(100,0.95),∴E(X)=95,
∴E(Y)=16E(X)-48×5-100×10=280.
名师点拨 ☞
解决正态分布问题的三个关键点
若随机变量ξ~N(μ,σ2),则
(1)对称轴x=μ;
(2)标准差σ;
(3)分布区间.利用对称性可求指定范围内的概率值;由μ,σ,分布区间的特征进行转化,使分布区间转化为3σ特殊区间,从而求出所求概率
〔变式训练4〕
(2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
①试说明上述监控生产过程方法的合理性;
②下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得=xi=9.97,s==≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(-3,+3)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-3σ
X的数学期望为E(X)=16×0.002 6=0.041 6.
(2)①如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
②由=9.97,s≈0.212,得μ的估计值为=9.97,σ的估计值为=0.212,由样本数据可以看出有一个零件的尺寸在(-3,+3)之外,因此需对当天的生产过程进行检查.
剔除(-3,+3)之外的数据9.22,剩下数据的平均数为(16×9.97-9.22)=10.02,
因此μ的估计值为10.02.
x=16×0.2122+16×9.972≈1 591.134,
剔除(-3,+3)之外的数据9.22,剩下数据的样本方差为(1 591.134-9.222-15×10.022)≈0.008,
因此σ的估计值为≈0.09.