2020版新一线高考理科数学一轮复习教学案:第10章第6节 离散型随机变量的均值与方差、正态分布
展开
第六节 离散型随机变量的均值与方差、正态分布
[考纲传真] 1.理解取有限个值的离散型随机变量的均值、方差的概念.2.会求简单离散型随机变量的均值、方差,并能利用离散型随机变量的均值、方差概念解决一些简单实际问题.3.借助直观直方图认识正态分布曲线的特点及曲线所表示的意义.
1.离散型随机变量的分布列、均值与方差
一般地,若离散型随机变量X的分布列为
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
(1)均值:称E(X)=x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平.
(2)方差:称D(X)= [xi-E(X)]2pi为随机变量X的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,其算术平方根为随机变量X的标准差.
2.均值与方差的性质
(1)E(aX+b)=aE(X)+b.
(2)D(aX+b)=a2D(X)(a,b为常数).
3.两点分布与二项分布的均值、方差
均值
方差
变量X服从两点分布
E(X)=p
D(X)=p(1-p)
X~B(n,p)
E(X)=np
D(X)=np(1-p)
4.正态分布
(1)正态曲线的特点:
①曲线位于x轴上方,与x轴不相交;
②曲线是单峰的,它关于直线x=μ对称;
③曲线在x=μ处达到峰值;
④曲线与x轴之间的面积为1;
⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移;
⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.
(2)正态分布的三个常用数据
①P(μ-σ<X≤μ+σ)=0.682_6;
②P(μ-2σ<X≤μ+2σ)=0.954_4;
③P(μ-3σ<X≤μ+3σ)=0.997_4.
1.均值与方差的关系:D(X)=E(X2)-E2(X).
2.超几何分布的均值:若X服从参数为N,M,n的超几何分布,则E(X)=.
[基础自测]
1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”)
(1)离散型随机变量的各个可能值表示的事件是彼此互斥的. ( )
(2)若X~N(μ,σ2),则μ,σ2分别表示正态分布的均值和方差. ( )
(3)随机变量的均值是常数,样本的平均值是随机变量. ( )
(4)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离均值的平均程度越小. ( )
[答案] (1)√ (2)√ (3)× (4)√
2.(教材改编)已知X的分布列为
X
-1
0
1
P
a
设Y=2X+3,则E(Y)的值为( )
A. B.4 C.-1 D.1
A [由概率分布列的性质可知:++a=1,
∴a=.
∴E(X)=(-1)×+0×+1×=-.
∴E(Y)=3+2E(X)=3-=.]
3.已知随机变量X+η=8,若X~B(10,0.6),则随机变量η的均值E(η)及方差D(η)分别是( )
A.6和2.4 B.2和2.4
C.2和5.6 D.6和5.6
B [设随机变量X的均值及方差分别为E(X),D(X),因为X~B(10,0.6),所以E(X)=10×0.6=6,D(X)=10×0.6×(1-0.6)=2.4,故E(η)=E(8-X)=8-E(X)=2,D(η)=D(8-X)=D(X)=2.4,故选B.]
4.已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<4)=________.
0.6 [由P(ξ<4)=0.8,得P(ξ≥4)=0.2.
又正态曲线关于x=2对称.
则P(ξ≤0)=P(ξ≥4)=0.2,
∴P(0<ξ<4)=1-P(ξ≤0)-P(ξ≥4)=0.6.]
5.随机变量X的分布列为P(X=k)=,k=1,2,3,C为常数,则P(0.5<X<2.5)=________.
[由P(X=1)+P(X=2)+P(X=3)=1,得++=1,解得C=.所以P(0.5<X<2.5)=P(X=1)+P(X=2)=+=.]
求离散型随机变量的均值、方差
【例1】 (1)(2017·全国卷Ⅱ改编)一批产品的二等品率为0.02,从这批产品中每次随机取一件,有放回地抽取100次,X表示抽到的二等品件数,则D(X)=( )
A.1.96 B.1.98 C.2 D.2.02
(2)甲、乙两人轮流投篮,每人每次投一球.约定甲先投且先投中者获胜,一直到有人获胜或每人都投球3次时投篮结束.设甲每次投篮投中的概率为,乙每次投篮投中的概率为,且各次投篮互不影响.
①求甲获胜的概率;
②求投篮结束时甲的投球次数ξ的分布列与期望.
(1)A [依题意,X~B(100,0.02),所以D(X)=100×0.02×(1-0.02)=1.96.]
(2)[解] 设Ak,Bk分别表示“甲、乙在第k次投篮投中”,
则P(Ak)=,P(Bk)=,其中k=1,2,3.
①记“甲获胜”为事件C,由互斥事件与相互独立事件的概率计算公式知
P(C)=P(A1)+P(A2)+P(A3)=P(A1)+P()P()P(A2)+P()P()P()P()P(A3)=+××+××=++=.
②ξ的所有可能取值为1,2,3,且
P(ξ=1)=P(A1)+P(B1)=+×=,
P(ξ=2)=P(A2)+P(B2)=××+×=,
P(ξ=3)=P()=×=.
综上知,ξ的分布列为
ξ
1
2
3
P
所以E(ξ)=1×+2×+3×=.
[规律方法] 求离散型随机变量X的均值与方差的步骤
(1)理解X的意义,写出X可能取的全部值.
(2)求X取每个值时的概率.
(3)写出X的分布列.
(4)由均值的定义求E(X).
(5)由方差的定义求D(X).
设袋子中装有a个红球,b个黄球,c个蓝球,且规定:取出一个红球得1分,取出一个黄球得2分,取出一个蓝球得3分.
(1)当a=3,b=2,c=1时,从该袋子中任取(有放回,且每球取到的机会均等)2个球,记随机变量ξ为取出此2球所得分数之和,求ξ的分布列;
(2)从该袋子中任取(每球取到的机会均等)1个球,记随机变量η为取出此球所得分数.若E(η)=,D(η)=,求a∶b∶c.
[解] (1)由题意得ξ=2,3,4,5,6,
故P(ξ=2)==,
P(ξ=3)==,
P(ξ=4)==,
P(ξ=5)==,
P(ξ=6)==.
所以ξ的分布列为
ξ
2
3
4
5
6
P
(2)由题意知η的分布列为
η
1
2
3
P
所以E(η)=++=,
D(η)=2·+2·+2·=,化简得
解得a=3c,b=2c,故a∶b∶c=3∶2∶1.
均值与方差在决策中的应用
【例2】 根据某水文观测点的历史统计数据,得到某河流每年最高水位X(单位:米)的频率分布直方图如图:
将河流最高水位落入各组的频率视为概率,并假设每年河流最高水位相互独立.
(1)求在未来三年里,至多有一年河流最高水位X∈[27,31)的概率(结果用分数表示);
(2)该河流对沿河A企业影响如下:当X∈[23,27)时,不会造成影响;当X∈[27,31)时,损失10 000元;当X∈[31,35]时,损失60 000元.为减少损失,现有三种应对方案:
方案一:防御35米的最高水位,每年需要工程费用3 800元;
方案二:防御31米的最高水位,每年需要工程费用2 000元;
方案三:不采取措施.
试比较上述三种方案,哪种方案好,并请说明理由.
[解] (1)由题意得P(27≤X<31)=0.25=.
设在未来3年里,河流最高水位x∈[27,31)发生的年数为Y,则Y~N.
设事件“在未来三年里,至多有一年河流最高水位X∈[27,31)”为事件A,
则P(A)=P(Y=0)+P(Y=1)=C+C2×=.
所以在未来三年里,至多有一年河流最高水位X∈[27,31)的概率为.
(2)方案二好,理由如下:
由题意得P(23≤X<27)=0.74,
P(31≤X≤35)=0.01,
用X1,X2,X3分别表示方案一、方案二、方案三的损失,
由题意得X1=3 800,X2的分布列为
X2
2 000
62 000
P
0.99
0.01
所以E(X2)=62 000×0.01+2 000×0.99=2 600.
X3的分布列为
X3
0
10 000
60 000
P
0.74
0.25
0.01
所以E(X3)=0×0.74+60 000×0.01+10 000×0.25=3 100.
因为三种方案中方案二的平均损失最小,所以采取方案二好.
[规律方法] 利用均值、方差进行决策的两个方略
(1)当均值不同时,两个随机变量取值的水平可见分歧,可对问题作出判断.
(2)若两随机变量均值相同或相差不大,则可通过分析两变量的方差来研究随机变量的离散程度或者稳定程度,进而进行决策.
某供货商计划将某种大型节日商品分别配送到甲、乙两地销售,据以往数据统计,甲、乙两地该商品需求量(单位:件)的频率分布表如下:
甲地需求量频率分布表
需求量/件
4
5
6
频率
0.5
0.3
0.2
乙地需求量频率分布表
需求量/件
3
4
5
频率
0.6
0.3
0.1
以两地需求量的频率估计需求量的概率.
(1)若此供货商计划将10件该商品全部配送至甲、乙两地,为保证两地不缺货(配送量≥需求量)的概率均大于0.7,问该商品的配送方案有哪几种?
(2)已知甲、乙两地该商品的销售相互独立,该商品售出,供货商获利2万元/件;未售出的,供货商亏损1万元/件.在(1)的前提下,若仅考虑此供货商所获净利润,试确定最佳配送方案.
[解] (1)由表格可知,甲地不缺货的概率大于0.7时,至少需配货5件;乙地不缺货的概率大于0.7时,至少需配货4件.
故共有两种方案:方案一是甲地配5件,乙地配5件;方案二是甲地配6件,乙地配4件.
(2)方案一:甲地配5件,乙地配5件时,记甲地的利润为X1万元,乙地的利润为Y1万元,则X1,Y1的分布列分别为
X1
7
10
P
0.5
0.5
Y1
4
7
10
P
0.6
0.3
0.1
所以选择方案一时,此供货商净利润的期望为E(X1)+E(Y1)=(7×0.5+10×0.5)+(4×0.6+7×0.3+10×0.1)=8.5+5.5=14(万元).
方案二:甲地配6件,乙地配4件时,记甲地的利润为X2万元,乙地的利润为Y2万元,则X2,Y2的分布列分别为
X2
6
9
12
P
0.5
0.3
0.2
Y2
5
8
P
0.6
0.4
所以选择方案二时,此供货商净利润的期望为E(X2)+E(Y2)=(6×0.5+9×0.3+12×0.2)+(5×0.6+8×0.4)=8.1+6.2=14.3(万元).
综上,仅考虑此供货商所获净利润,选择方案二更佳.
正态分布
【例3】 (2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
①试说明上述监控生产过程方法的合理性;
②下面是检验员在一天内抽取的16个零件的尺寸:
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得==9.97,s==)≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(-3,+3)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-3σ