还剩24页未读,
继续阅读
所属成套资源:2021高考数学人教版一轮创新教学案
成套系列资料,整套一键下载
2021届高考数学人教版一轮创新教学案:第10章第9讲 离散型随机变量的均值
展开
第9讲 离散型随机变量的均值、方差和正态分布
[考纲解读] 1.理解取有限个值的离散型随机变量的均值、方差的概念,并能根据分布列正确求出期望与方差,并能解决一些实际问题.(重点、难点)
2.借助直方图认识正态分布曲线的特点及曲线所表示的意义,掌握正态曲线的相关性质,并能进行正确求解.
[考向预测] 从近三年高考情况来看,本讲是高考中的热点题型.预计2021年将会考查:①与分布列相结合求期望与方差,通过设置密切贴近现实生活的情景,考查概率思想的应用意识和创新意识;②正态分布的考查,尤其是正态总体在某一区间内的概率.题型为解答题中的一问,试题难度不会太大,属中档题型.
1.离散型随机变量的均值与方差
若离散型随机变量X的分布列为
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
(1)均值:称E(X)=x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平.
(2)D(X)=(xi-E(X))2pi为随机变量X的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,其算术平方根为随机变量X的标准差.
2.均值与方差的性质
(1)E(aX+b)=aE(X)+b;
(2)D(aX+b)=a2D(X)(a,b为常数).
3.两点分布与二项分布的均值、方差
X
X服从两点分布
X~B(n,p)
E(X)
p
np
D(X)
p(1-p)
np(1-p)
4.正态曲线
(1)正态曲线的定义
函数φμ,σ(x)=e-,x∈(-∞,+∞),其中实数μ和σ(σ>0)为参数,称φμ,σ(x)的图象为正态分布密度曲线,简称正态曲线(μ是正态分布的期望,σ是正态分布的标准差).
(2)正态曲线的特点
①曲线位于x轴上方,与x轴不相交;
②曲线是单峰的,关于直线x=μ对称;
③曲线在x=μ处达到峰值;
④曲线与x轴之间的面积为1;
⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移;
⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“高瘦”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.
5.正态分布
(1)正态分布的定义及表示
如果对于任何实数a,b(a (2)正态分布的三个常用数据
①P(μ-σ
②P(μ-2σ
③P(μ-3σ
1.概念辨析
(1)随机变量不可以是负数,随机变量所对应的概率可以是负数,随机变量的均值不可以是负数.( )
(2)正态分布中的参数μ和σ完全确定了正态分布,参数μ是正态分布的期望,σ是正态分布的标准差.( )
(3)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离均值的平均程度越小. ( )
(4)一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用结果之和,它就服从或近似服从正态分布.( )
答案 (1)× (2)√ (3)√ (4)√
2.小题热身
(1)已知随机变量X的分布列如下,
X
-2
0
2
P
则E(X)与D(X)的值分别为( )
A.0,2 B.0,
C.2,0 D.,0
答案 B
解析 E(X)=(-2)×+0×+2×=0,D(X)=(-2-0)2×+(0-0)2×+(2-0)2×=.
(2)设ξ~B(n,p),若E(ξ)=15,D(ξ)=11.25,则n=( )
A.45 B.50
C.55 D.60
答案 D
解析 由解得
(3)(2019·凉山州模拟)已知随机变量ξ,且ξ~N(μ,σ2),若P(-3<ξ<-1)=P(3<ξ<5),则μ=( )
A.4 B.2
C.1 D.0
答案 C
解析 依题意,P(-3<ξ<-1)=P(3<ξ<5),
又区间(-3,-1)和(3,5)关于x=1对称,
结合正态分布的知识,关于x=μ对称的区域所对应的概率相等,所以μ=1.
(4)已知X的分布列为,且Y=aX+3,E(Y)=,则a为( )
A.1 B.2
C.3 D.4
答案 B
解析 先求出E(X)=(-1)×+0×+1×=-.再由Y=aX+3,得E(Y)=aE(X)+3.
∴=a+3.解得a=2.
题型 一 离散型随机变量的均值、方差
角度1 离散型随机变量均值与方差的计算
问题
1.不透明袋子中装有大小、材质完全相同的2个红球和5个黑球,现从中逐个不放回地摸出小球,直到取出所有红球为止,则摸取次数X的数学期望是( )
A. B.
C. D.
答案 D
解析 当x=k时,第k次取出的必然是红球,而前k-1次中,有且只有1次取出的是红球,其余次数取出的皆为黑球,故P(X=k)==,于是得到X的分布列如下.
X
2
3
4
5
6
7
P
故E(X)=2×+3×+4×+5×+6×+7×=.
2.(2019·济南模拟)已知离散型随机变量X的分布列如表所示,若E(X)=0,D(X)=1,则P(X<1)=________.
X
-1
0
1
2
P
a
b
c
答案
解析 ∵E(X)=0,D(X)=1,
∴
又a,b,c∈[0,1],∴a=,b=,c=,P(X<1)=P(X=-1)+P(X=0)=+=.
角度2 二项分布的均值、方差问题
3.(2019·南阳模拟)设随机变量X~B(2,p),随机变量Y~B(3,p),若P(X≥1)=,则D(3Y+1)=( )
A.2 B.3
C.6 D.7
答案 C
解析 ∵随机变量X~B(2,p),P(X≥1)=,
∴P(X=0)=C(1-p)2=.∴p=,
∴D(Y)=np(1-p)=3××=,
∴D(3Y+1)=9D(Y)=6.
4.(2019·泉州模拟)2018年,依托用户碎片化时间的娱乐需求、分享需求以及视频态的信息负载力,短视频快速崛起.与此同时,移动阅读方兴未艾,从侧面反映了人们对精神富足的一种追求,在习惯了大众娱乐所带来的短暂愉悦后,部分用户依旧对有着传统文学底蕴的严肃阅读青睐有加.某读书App抽样调查了非一线城市M和一线城市N各100名用户的日使用时长(单位:分),绘制成频率分布直方图如下,其中日使用时长不低于60分钟的用户记为“活跃用户”.
(1)请填写以下2×2列联表,并判断是否有99.5%的把握认为用户活跃与否与所在城市有关?
活跃用户
不活跃用户
总计
城市M
城市N
总计
(2)以频率估计概率,从城市M中任选2名用户,从城市N中任选1名用户,设这3名用户中活跃用户的人数为ξ,求ξ的分布列和数学期望;
(3)该读书App还统计了2019年4个季度的用户使用时长y(单位:百万小时),发现y与季度(x)线性相关,得到回归直线方程为=4x+.已知这4个季度的用户平均使用时长为12.3百万小时,试以此回归方程估计2020年第一季度(x=5)该读书App用户使用时长约为多少百万小时.
附:K2=,其中n=a+b+c+d.
P(K2≥k0)
0.025
0.010
0.005
0.001
k0
5.024
6.635
7.879
10.828
解 (1)由已知条件可得以下2×2列联表:
活跃用户
不活跃用户
总计
城市M
60
40
100
城市N
80
20
100
总计
140
60
200
因为K2==≈9.524>7.879,
所以有99.5%的把握认为用户是否活跃与所在城市有关.
(2)由统计数据可知,城市M中活跃用户占,城市N中活跃用户占.
设从城市M中任选的2名用户中活跃用户数为X,则X~B.
设从城市N中任选的1名用户中活跃用户数为Y,
则Y服从两点分布,其中P(Y=1)=.
由题意可得,ξ的所有可能的取值为0,1,2,3.
P(ξ=0)=P(X=0)·P(Y=0)=C·2·=;
P(ξ=1)=P(X=0)·P(Y=1)+P(X=1)·P(Y=0)=C·2·+C···=;
P(ξ=2)=P(X=1)·P(Y=1)+P(X=2)·P(Y=0)=C···+C·2·=;
P(ξ=3)=P(X=2)·P(Y=1)=C·2·=.
所以ξ的分布列为
ξ
0
1
2
3
P
E(ξ)=0×+1×+2×+3×=2.
(3)由已知条件得==2.5.
又=12.3,
代入=4x+,得12.3=4×2.5+,解得=2.3,所以=4x+2.3.
将x=5代入上式,得=4×5+2.3=22.3(百万小时),
所以2020年第一季度该读书App用户使用时长约为22.3百万小时.
角度3 超几何分布的均值、方差问题
5.(2019·青岛二中模拟)随着经济的发展和个人收入的提高,自2018年10月1日起,个人所得税起征点和税率依法进行调整.其中,纳税人的工资、薪金所得,先行以每月收入额减除费用五千元以及专项扣除和依法确定的其他扣除后的余额为应纳税所得额,依照个人所得税税率表,调整前后的计算方法如下表:
个人所得税税率表(调整前)
免征额3500元
级数
全月应纳税所得额
税率(%)
1
不超过1500元的部分
3
2
超过1500元至4500元的部分
10
3
超过4500元至9000元的部分
20
…
…
…
个人所得税税率表(调整后)
免征额5000元
级数
全月应纳税所得额
税率(%)
1
不超过3000元的部分
3
2
超过3000元至12000元的部分
10
3
超过12000元至25000元的部分
20
…
…
…
(1)假如小李某月的工资、薪金等所得税前收入为7500元(无专项扣除和依法确定的其他扣除),请你帮小李算一下调整后小李的实际收入比调整前增加了多少?
(2)某税务部门在小李所在公司利用分层抽样方法抽取某月100个不同级别员工的税前收入,并制成下面的频数分布表:
收入/元
[3000,
5000)
[5000,
7000)
[7000,
9000)
[9000,
11000)
[11000,
13000)
[13000,
15000]
人数
30
40
10
8
7
5
先从收入在[3000,5000)及[5000,7000)的员工中按分层抽样抽取7人,再从中选4人作为新纳税法知识宣讲员.用a表示抽到作为宣讲员的收入在[3000,5000)元的人数,b表示抽到作为宣讲员的收入在[5000,7000)元的人数.设随机变量Z=|a-b|,求Z的分布列、数学期望及方差.
解 (1)由于小李的工资、薪金等所得税前收入为7500元,按调整前起征点应纳个税为1500×3%+2500×10%=295(元).
按调整后起征点应纳个税为2500×3%=75(元).
比较两个纳税方案可知,按调整后起征点应纳个税比调整前少交220元.
所以调整后小李的实际收入比调整前增加了220元.
(2)①由频数分布表可知从收入在[3000,5000)及[5000,7000)的员工中抽取7个,其中收入在[3000,5000)内的有3人,收入在[5000,7000)内的有4人,再从这7人中选4人,所以Z的所有可能的取值为0,2,4.
P(Z=0)=P(a=2,b=2)==,
P(Z=2)=P(a=1,b=3)+P(a=3,b=1)
==,
P(Z=4)=P(a=0,b=4)==.
所以Z的分布列如下,
Z
0
2
4
P
数学期望E(Z)=0×+2×+4×=.
方差D(Z)=×2+×2+×2=.
(1)求离散型随机变量X的均值与方差的步骤
①理解X的意义,写出X的全部可能取值.
②求X取每个值的概率.
③写出X的分布列.
④由均值的定义求E(X).
⑤由方差的定义求D(X).
(2)注意性质的应用:若随机变量X的均值为E(X),则对应随机变量aX+b的均值是aE(X)+b,方差为a2D(X).
(3)如果ξ~B(n,p),则用公式E(ξ)=np,D(ξ)=np(1-p)求解,可大大减少计算量.见举例说明3.
1.(2020·南充市高三摸底)设离散型随机变量X可能的取值为1,2,3,4,P(X=k)=ak+b,又X的数学期望为E(X)=3,则a-b=( )
A. B.0
C.- D.
答案 A
解析 设离散型随机变量ξ可能取的值为1,2,3,4.P(ξ=k)=ak+b(k=1,2,3,4),∴(a+b)+(2a+b)+(3a+b)+(4a+b)=1,即10a+4b=1,又ξ的数学期望E(ξ)=3,则(a+b)+2(2a+b)+3(3a+b)+4(4a+b)=3,即30a+10b=3,a=,b=0,∴a-b=.
2.(2019·沈阳模拟)随着移动互联网的发展,与餐饮美食相关的手机软件层出不穷.为调查某款订餐软件上商家的服务情况,统计了10次订餐“送达时间”(单位:分),得到茎叶图如下:
(1)请计算“送达时间”的平均数与方差;
(2)根据茎叶图填写下表:
送达时间
35分钟以内(包括35分钟)
超过35分钟
频数
A
B
频率
C
D
(3)在(2)的情况下,以频率代替概率.现有3个客户用此软件订餐,求出在35分钟以内(包括35分钟)收到餐品的人数X的分布列,并求出数学期望.
解 (1)“ 送达时间”的平均数为
=35(分),
方差为×[(28-35)2+(29-35)2+(32-35)2+(34-35)2+(34-35)2+(35-35)2+(36-35)2+(38-35)2+(41-35)2+(43-35)2]=20.6.
(2)A=6,B=4,C=0.6,D=0.4.
(3)由题意知,在35分钟以内(包括35分钟)收到餐品的人数X的所有可能的取值为0,1,2,3.
P(X=0)=C×0.60×0.43=0.064;
P(X=1)=C×0.6×0.42=0.288;
P(X=2)=C×0.62×0.4=0.432;
P(X=3)=C×0.63×0.40=0.216.
所以X的分布列如下,
X
0
1
2
3
P
0.064
0.288
0.432
0.216
所以E(X)=0×0.064+1×0.288+2×0.432+3×0.216=1.8(或X服从二项分布B(3,0.6),E(X)=3×0.6=1.8).
3.(2019·漳州二模)某市电视台举办纪念红军长征胜利知识回答活动,宣传长征精神,首先在甲、乙、丙、丁四个不同的公园进行支持签名活动.
公园
甲
乙
丙
丁
获得签名人数
45
60
30
15
然后在各公园签名的人中按分层抽样的方式抽取10名幸运之星回答问题,从10个关于长征的问题中随机抽取4个问题让幸运之星回答,全部答对的幸运之星获得一份纪念品.
(1)求此活动中各公园幸运之星的人数;
(2)若乙公园中每位幸运之星对每个问题答对的概率均为,求乙公园中恰好2位幸运之星获得纪念品的概率;
(3)若幸运之星小李对其中8个问题能答对,而另外2个问题答不对,记小李答对的问题数为X,求X的分布列、期望及方差.
解 (1)甲、乙、丙、丁四个公园幸运之星的人数分别为×10=3,×10=4,×10=2,×10=1.
(2)根据题意,乙公园中每位幸运之星获得纪念品的概率为C4=,
所以乙公园中恰好2位幸运之星获得纪念品的概率为C22=.
(3)由题意,知X的所有可能取值2,3,4,服从超几何分布,P(X=2)==,
P(X=3)==,P(X=4)==.
所以X的分布列为
X
2
3
4
P
期望E(X)=2×+3×+4×=,
方差D(X)=×2+×2+×2=.
题型 二 均值与方差在决策中的应用
(2019·南昌模拟)市面上有某品牌A型和B型两种节能灯,假定A型节能灯使用寿命都超过5000小时.经销商对B型节能灯使用寿命进行了调查统计,得到如下频率分布直方图,
某商家因原店面需重新装修,需租赁一家新店面进行周转,合约期一年.新店面需安装该品牌节能灯5只(同种型号)即可正常营业.经了解,A型20瓦和B型55瓦的两种节能灯照明效果相当,都适合安装.已知A型和B型节能灯每只的价格分别为120元、25元,当地商业电价为0.75元/千瓦时.假定该店面正常营业一年的照明时间为3600小时,若正常营业期间灯坏了立即购买同型灯更换.(用频率估计概率)
(1)若该商家新店面全部安装了B型节能灯,求一年内恰好更换了2只灯的概率;
(2)若只考虑灯的成本和消耗电费,你认为该商家应选择哪种型号的节能灯,请说明理由.
解 (1)由频率分布直方图可知,B型节能灯使用寿命超过3600小时的频率为0.0010×(3800-3600)=0.2.用频率估计概率,得B型节能灯使用寿命超过3600小时的概率为.
所以一年内一只B型节能灯在使用期间需要更换的概率为.
所以一年内5只节能灯恰好更换了2只的概率为
C2×3=.
(2)该商家应选择A型节能灯.理由如下:
一共需要安装5只同种节能灯.
若选择A型节能灯,一年共需花费5×120+3600×5×20×0.75×10-3=870(元).
若选择B型节能灯,由于B型节能灯一年内需更换的只数服从二项分布B,所以一年需更换灯的只数的数学期望为5×=4(只).
所以一年共需花费(5+4)×25+3600×5×55×0.75×10-3=967.5(元).
因为967.3>870,所以该商家应选择A型节能灯.
解离散型随机变量的期望和方差应用问题的方法
(1)求离散型随机变量的期望与方差关键是确定随机变量的所有可能值,写出随机变量的分布列,正确运用期望、方差公式进行计算.
(2)要注意观察随机变量的概率分布特征,若属于二项分布,可用二项分布的期望与方差公式计算,则更为简单.
(3)在实际问题中,若两个随机变量ξ1,ξ2,有E(ξ1)=E(ξ2)或E(ξ1)与E(ξ2)较为接近时,就需要用D(ξ1)与D(ξ2)来比较两个随机变量的稳定程度.即一般地将期望最大(或最小)的方案作为最优方案,若各方案的期望相同,则选择方差最小(或最大)的方案作为最优方案.
(2019·湖北四地七校联考)有甲、乙两家公司都需要招聘求职者,这两家公司的聘用信息如下:
甲公司
乙公司
职位
A
B
C
D
职位
A
B
C
D
月薪/元
6000
7000
8000
9000
月薪/元
5000
7000
9000
11000
获得相应
职位概率
0.4
0.3
0.2
0.1
获得相应
职位概率
0.4
0.3
0.2
0.1
(1)根据以上信息,如果你是该求职者,你会选择哪一家公司?说明理由;
(2)某课外实习作业小组调查了1000名职场人士,就选择这两家公司的意愿做了统计,得到以下数据分布:
选择意愿
人员结构
40岁以上(含
40岁)男性
40岁以上(含
40岁)女性
40岁以
下男性
40岁以
下女性
选择甲公司
110
120
140
80
选择乙公司
150
90
200
110
若分析选择意愿与年龄这两个分类变量,计算得到的K2的观测值为k1=5.5513,则得出“选择意愿与年龄有关系”的结论犯错误的概率的上限是多少?并用统计学知识分析,选择意愿与年龄变量和性别变量哪一个关联性更大?
附:K2=,n=a+b+c+d.
P(K2≥k0)
0.050
0.025
0.010
0.005
k0
3.841
5.024
6.635
7.879
解 (1)设甲公司与乙公司的月薪分别为随机变量X,Y,
则E(X)=6000×0.4+7000×0.3+8000×0.2+9000×0.1=7000,
E(Y)=5000×0.4+7000×0.3+9000×0.2+11000×0.1=7000,
D(X)=(6000-7000)2×0.4+(7000-7000)2×0.3+(8000-7000)2×0.2+(9000-7000)2×0.1=10002,
D(Y)=(5000-7000)2×0.4+(7000-7000)2×0.3+(9000-7000)2×0.2+(11000-7000)2×0.1=20002,
则E(X)=E(Y),D(X)<D(Y),
我希望不同职位的月薪差距小一些,故选择甲公司;
或我希望不同职位的月薪差距大一些,故选择乙公司.
(2)因为k1=5.5513>5.024,根据表中对应值,
得出“选择意愿与年龄有关系”的结论犯错误的概率的上限是0.025,
由数据分布可得选择意愿与性别两个分类变量的2×2列联表如下:
选择甲公司
选择乙公司
总计
男
250
350
600
女
200
200
400
总计
450
550
1000
计算K2==≈6.734,
且K2=6.734>6.635,
对照临界值表得出结论“选择意愿与性别有关”的犯错误的概率上限为0.01,
由0.01<0.025,所以与年龄相比,选择意愿与性别关联性更大.
题型 三 正态分布的应用
1.设X~N(1,1),其正态分布密度曲线如图所示,那么向正方形ABCD中随机投掷10000个点,则落入阴影部分的点的个数的估计值是( )
(注:若X~N(μ,σ2),则P(μ-σ
A.7539 B.6038
C.7028 D.6587
答案 D
解析 ∵X~N(1,1),∴μ=1,σ=1,μ+σ=2,
∵P(μ-σ<X≤μ+σ)=68.26%,∴则P(0<X≤2)=68.26%,
则P(1<X≤2)=34.13%,
∴阴影部分的面积为0.6587,
∴点落入题图中阴影部分的概率P==0.6587.
∴正方形ABCD中随机投掷10000个点,则落入阴影部分的点的个数的估计值是6587.故选D.
条件探究 若将本例中“正方形”改为“矩形”,“X~N(1,1)”变为“X~N(-1,1),阴影部分如图所示”,则落入阴影部分的点的个数的估计值是________.
答案 9547
解析 对于正态分布N(-1,1),可知μ=-1,σ=1,正态曲线关于直线x=-1对称,故P(0
所以点落入题图中阴影部分的概率P==0.9547,
投入10000个点,落入阴影部分的个数约为10000×0.9547=9547.
2.(2019·蚌埠三模)我市高三年级第二次质量检测的数学成绩X近似服从正态分布N(82,σ2),且P(74
答案 64
解析 因为数学成绩X近似服从正态分布N(82,σ2),所以数学成绩X关于X=82对称,因为P(74
正态分布下两类常见的概率计算
(1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x=μ对称,曲线与x轴之间的面积为1.
(2)利用3σ原则求概率问题时,要注意把给出的区间或范围与正态变量的μ,σ进行对比联系,确定它们属于(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)中的哪一个.
1.设两个正态分布N(μ1,σ)(σ1>0)和N(μ2,σ)(σ2>0)的密度函数图象如图所示,则有( )
A.μ1<μ2,σ1<σ2 B.μ1<μ2,σ1>σ2
C.μ1>μ2,σ1<σ2 D.μ1>μ2,σ1>σ2
答案 A
解析 μ反映正态分布的平均水平,x=μ是正态曲线的对称轴,由图知μ1<μ2,σ反映正态分布的离散程度,σ越大,曲线越“矮胖”,表明越分散,σ越小,曲线越“高瘦”,表明越集中,由图知σ1<σ2.
2.(2019·九江三模)已知某公司生产的一种产品的质量X(单位:千克)服从正态分布N(90,64).现从该产品的生产线上随机抽取10000件产品,其中质量在区间(82,106)内的产品估计有(若X~N(μ,σ2),则P(μ-σ
A.8185件 B.6826件
C.4772件 D.2718件
答案 A
解析 依题意,μ=90,σ=8,∴P(82
组 基础关
1.(2019·保定二模)已知随机变量ξ服从正态分布N(μ,σ2),若P(ξ<2)=P(ξ>6)=0.1,则P(2≤ξ<4)为( )
A.0.7 B.0.5
C.0.4 D.0.35
答案 C
解析 由P(ξ<2)=P(ξ>6)=0.1,可得μ=4,且P(2≤ξ<4)=×(1-0.1×2)=0.4.
2.已知随机变量X+Y=8,若X~B(10,0.6),则E(Y),D(Y)分别是( )
A.6和2.4 B.2和2.4
C.2和5.6 D.6和5.6
答案 B
解析 由已知随机变量X+Y=8,所以Y=8-X.因此,求得E(Y)=8-E(X)=8-10×0.6=2,D(Y)=(-1)2D(X)=10×0.6×0.4=2.4.故选B.
3.(2019·湖南湘西二模)已知甲、乙两台自动车床生产同一种零件,X表示甲车床生产1000件产品中的次品数,
Y表示乙车床生产1000件产品中的次品数,经考察一段时间,X,Y的分布列分别是
X
0
1
2
3
P
0.7
0.1
0.1
0.1
Y
0
1
2
P
0.5
0.3
0.2
据此判断( )
A.甲比乙生产的产品质量好
B.乙比甲生产的产品质量好
C.甲与乙生产的产品质量相同
D.无法判断
答案 A
解析 E(X)=0×0.7+1×0.1+2×0.1+3×0.1=0.6,E(Y)=0×0.5+1×0.3+2×0.2=0.7.由于E(Y)>E(X),故甲比乙生产的产品质量好.
4.(2020·浙江嘉兴适应性训练)随机变量X的分布列如下表,且E(X)=2,则D(2X-3)=( )
X
0
2
a
P
p
A.2 B.3
C.4 D.5
答案 C
解析 p=1--=,E(X)=0×+2×+a×=2⇒a=3,∴D(X)=(0-2)2×+(2-2)2×+(3-2)2×=1.∴D(2X-3)=22D(X)=4.
5.(2019·广州二模)从某班6名学生(其中男生4人,女生2人)中任选3人参加学校组织的社会实践活动.设所选3人中女生人数为ξ,则数学期望E(ξ)=( )
A. B.1
C. D.2
答案 B
解析 因为ξ=0,1,2,所以P(ξ=0)==,P(ξ=1)==,P(ξ=2)==,因此E(ξ)=0×+1×+2×=1.
6.(2019·浙江金丽衢十二校第一次联考)五人进行过关游戏,每人随机出现左路和右路两种选择.若选择同一条路的人数超过2人,则他们每人得1分;若选择同一条路的人数小于3人,则他们每人得0分,记小强游戏得分为ξ,则E(ξ)=( )
A. B.
C. D.
答案 B
解析 五人进行过关游戏,每人随机出现左路和右路两种选择.若选择同一条路的人数超过2人,则他们每人得1分;若选择同一条路的人数小于3人,则他们每人得0分,∴P(ξ=1)=C2·2+C3+C4= ,P(ξ=0)=1-= ,∴E(ξ)=1×+0×=.
7.已知抛物线y=ax2+bx+c(a≠0)的对称轴在y轴的左侧,其中a,b,c∈{-3,-2,-1,0,1,2,3},在这些抛物线中记随机变量ξ=“|a-b|的取值”,则ξ的数学期望E(ξ)为( )
A. B.
C. D.
答案 A
解析 由于对称轴在y轴左侧,故-<0,故a,b同号,基本事件有3×3×7×2=126,ξ的可能取值有0,1,2三种.P(ξ=0)==,P(ξ=1)==,P(ξ=2)==,故期望值为0×+1×+2×=,故选A.
8.(2019·日照模拟)某市高三理科学生有15000名,在一次调研测试中,数学成绩ξ服从正态分布N(100,σ2),已知P(80<ξ≤100)=0.40,若按成绩分层抽样的方式取100份试卷进行分析,则应从120分以上的试卷中抽取的份数为________.
答案 10
解析 P(ξ>120)=[1-2P(80<ξ≤100)]=0.10,
所以应从120分以上的试卷中抽取100×0.10=10份.
9.(2019·绵阳模拟)一个盒子装有3个红球和2个蓝球(小球除颜色外其他均相同),从盒子中一次性随机取出3个小球后,再将小球放回.重复50次这样的实验.记“取出的3个小球中只有2个红球,1个蓝球”发生的次数为ξ,则ξ的方差是________.
答案 12
解析 由题意知ξ~B(n,p),其中n=50,P===,所以D(ξ)=50××=12.
10.一个人将编号为1,2,3,4的四个小球随机放入编号为1,2,3,4的四个盒子中,每个盒子放一个小球,球的编号与盒子的编号相同时叫做放对了,否则叫做放错了.设放对的个数为ξ,则ξ的期望值为________.
答案 1
解析 将四个小球放入四个盒子,每个盒子放一个小球,共有A种不同放法,放对的个数ξ可取的值有0,1,2,4.其中,P(ξ=0)==,P(ξ=1)==,P(ξ=2)==,P(ξ=4)==,所以E(ξ)=0×+1×+2×+4×=1.
组 能力关
1.已知5台机器中有2台存在故障,现需要通过逐台检测直至区分出2台故障机器为止.若检测一台机器的费用为1000元,则所需检测费用的均值为( )
A.3200 B.3400 C.3500 D.3600
答案 C
解析 设检测的机器的台数为X,则X的所有可能取值为2,3,4.P(X=2)==,P(X=3)==,P(X=4)==,所以E(X)=2×+3×+4×=3.5,所以所需检测费用的均值为1000×3.5=3500.
2.(2019·巢湖模拟)某次考试共有12个选择题,每个选择题的分值为5分,每个选择题四个选项且只有一个选项是正确的,A学生对12个选择题中每个题的四个选项都没有把握,最后选择题的得分为X,B学生对12个选择题中每个题的四个选项都能判断其中有一个选项是错误的,对其他三个选项都没有把握,选择题的得分为Y,则D(Y)-D(X)的值为( )
A. B.
C. D.
答案 A
解析 设A学生答对题的个数为m,则得分X=5m(分),m~B,D(m)=12××=,所以D(X)=25×=.同理,设B学生答对题的个数为n,则得分Y=5n(分),n~B,D(n)=12××=,所以D(Y)=×25=,所以D(Y)-D(X)=-=.
3.(2019·梧州一模)某计算机程序每运行一次都随机出现一个五位数,A=
a1
a2
a3
a4
a5
,其中A的各位数中,a1=1,ak(k=2,3,4,5)出现0的概率为,出现1的概率为,记X=a2+a3+a4+a5,当程序运行一次时,X的数学期望E(X)=________;方差D(X)=________.
答案
解析 由题意得,X~B,∴数学期望E(X)=4×=,方差D(X)=4××=.
4.(2019·东北三省四市教研联合体模拟)某工厂有甲、乙两个车间生产同一种产品,甲车间有工人200人,乙车间有工人400人.为比较两个车间工人的生产效率,采用分层抽样的方法抽取工人.甲车间抽取的工人记作第一组,乙车间抽取的工人记作第二组,并对他们中每位工人生产完成一件产品的时间(单位:min)进行统计,按照[55,65),[65,75),[75,85),[85,95]进行分组,得到下列统计图.
(1)分别估算两个车间工人中,生产一件产品时间少于75 min的人数;
(2)分别估计两个车间工人生产一件产品时间的平均值,并推测哪个车间工人的生产效率更高;
(3)从第一组生产时间少于75 min的工人中随机抽取3人,记抽取的生产时间少于65 min的工人人数为随机变量X,求X的分布列及数学期望.
解 (1)由题意,得第一组工人有20人,其中在75 min内生产完成一件产品的有6人,∴甲车间工人中生产一件产品时间少于75 min的人数为6×10=60.第二组工人有40人,其中在75 min内生产完成一件产品的有40×(0.025+0.050)×10=30(人),
∴乙车间的工人中生产一件产品时间少于75 min的人数为30×10=300.
(2)第一组的平均时间为
甲==78(min),
第二组的平均时间为
乙=60×0.25+70×0.50+80×0.20+90×0.05=70.5(min).
∵甲>乙,∴乙车间工人生产效率更高.
(3)由题意,得第一组生产时间少于75 min的工人有6人,其中生产时间少于65 min的有2人,从中抽取3人,则X可能的取值为0,1,2,且P(X=0)===,P(X=1)===,P(X=2)===,
则X的分布列如下,
X
0
1
2
P
故数学期望E(X)=0×+1×+2×=1.
组 素养关
1.(2019·马鞍山三模)二项分布与正态分布是概率统计中两大非常重要的分布.在现实生活中,很多随机变量都服从或近似地服从这两大分布,例如检查产品的不合格品数,射击比赛中射中目标的次数等近似服从二项分布;长度的测量误差,零件的尺寸,电子管的使用寿命等服从或近似服从正态分布.并且这两大分布的关系非常密切,经研究表明,如果一个随机变量X服从二项分布B(n,p),当np>5且np(1-p)>5时,二项分布就可以用正态分布近似替代即P(X≤x)≈P(Y≤x),其中随机变量Y~N(np,np(1-p)).
(1)如果某射手每次射击击中目标的概率为0.6,每次射击的结果相互独立.
①计算他在连续三次射击中恰连续两次命中目标的概率;
②他在10次射击中,击中目标几次的概率最大?并说明理由;
(2)如果某射手每次射击击中目标的概率为0.8,每次射击的结果相互独立,在100次的射击中,记击中目标的次数为η,计算P(68≤η≤92).
参考数据:ξ~N(μ,σ2),P(μ-σ≤ξ≤μ+σ)≈0.6826,
P(μ-2σ≤ξ≤μ+2σ)≈0.9544,
P(μ-3σ≤ξ≤μ+3σ)≈0.9974.
解 (1)①依题意,设事件Ai(i=1,2,3,…)表示第i次击中目标,i(i=1,2,3,…)表示第i次没有击中目标,B表示连续三次射击中恰连续两次命中目标.
所以P(B)=P(A1A23)+P(1A2A3)
=0.6×0.6×0.4+0.4×0.6×0.6=0.288.
②在10次射击中,击中6次的概率最大.
10次射击中击中目标k次的概率为
Pk=C0.6k(1-0.6)10-k,
由得k=6.
(2)因为E(X)=100×0.8=80>5,
D(X)=100×0.8×0.2=16>5,所以近似为η~N(80,16),所以P(68≤η≤92)=P(80-3×4≤η≤80+3×4)≈0.9974.
2.(2019·湖北宜昌模拟)计算π的最为稀奇的方法之一,要数18世纪法国的博物学家C·蒲丰和他的投针试验:在一个平面上,用尺画一组相距为a的平行线,一根长度为a的针,扔到画了平行线的平面上,如果针与线相交,则该次扔出被认为是有利的,否则是不利的.
如图1,记针的中点为M,设M到平行线的最短距离为y,针与平行线所成角度为x,容易发现随机情况下满足且针与线相交时需y≤sinx.
记试验次数为n,其中有利次数为m,
(1)结合图2,利用几何概率模型计算一次试验结果有利的概率值;
(2)求出该试验中π的估计值;
(3)若试验进行了10000次,以X表示有利次数,试求X的期望(用π表示),并求当π的估计值与实际值误差小于0.01的概率.
附:①P(k)=×i×10000-i
k
6345
6346
6385
6386
P(k)
0.3332
0.3408
0.6556
0.6632
②参考数值:≈0.3193,≈0.3173.
解 (1)由已知条件作出x,y所符合的平面区域,
即为符合y≤sinx的区域,而
S阴影=sinxdx=a,
所以P(有利)===.
(2)因为P(有利)=≈,故π的估计值为.
(3)由题意,得X~B,
所以E(X)=10000·=,
估计值=,所以由-π<0.01,得
由参考数值知6346
故所求概率为P(6346
第9讲 离散型随机变量的均值、方差和正态分布
[考纲解读] 1.理解取有限个值的离散型随机变量的均值、方差的概念,并能根据分布列正确求出期望与方差,并能解决一些实际问题.(重点、难点)
2.借助直方图认识正态分布曲线的特点及曲线所表示的意义,掌握正态曲线的相关性质,并能进行正确求解.
[考向预测] 从近三年高考情况来看,本讲是高考中的热点题型.预计2021年将会考查:①与分布列相结合求期望与方差,通过设置密切贴近现实生活的情景,考查概率思想的应用意识和创新意识;②正态分布的考查,尤其是正态总体在某一区间内的概率.题型为解答题中的一问,试题难度不会太大,属中档题型.
1.离散型随机变量的均值与方差
若离散型随机变量X的分布列为
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
(1)均值:称E(X)=x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平.
(2)D(X)=(xi-E(X))2pi为随机变量X的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,其算术平方根为随机变量X的标准差.
2.均值与方差的性质
(1)E(aX+b)=aE(X)+b;
(2)D(aX+b)=a2D(X)(a,b为常数).
3.两点分布与二项分布的均值、方差
X
X服从两点分布
X~B(n,p)
E(X)
p
np
D(X)
p(1-p)
np(1-p)
4.正态曲线
(1)正态曲线的定义
函数φμ,σ(x)=e-,x∈(-∞,+∞),其中实数μ和σ(σ>0)为参数,称φμ,σ(x)的图象为正态分布密度曲线,简称正态曲线(μ是正态分布的期望,σ是正态分布的标准差).
(2)正态曲线的特点
①曲线位于x轴上方,与x轴不相交;
②曲线是单峰的,关于直线x=μ对称;
③曲线在x=μ处达到峰值;
④曲线与x轴之间的面积为1;
⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移;
⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“高瘦”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.
5.正态分布
(1)正态分布的定义及表示
如果对于任何实数a,b(a (2)正态分布的三个常用数据
①P(μ-σ
1.概念辨析
(1)随机变量不可以是负数,随机变量所对应的概率可以是负数,随机变量的均值不可以是负数.( )
(2)正态分布中的参数μ和σ完全确定了正态分布,参数μ是正态分布的期望,σ是正态分布的标准差.( )
(3)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离均值的平均程度越小. ( )
(4)一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用结果之和,它就服从或近似服从正态分布.( )
答案 (1)× (2)√ (3)√ (4)√
2.小题热身
(1)已知随机变量X的分布列如下,
X
-2
0
2
P
则E(X)与D(X)的值分别为( )
A.0,2 B.0,
C.2,0 D.,0
答案 B
解析 E(X)=(-2)×+0×+2×=0,D(X)=(-2-0)2×+(0-0)2×+(2-0)2×=.
(2)设ξ~B(n,p),若E(ξ)=15,D(ξ)=11.25,则n=( )
A.45 B.50
C.55 D.60
答案 D
解析 由解得
(3)(2019·凉山州模拟)已知随机变量ξ,且ξ~N(μ,σ2),若P(-3<ξ<-1)=P(3<ξ<5),则μ=( )
A.4 B.2
C.1 D.0
答案 C
解析 依题意,P(-3<ξ<-1)=P(3<ξ<5),
又区间(-3,-1)和(3,5)关于x=1对称,
结合正态分布的知识,关于x=μ对称的区域所对应的概率相等,所以μ=1.
(4)已知X的分布列为,且Y=aX+3,E(Y)=,则a为( )
A.1 B.2
C.3 D.4
答案 B
解析 先求出E(X)=(-1)×+0×+1×=-.再由Y=aX+3,得E(Y)=aE(X)+3.
∴=a+3.解得a=2.
题型 一 离散型随机变量的均值、方差
角度1 离散型随机变量均值与方差的计算
问题
1.不透明袋子中装有大小、材质完全相同的2个红球和5个黑球,现从中逐个不放回地摸出小球,直到取出所有红球为止,则摸取次数X的数学期望是( )
A. B.
C. D.
答案 D
解析 当x=k时,第k次取出的必然是红球,而前k-1次中,有且只有1次取出的是红球,其余次数取出的皆为黑球,故P(X=k)==,于是得到X的分布列如下.
X
2
3
4
5
6
7
P
故E(X)=2×+3×+4×+5×+6×+7×=.
2.(2019·济南模拟)已知离散型随机变量X的分布列如表所示,若E(X)=0,D(X)=1,则P(X<1)=________.
X
-1
0
1
2
P
a
b
c
答案
解析 ∵E(X)=0,D(X)=1,
∴
又a,b,c∈[0,1],∴a=,b=,c=,P(X<1)=P(X=-1)+P(X=0)=+=.
角度2 二项分布的均值、方差问题
3.(2019·南阳模拟)设随机变量X~B(2,p),随机变量Y~B(3,p),若P(X≥1)=,则D(3Y+1)=( )
A.2 B.3
C.6 D.7
答案 C
解析 ∵随机变量X~B(2,p),P(X≥1)=,
∴P(X=0)=C(1-p)2=.∴p=,
∴D(Y)=np(1-p)=3××=,
∴D(3Y+1)=9D(Y)=6.
4.(2019·泉州模拟)2018年,依托用户碎片化时间的娱乐需求、分享需求以及视频态的信息负载力,短视频快速崛起.与此同时,移动阅读方兴未艾,从侧面反映了人们对精神富足的一种追求,在习惯了大众娱乐所带来的短暂愉悦后,部分用户依旧对有着传统文学底蕴的严肃阅读青睐有加.某读书App抽样调查了非一线城市M和一线城市N各100名用户的日使用时长(单位:分),绘制成频率分布直方图如下,其中日使用时长不低于60分钟的用户记为“活跃用户”.
(1)请填写以下2×2列联表,并判断是否有99.5%的把握认为用户活跃与否与所在城市有关?
活跃用户
不活跃用户
总计
城市M
城市N
总计
(2)以频率估计概率,从城市M中任选2名用户,从城市N中任选1名用户,设这3名用户中活跃用户的人数为ξ,求ξ的分布列和数学期望;
(3)该读书App还统计了2019年4个季度的用户使用时长y(单位:百万小时),发现y与季度(x)线性相关,得到回归直线方程为=4x+.已知这4个季度的用户平均使用时长为12.3百万小时,试以此回归方程估计2020年第一季度(x=5)该读书App用户使用时长约为多少百万小时.
附:K2=,其中n=a+b+c+d.
P(K2≥k0)
0.025
0.010
0.005
0.001
k0
5.024
6.635
7.879
10.828
解 (1)由已知条件可得以下2×2列联表:
活跃用户
不活跃用户
总计
城市M
60
40
100
城市N
80
20
100
总计
140
60
200
因为K2==≈9.524>7.879,
所以有99.5%的把握认为用户是否活跃与所在城市有关.
(2)由统计数据可知,城市M中活跃用户占,城市N中活跃用户占.
设从城市M中任选的2名用户中活跃用户数为X,则X~B.
设从城市N中任选的1名用户中活跃用户数为Y,
则Y服从两点分布,其中P(Y=1)=.
由题意可得,ξ的所有可能的取值为0,1,2,3.
P(ξ=0)=P(X=0)·P(Y=0)=C·2·=;
P(ξ=1)=P(X=0)·P(Y=1)+P(X=1)·P(Y=0)=C·2·+C···=;
P(ξ=2)=P(X=1)·P(Y=1)+P(X=2)·P(Y=0)=C···+C·2·=;
P(ξ=3)=P(X=2)·P(Y=1)=C·2·=.
所以ξ的分布列为
ξ
0
1
2
3
P
E(ξ)=0×+1×+2×+3×=2.
(3)由已知条件得==2.5.
又=12.3,
代入=4x+,得12.3=4×2.5+,解得=2.3,所以=4x+2.3.
将x=5代入上式,得=4×5+2.3=22.3(百万小时),
所以2020年第一季度该读书App用户使用时长约为22.3百万小时.
角度3 超几何分布的均值、方差问题
5.(2019·青岛二中模拟)随着经济的发展和个人收入的提高,自2018年10月1日起,个人所得税起征点和税率依法进行调整.其中,纳税人的工资、薪金所得,先行以每月收入额减除费用五千元以及专项扣除和依法确定的其他扣除后的余额为应纳税所得额,依照个人所得税税率表,调整前后的计算方法如下表:
个人所得税税率表(调整前)
免征额3500元
级数
全月应纳税所得额
税率(%)
1
不超过1500元的部分
3
2
超过1500元至4500元的部分
10
3
超过4500元至9000元的部分
20
…
…
…
个人所得税税率表(调整后)
免征额5000元
级数
全月应纳税所得额
税率(%)
1
不超过3000元的部分
3
2
超过3000元至12000元的部分
10
3
超过12000元至25000元的部分
20
…
…
…
(1)假如小李某月的工资、薪金等所得税前收入为7500元(无专项扣除和依法确定的其他扣除),请你帮小李算一下调整后小李的实际收入比调整前增加了多少?
(2)某税务部门在小李所在公司利用分层抽样方法抽取某月100个不同级别员工的税前收入,并制成下面的频数分布表:
收入/元
[3000,
5000)
[5000,
7000)
[7000,
9000)
[9000,
11000)
[11000,
13000)
[13000,
15000]
人数
30
40
10
8
7
5
先从收入在[3000,5000)及[5000,7000)的员工中按分层抽样抽取7人,再从中选4人作为新纳税法知识宣讲员.用a表示抽到作为宣讲员的收入在[3000,5000)元的人数,b表示抽到作为宣讲员的收入在[5000,7000)元的人数.设随机变量Z=|a-b|,求Z的分布列、数学期望及方差.
解 (1)由于小李的工资、薪金等所得税前收入为7500元,按调整前起征点应纳个税为1500×3%+2500×10%=295(元).
按调整后起征点应纳个税为2500×3%=75(元).
比较两个纳税方案可知,按调整后起征点应纳个税比调整前少交220元.
所以调整后小李的实际收入比调整前增加了220元.
(2)①由频数分布表可知从收入在[3000,5000)及[5000,7000)的员工中抽取7个,其中收入在[3000,5000)内的有3人,收入在[5000,7000)内的有4人,再从这7人中选4人,所以Z的所有可能的取值为0,2,4.
P(Z=0)=P(a=2,b=2)==,
P(Z=2)=P(a=1,b=3)+P(a=3,b=1)
==,
P(Z=4)=P(a=0,b=4)==.
所以Z的分布列如下,
Z
0
2
4
P
数学期望E(Z)=0×+2×+4×=.
方差D(Z)=×2+×2+×2=.
(1)求离散型随机变量X的均值与方差的步骤
①理解X的意义,写出X的全部可能取值.
②求X取每个值的概率.
③写出X的分布列.
④由均值的定义求E(X).
⑤由方差的定义求D(X).
(2)注意性质的应用:若随机变量X的均值为E(X),则对应随机变量aX+b的均值是aE(X)+b,方差为a2D(X).
(3)如果ξ~B(n,p),则用公式E(ξ)=np,D(ξ)=np(1-p)求解,可大大减少计算量.见举例说明3.
1.(2020·南充市高三摸底)设离散型随机变量X可能的取值为1,2,3,4,P(X=k)=ak+b,又X的数学期望为E(X)=3,则a-b=( )
A. B.0
C.- D.
答案 A
解析 设离散型随机变量ξ可能取的值为1,2,3,4.P(ξ=k)=ak+b(k=1,2,3,4),∴(a+b)+(2a+b)+(3a+b)+(4a+b)=1,即10a+4b=1,又ξ的数学期望E(ξ)=3,则(a+b)+2(2a+b)+3(3a+b)+4(4a+b)=3,即30a+10b=3,a=,b=0,∴a-b=.
2.(2019·沈阳模拟)随着移动互联网的发展,与餐饮美食相关的手机软件层出不穷.为调查某款订餐软件上商家的服务情况,统计了10次订餐“送达时间”(单位:分),得到茎叶图如下:
(1)请计算“送达时间”的平均数与方差;
(2)根据茎叶图填写下表:
送达时间
35分钟以内(包括35分钟)
超过35分钟
频数
A
B
频率
C
D
(3)在(2)的情况下,以频率代替概率.现有3个客户用此软件订餐,求出在35分钟以内(包括35分钟)收到餐品的人数X的分布列,并求出数学期望.
解 (1)“ 送达时间”的平均数为
=35(分),
方差为×[(28-35)2+(29-35)2+(32-35)2+(34-35)2+(34-35)2+(35-35)2+(36-35)2+(38-35)2+(41-35)2+(43-35)2]=20.6.
(2)A=6,B=4,C=0.6,D=0.4.
(3)由题意知,在35分钟以内(包括35分钟)收到餐品的人数X的所有可能的取值为0,1,2,3.
P(X=0)=C×0.60×0.43=0.064;
P(X=1)=C×0.6×0.42=0.288;
P(X=2)=C×0.62×0.4=0.432;
P(X=3)=C×0.63×0.40=0.216.
所以X的分布列如下,
X
0
1
2
3
P
0.064
0.288
0.432
0.216
所以E(X)=0×0.064+1×0.288+2×0.432+3×0.216=1.8(或X服从二项分布B(3,0.6),E(X)=3×0.6=1.8).
3.(2019·漳州二模)某市电视台举办纪念红军长征胜利知识回答活动,宣传长征精神,首先在甲、乙、丙、丁四个不同的公园进行支持签名活动.
公园
甲
乙
丙
丁
获得签名人数
45
60
30
15
然后在各公园签名的人中按分层抽样的方式抽取10名幸运之星回答问题,从10个关于长征的问题中随机抽取4个问题让幸运之星回答,全部答对的幸运之星获得一份纪念品.
(1)求此活动中各公园幸运之星的人数;
(2)若乙公园中每位幸运之星对每个问题答对的概率均为,求乙公园中恰好2位幸运之星获得纪念品的概率;
(3)若幸运之星小李对其中8个问题能答对,而另外2个问题答不对,记小李答对的问题数为X,求X的分布列、期望及方差.
解 (1)甲、乙、丙、丁四个公园幸运之星的人数分别为×10=3,×10=4,×10=2,×10=1.
(2)根据题意,乙公园中每位幸运之星获得纪念品的概率为C4=,
所以乙公园中恰好2位幸运之星获得纪念品的概率为C22=.
(3)由题意,知X的所有可能取值2,3,4,服从超几何分布,P(X=2)==,
P(X=3)==,P(X=4)==.
所以X的分布列为
X
2
3
4
P
期望E(X)=2×+3×+4×=,
方差D(X)=×2+×2+×2=.
题型 二 均值与方差在决策中的应用
(2019·南昌模拟)市面上有某品牌A型和B型两种节能灯,假定A型节能灯使用寿命都超过5000小时.经销商对B型节能灯使用寿命进行了调查统计,得到如下频率分布直方图,
某商家因原店面需重新装修,需租赁一家新店面进行周转,合约期一年.新店面需安装该品牌节能灯5只(同种型号)即可正常营业.经了解,A型20瓦和B型55瓦的两种节能灯照明效果相当,都适合安装.已知A型和B型节能灯每只的价格分别为120元、25元,当地商业电价为0.75元/千瓦时.假定该店面正常营业一年的照明时间为3600小时,若正常营业期间灯坏了立即购买同型灯更换.(用频率估计概率)
(1)若该商家新店面全部安装了B型节能灯,求一年内恰好更换了2只灯的概率;
(2)若只考虑灯的成本和消耗电费,你认为该商家应选择哪种型号的节能灯,请说明理由.
解 (1)由频率分布直方图可知,B型节能灯使用寿命超过3600小时的频率为0.0010×(3800-3600)=0.2.用频率估计概率,得B型节能灯使用寿命超过3600小时的概率为.
所以一年内一只B型节能灯在使用期间需要更换的概率为.
所以一年内5只节能灯恰好更换了2只的概率为
C2×3=.
(2)该商家应选择A型节能灯.理由如下:
一共需要安装5只同种节能灯.
若选择A型节能灯,一年共需花费5×120+3600×5×20×0.75×10-3=870(元).
若选择B型节能灯,由于B型节能灯一年内需更换的只数服从二项分布B,所以一年需更换灯的只数的数学期望为5×=4(只).
所以一年共需花费(5+4)×25+3600×5×55×0.75×10-3=967.5(元).
因为967.3>870,所以该商家应选择A型节能灯.
解离散型随机变量的期望和方差应用问题的方法
(1)求离散型随机变量的期望与方差关键是确定随机变量的所有可能值,写出随机变量的分布列,正确运用期望、方差公式进行计算.
(2)要注意观察随机变量的概率分布特征,若属于二项分布,可用二项分布的期望与方差公式计算,则更为简单.
(3)在实际问题中,若两个随机变量ξ1,ξ2,有E(ξ1)=E(ξ2)或E(ξ1)与E(ξ2)较为接近时,就需要用D(ξ1)与D(ξ2)来比较两个随机变量的稳定程度.即一般地将期望最大(或最小)的方案作为最优方案,若各方案的期望相同,则选择方差最小(或最大)的方案作为最优方案.
(2019·湖北四地七校联考)有甲、乙两家公司都需要招聘求职者,这两家公司的聘用信息如下:
甲公司
乙公司
职位
A
B
C
D
职位
A
B
C
D
月薪/元
6000
7000
8000
9000
月薪/元
5000
7000
9000
11000
获得相应
职位概率
0.4
0.3
0.2
0.1
获得相应
职位概率
0.4
0.3
0.2
0.1
(1)根据以上信息,如果你是该求职者,你会选择哪一家公司?说明理由;
(2)某课外实习作业小组调查了1000名职场人士,就选择这两家公司的意愿做了统计,得到以下数据分布:
选择意愿
人员结构
40岁以上(含
40岁)男性
40岁以上(含
40岁)女性
40岁以
下男性
40岁以
下女性
选择甲公司
110
120
140
80
选择乙公司
150
90
200
110
若分析选择意愿与年龄这两个分类变量,计算得到的K2的观测值为k1=5.5513,则得出“选择意愿与年龄有关系”的结论犯错误的概率的上限是多少?并用统计学知识分析,选择意愿与年龄变量和性别变量哪一个关联性更大?
附:K2=,n=a+b+c+d.
P(K2≥k0)
0.050
0.025
0.010
0.005
k0
3.841
5.024
6.635
7.879
解 (1)设甲公司与乙公司的月薪分别为随机变量X,Y,
则E(X)=6000×0.4+7000×0.3+8000×0.2+9000×0.1=7000,
E(Y)=5000×0.4+7000×0.3+9000×0.2+11000×0.1=7000,
D(X)=(6000-7000)2×0.4+(7000-7000)2×0.3+(8000-7000)2×0.2+(9000-7000)2×0.1=10002,
D(Y)=(5000-7000)2×0.4+(7000-7000)2×0.3+(9000-7000)2×0.2+(11000-7000)2×0.1=20002,
则E(X)=E(Y),D(X)<D(Y),
我希望不同职位的月薪差距小一些,故选择甲公司;
或我希望不同职位的月薪差距大一些,故选择乙公司.
(2)因为k1=5.5513>5.024,根据表中对应值,
得出“选择意愿与年龄有关系”的结论犯错误的概率的上限是0.025,
由数据分布可得选择意愿与性别两个分类变量的2×2列联表如下:
选择甲公司
选择乙公司
总计
男
250
350
600
女
200
200
400
总计
450
550
1000
计算K2==≈6.734,
且K2=6.734>6.635,
对照临界值表得出结论“选择意愿与性别有关”的犯错误的概率上限为0.01,
由0.01<0.025,所以与年龄相比,选择意愿与性别关联性更大.
题型 三 正态分布的应用
1.设X~N(1,1),其正态分布密度曲线如图所示,那么向正方形ABCD中随机投掷10000个点,则落入阴影部分的点的个数的估计值是( )
(注:若X~N(μ,σ2),则P(μ-σ
A.7539 B.6038
C.7028 D.6587
答案 D
解析 ∵X~N(1,1),∴μ=1,σ=1,μ+σ=2,
∵P(μ-σ<X≤μ+σ)=68.26%,∴则P(0<X≤2)=68.26%,
则P(1<X≤2)=34.13%,
∴阴影部分的面积为0.6587,
∴点落入题图中阴影部分的概率P==0.6587.
∴正方形ABCD中随机投掷10000个点,则落入阴影部分的点的个数的估计值是6587.故选D.
条件探究 若将本例中“正方形”改为“矩形”,“X~N(1,1)”变为“X~N(-1,1),阴影部分如图所示”,则落入阴影部分的点的个数的估计值是________.
答案 9547
解析 对于正态分布N(-1,1),可知μ=-1,σ=1,正态曲线关于直线x=-1对称,故P(0
投入10000个点,落入阴影部分的个数约为10000×0.9547=9547.
2.(2019·蚌埠三模)我市高三年级第二次质量检测的数学成绩X近似服从正态分布N(82,σ2),且P(74
解析 因为数学成绩X近似服从正态分布N(82,σ2),所以数学成绩X关于X=82对称,因为P(74
正态分布下两类常见的概率计算
(1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x=μ对称,曲线与x轴之间的面积为1.
(2)利用3σ原则求概率问题时,要注意把给出的区间或范围与正态变量的μ,σ进行对比联系,确定它们属于(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)中的哪一个.
1.设两个正态分布N(μ1,σ)(σ1>0)和N(μ2,σ)(σ2>0)的密度函数图象如图所示,则有( )
A.μ1<μ2,σ1<σ2 B.μ1<μ2,σ1>σ2
C.μ1>μ2,σ1<σ2 D.μ1>μ2,σ1>σ2
答案 A
解析 μ反映正态分布的平均水平,x=μ是正态曲线的对称轴,由图知μ1<μ2,σ反映正态分布的离散程度,σ越大,曲线越“矮胖”,表明越分散,σ越小,曲线越“高瘦”,表明越集中,由图知σ1<σ2.
2.(2019·九江三模)已知某公司生产的一种产品的质量X(单位:千克)服从正态分布N(90,64).现从该产品的生产线上随机抽取10000件产品,其中质量在区间(82,106)内的产品估计有(若X~N(μ,σ2),则P(μ-σ
C.4772件 D.2718件
答案 A
解析 依题意,μ=90,σ=8,∴P(82
组 基础关
1.(2019·保定二模)已知随机变量ξ服从正态分布N(μ,σ2),若P(ξ<2)=P(ξ>6)=0.1,则P(2≤ξ<4)为( )
A.0.7 B.0.5
C.0.4 D.0.35
答案 C
解析 由P(ξ<2)=P(ξ>6)=0.1,可得μ=4,且P(2≤ξ<4)=×(1-0.1×2)=0.4.
2.已知随机变量X+Y=8,若X~B(10,0.6),则E(Y),D(Y)分别是( )
A.6和2.4 B.2和2.4
C.2和5.6 D.6和5.6
答案 B
解析 由已知随机变量X+Y=8,所以Y=8-X.因此,求得E(Y)=8-E(X)=8-10×0.6=2,D(Y)=(-1)2D(X)=10×0.6×0.4=2.4.故选B.
3.(2019·湖南湘西二模)已知甲、乙两台自动车床生产同一种零件,X表示甲车床生产1000件产品中的次品数,
Y表示乙车床生产1000件产品中的次品数,经考察一段时间,X,Y的分布列分别是
X
0
1
2
3
P
0.7
0.1
0.1
0.1
Y
0
1
2
P
0.5
0.3
0.2
据此判断( )
A.甲比乙生产的产品质量好
B.乙比甲生产的产品质量好
C.甲与乙生产的产品质量相同
D.无法判断
答案 A
解析 E(X)=0×0.7+1×0.1+2×0.1+3×0.1=0.6,E(Y)=0×0.5+1×0.3+2×0.2=0.7.由于E(Y)>E(X),故甲比乙生产的产品质量好.
4.(2020·浙江嘉兴适应性训练)随机变量X的分布列如下表,且E(X)=2,则D(2X-3)=( )
X
0
2
a
P
p
A.2 B.3
C.4 D.5
答案 C
解析 p=1--=,E(X)=0×+2×+a×=2⇒a=3,∴D(X)=(0-2)2×+(2-2)2×+(3-2)2×=1.∴D(2X-3)=22D(X)=4.
5.(2019·广州二模)从某班6名学生(其中男生4人,女生2人)中任选3人参加学校组织的社会实践活动.设所选3人中女生人数为ξ,则数学期望E(ξ)=( )
A. B.1
C. D.2
答案 B
解析 因为ξ=0,1,2,所以P(ξ=0)==,P(ξ=1)==,P(ξ=2)==,因此E(ξ)=0×+1×+2×=1.
6.(2019·浙江金丽衢十二校第一次联考)五人进行过关游戏,每人随机出现左路和右路两种选择.若选择同一条路的人数超过2人,则他们每人得1分;若选择同一条路的人数小于3人,则他们每人得0分,记小强游戏得分为ξ,则E(ξ)=( )
A. B.
C. D.
答案 B
解析 五人进行过关游戏,每人随机出现左路和右路两种选择.若选择同一条路的人数超过2人,则他们每人得1分;若选择同一条路的人数小于3人,则他们每人得0分,∴P(ξ=1)=C2·2+C3+C4= ,P(ξ=0)=1-= ,∴E(ξ)=1×+0×=.
7.已知抛物线y=ax2+bx+c(a≠0)的对称轴在y轴的左侧,其中a,b,c∈{-3,-2,-1,0,1,2,3},在这些抛物线中记随机变量ξ=“|a-b|的取值”,则ξ的数学期望E(ξ)为( )
A. B.
C. D.
答案 A
解析 由于对称轴在y轴左侧,故-<0,故a,b同号,基本事件有3×3×7×2=126,ξ的可能取值有0,1,2三种.P(ξ=0)==,P(ξ=1)==,P(ξ=2)==,故期望值为0×+1×+2×=,故选A.
8.(2019·日照模拟)某市高三理科学生有15000名,在一次调研测试中,数学成绩ξ服从正态分布N(100,σ2),已知P(80<ξ≤100)=0.40,若按成绩分层抽样的方式取100份试卷进行分析,则应从120分以上的试卷中抽取的份数为________.
答案 10
解析 P(ξ>120)=[1-2P(80<ξ≤100)]=0.10,
所以应从120分以上的试卷中抽取100×0.10=10份.
9.(2019·绵阳模拟)一个盒子装有3个红球和2个蓝球(小球除颜色外其他均相同),从盒子中一次性随机取出3个小球后,再将小球放回.重复50次这样的实验.记“取出的3个小球中只有2个红球,1个蓝球”发生的次数为ξ,则ξ的方差是________.
答案 12
解析 由题意知ξ~B(n,p),其中n=50,P===,所以D(ξ)=50××=12.
10.一个人将编号为1,2,3,4的四个小球随机放入编号为1,2,3,4的四个盒子中,每个盒子放一个小球,球的编号与盒子的编号相同时叫做放对了,否则叫做放错了.设放对的个数为ξ,则ξ的期望值为________.
答案 1
解析 将四个小球放入四个盒子,每个盒子放一个小球,共有A种不同放法,放对的个数ξ可取的值有0,1,2,4.其中,P(ξ=0)==,P(ξ=1)==,P(ξ=2)==,P(ξ=4)==,所以E(ξ)=0×+1×+2×+4×=1.
组 能力关
1.已知5台机器中有2台存在故障,现需要通过逐台检测直至区分出2台故障机器为止.若检测一台机器的费用为1000元,则所需检测费用的均值为( )
A.3200 B.3400 C.3500 D.3600
答案 C
解析 设检测的机器的台数为X,则X的所有可能取值为2,3,4.P(X=2)==,P(X=3)==,P(X=4)==,所以E(X)=2×+3×+4×=3.5,所以所需检测费用的均值为1000×3.5=3500.
2.(2019·巢湖模拟)某次考试共有12个选择题,每个选择题的分值为5分,每个选择题四个选项且只有一个选项是正确的,A学生对12个选择题中每个题的四个选项都没有把握,最后选择题的得分为X,B学生对12个选择题中每个题的四个选项都能判断其中有一个选项是错误的,对其他三个选项都没有把握,选择题的得分为Y,则D(Y)-D(X)的值为( )
A. B.
C. D.
答案 A
解析 设A学生答对题的个数为m,则得分X=5m(分),m~B,D(m)=12××=,所以D(X)=25×=.同理,设B学生答对题的个数为n,则得分Y=5n(分),n~B,D(n)=12××=,所以D(Y)=×25=,所以D(Y)-D(X)=-=.
3.(2019·梧州一模)某计算机程序每运行一次都随机出现一个五位数,A=
a1
a2
a3
a4
a5
,其中A的各位数中,a1=1,ak(k=2,3,4,5)出现0的概率为,出现1的概率为,记X=a2+a3+a4+a5,当程序运行一次时,X的数学期望E(X)=________;方差D(X)=________.
答案
解析 由题意得,X~B,∴数学期望E(X)=4×=,方差D(X)=4××=.
4.(2019·东北三省四市教研联合体模拟)某工厂有甲、乙两个车间生产同一种产品,甲车间有工人200人,乙车间有工人400人.为比较两个车间工人的生产效率,采用分层抽样的方法抽取工人.甲车间抽取的工人记作第一组,乙车间抽取的工人记作第二组,并对他们中每位工人生产完成一件产品的时间(单位:min)进行统计,按照[55,65),[65,75),[75,85),[85,95]进行分组,得到下列统计图.
(1)分别估算两个车间工人中,生产一件产品时间少于75 min的人数;
(2)分别估计两个车间工人生产一件产品时间的平均值,并推测哪个车间工人的生产效率更高;
(3)从第一组生产时间少于75 min的工人中随机抽取3人,记抽取的生产时间少于65 min的工人人数为随机变量X,求X的分布列及数学期望.
解 (1)由题意,得第一组工人有20人,其中在75 min内生产完成一件产品的有6人,∴甲车间工人中生产一件产品时间少于75 min的人数为6×10=60.第二组工人有40人,其中在75 min内生产完成一件产品的有40×(0.025+0.050)×10=30(人),
∴乙车间的工人中生产一件产品时间少于75 min的人数为30×10=300.
(2)第一组的平均时间为
甲==78(min),
第二组的平均时间为
乙=60×0.25+70×0.50+80×0.20+90×0.05=70.5(min).
∵甲>乙,∴乙车间工人生产效率更高.
(3)由题意,得第一组生产时间少于75 min的工人有6人,其中生产时间少于65 min的有2人,从中抽取3人,则X可能的取值为0,1,2,且P(X=0)===,P(X=1)===,P(X=2)===,
则X的分布列如下,
X
0
1
2
P
故数学期望E(X)=0×+1×+2×=1.
组 素养关
1.(2019·马鞍山三模)二项分布与正态分布是概率统计中两大非常重要的分布.在现实生活中,很多随机变量都服从或近似地服从这两大分布,例如检查产品的不合格品数,射击比赛中射中目标的次数等近似服从二项分布;长度的测量误差,零件的尺寸,电子管的使用寿命等服从或近似服从正态分布.并且这两大分布的关系非常密切,经研究表明,如果一个随机变量X服从二项分布B(n,p),当np>5且np(1-p)>5时,二项分布就可以用正态分布近似替代即P(X≤x)≈P(Y≤x),其中随机变量Y~N(np,np(1-p)).
(1)如果某射手每次射击击中目标的概率为0.6,每次射击的结果相互独立.
①计算他在连续三次射击中恰连续两次命中目标的概率;
②他在10次射击中,击中目标几次的概率最大?并说明理由;
(2)如果某射手每次射击击中目标的概率为0.8,每次射击的结果相互独立,在100次的射击中,记击中目标的次数为η,计算P(68≤η≤92).
参考数据:ξ~N(μ,σ2),P(μ-σ≤ξ≤μ+σ)≈0.6826,
P(μ-2σ≤ξ≤μ+2σ)≈0.9544,
P(μ-3σ≤ξ≤μ+3σ)≈0.9974.
解 (1)①依题意,设事件Ai(i=1,2,3,…)表示第i次击中目标,i(i=1,2,3,…)表示第i次没有击中目标,B表示连续三次射击中恰连续两次命中目标.
所以P(B)=P(A1A23)+P(1A2A3)
=0.6×0.6×0.4+0.4×0.6×0.6=0.288.
②在10次射击中,击中6次的概率最大.
10次射击中击中目标k次的概率为
Pk=C0.6k(1-0.6)10-k,
由得k=6.
(2)因为E(X)=100×0.8=80>5,
D(X)=100×0.8×0.2=16>5,所以近似为η~N(80,16),所以P(68≤η≤92)=P(80-3×4≤η≤80+3×4)≈0.9974.
2.(2019·湖北宜昌模拟)计算π的最为稀奇的方法之一,要数18世纪法国的博物学家C·蒲丰和他的投针试验:在一个平面上,用尺画一组相距为a的平行线,一根长度为a的针,扔到画了平行线的平面上,如果针与线相交,则该次扔出被认为是有利的,否则是不利的.
如图1,记针的中点为M,设M到平行线的最短距离为y,针与平行线所成角度为x,容易发现随机情况下满足且针与线相交时需y≤sinx.
记试验次数为n,其中有利次数为m,
(1)结合图2,利用几何概率模型计算一次试验结果有利的概率值;
(2)求出该试验中π的估计值;
(3)若试验进行了10000次,以X表示有利次数,试求X的期望(用π表示),并求当π的估计值与实际值误差小于0.01的概率.
附:①P(k)=×i×10000-i
k
6345
6346
6385
6386
P(k)
0.3332
0.3408
0.6556
0.6632
②参考数值:≈0.3193,≈0.3173.
解 (1)由已知条件作出x,y所符合的平面区域,
即为符合y≤sinx的区域,而
S阴影=sinxdx=a,
所以P(有利)===.
(2)因为P(有利)=≈,故π的估计值为.
(3)由题意,得X~B,
所以E(X)=10000·=,
估计值=,所以由-π<0.01,得
相关资料
更多