


2020年高考数学理科一轮复习讲义:第10章计数原理、概率、随机变量及其分布第9讲
展开第9讲 离散型随机变量的均值、方差和正态分布
[考纲解读] 1.理解取有限个值的离散型随机变量的均值、方差的概念,并能根据分布列正确求出期望与方差,并能解决一些实际问题.(重点、难点) 2.借助直方图认识正态分布曲线的特点及曲线所表示的意义,掌握正态曲线的相关性质,并能进行正确求解.
|
[考向预测] 从近三年高考情况来看,本讲是高考中的热点题型. 预计2020年将会考查:①与分布列相结合求期望与方差,通过设置密切贴近现实生活的情景,考查概率思想的应用意识和创新意识;②正态分布的考查,尤其是正态总体在某一区间内的概率. 题型为解答题中的一问,试题难度不会太大,属中档题型. |
1.离散型随机变量的均值与方差
若离散型随机变量X的分布列为
X | x1 | x2 | … | xi | … | xn |
P | p1 | p2 | … | pi | … | pn |
(1)均值:称E(X)=x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平.
(2)D(X)=(xi-E(X))2pi为随机变量X的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,其算术平方根为随机变量X的标准差.
2.均值与方差的性质
(1)E(aX+b)=aE(X)+b;
(2)D(aX+b)=a2D(X)(a,b为常数).
3.两点分布与二项分布的均值、方差
4.正态曲线
(1)正态曲线的定义
函数φμ,σ(x)=e,x∈(-∞,+∞),其中实数μ和σ(σ>0)为参数,称φμ,σ(x)的图象为正态分布密度曲线,简称正态曲线(μ是正态分布的期望,σ是正态分布的标准差).
(2)正态曲线的特点
①曲线位于x轴上方,与x轴不相交;
②曲线是单峰的,关于直线x=μ对称;
③曲线在x=μ处达到峰值;
④曲线与x轴之间的面积为1;
⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移;
⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“高瘦”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.
5.正态分布
(1)正态分布的定义及表示
如果对于任何实数a,b(a<b),随机变量X满足P(a<X≤b)=φμ,σ(x)dx(即x=a,x=b,正态曲线及x轴围成的曲边梯形的面积),则称随机变量X服从正态分布,记作X~N(μ,σ2).
(2)正态分布的三个常用数据
①P(μ-σ<X≤μ+σ)=0.6826;
②P(μ-2σ<X≤μ+2σ)=0.9544;
③P(μ-3σ<X≤μ+3σ)=0.9974.
1.概念辨析
(1)随机变量不可以是负数,随机变量所对应的概率可以是负数,随机变量的均值不可以是负数.( )
(2)正态分布中的参数μ和σ完全确定了正态分布,参数μ是正态分布的期望,σ是正态分布的标准差.( )
(3)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离均值的平均程度越小. ( )
(4)一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用结果之和,它就服从或近似服从正态分布.( )
答案 (1)× (2)√ (3)√ (4)√
2.小题热身
(1)已知随机变量X的分布列为
X | -2 | 0 | 2 |
P |
则E(X)与D(X)的值分别为( )
A.0,2 B.0, C.2,0 D.,0
答案 B
解析 E(X)=(-2)×+0×+2×=0,D(X)=(-2-0)2×+(0-0)2×+(2-0)2×=.
(2)设ξ~B(n,p),若E(ξ)=15,D(ξ)=11.25,则n=( )
A.45 B.50 C.55 D.60
答案 D
解析 由解得
A.1 B.2 C.3 D.4
答案 B
解析 先求出E(X)=(-1)×+0×+1×=-.
再由Y=aX+3得E(Y)=aE(X)+3.
∴=a+3.解得a=2.
(4)已知随机变量X服从正态分布N(3,1),且P(X>2c-1)=P(X<c+3),则c=________.
答案
解析 因为μ=3,所以正态曲线关于直线x=3对称,
于是=3,解得c=.
题型 离散型随机变量的均值、方差
角度1 已知离散型随机变量的均值与方差,求参数值
1.已知离散型随机变量X的分布列为
X | 6 | 3 | 2 |
P | a | b | c |
其中a,b,c成等差数列,且E(X)=3,则D(X)=( )
A. B. C.2 D.3
答案 C
解析 由题意,得解得所以D(X)=(6-3)2×+(3-3)2×+(2-3)2×=+=2.
角度2 二项分布的均值、方差问题
2.由中央电视台综合频道(CCTV-1)和唯众传媒联合制作的《开讲啦》是中国首档青年电视公开课.每期节目由一位知名人士讲述自己的故事,分享他们对于生活和生命的感悟,给予中国青年现实的讨论和心灵的滋养,讨论青年们的人生问题,同时也在讨论青春中国的社会问题,受到青年观众的喜爱,为了了解观众对节目的喜爱程度,电视台随机调查了A,B两个地区的100名观众,得到如下的2×2列联表:
已知在被调查的100名观众中随机抽取1名,该观众是B地区当中“非常满意”的观众的概率为0.35,且4y=3z.
(1)现从100名观众中用分层抽样的方法抽取20名进行问卷调查,则应抽取“满意”的A,B地区的人数各是多少;
(2)完成上述表格,并根据表格判断是否有95%的把握认为观众的满意程度与所在地区有关系;
(3)若以抽样调查的频率为概率,从A地区随机抽取3人,设抽到的观众“非常满意”的人数为X,求X的分布列和期望.
P(K2≥k0) | 0.050 | 0.010 | 0.001 |
k0 | 3.841 | 6.635 | 10.828 |
附:参考公式:K2=.
解 (1)由题意,得=0.35,所以x=35,所以y+z=35,因为4y=3z,所以y=15,z=20,A地抽取15×=3,B地抽取20×=4.
(2)
| 非常满意 | 满意 | 合计 |
A | 30 | 15 | 45 |
B | 35 | 20 | 55 |
合计 | 65 | 35 | 100 |
K2==≈0.1<3.841,
所以没有95%的把握认为观众的满意程度与所在地区有关系.
(3)从A地区随机抽取1人,抽到的观众“非常满意”的概率为P=,随机抽取3人,X的可能取值为0,1,2,3,
P(X=0)=3=,
P(X=1)=C2==,
P(X=2)=C2==,
P(X=3)=3=,
X | 0 | 1 | 2 | 3 |
P |
因为X~B,所以E(X)=3×=2.
角度3 非二项分布的均值、方差问题
3.某省级示范性高中高三年级实验班和普通班在一个学期共同进行了四次大型考试,从年级的角度,对数学试卷中每道题的区分度作如下规定:区分度q1=实验班的得分率-普通班的得分率,当q1<0.3时,认为该题区分度不好.从班级的角度,若在某实验班进行抽样调查,研究第12题的区分度,从班级数学成绩前8名的同学中随机抽取2人,后8名的同学中随机抽取2人,并且以抽取的4人的答题结果为依据计算区分度,区分度q2=前8名同学中抽取的2名同学答题的正确率-后8名同学中抽取的2名同学答题的正确率,当q2<0.3时,认为该题区分度不好.
(1)对于第16题,从年级的角度,按以往经验,若区分度不好的概率为p,四次考试至少有一次区分度不好的概率为0.9375,求p的值;
(2)已知实验班数学成绩的前8名同学中有7人答对第12题,后8名同学中有4人答对第12题.
①根据抽样结果,求认为该题区分度不好的概率;
②在抽取的4人中,ξ为答对第12题的人数,写出ξ的分布列,并求E(ξ).
解 (1)1-(1-p)4=0.9375⇒p=0.5.
(2)①“认为该题区分度不好”可分为以下几个互斥事件:
从前8名同学中抽到的2人中有1人未答对,且从后8名同学中抽到的2人中至多有1人未答对,所求概率为·=;
从前8名同学中抽到的2人全答对,且从后8名同学中抽到的2人全答对,所求概率为·=.
故“认为该题区分度不好”的概率为+=.
②由题意知,ξ=1,2,3,4,
P(ξ=1)=·=,
P(ξ=2)=·+·=,
P(ξ=3)=·+·=,
P(ξ=4)=·=,
所以ξ的分布列为
ξ | 1 | 2 | 3 | 4 |
P |
E(ξ)=1×+2×+3×+4×=.
(1)求离散型随机变量X的均值与方差的步骤
①理解X的意义,写出X的全部可能取值.
②求X取每个值的概率.
③写出X的分布列.
④由均值的定义求E(X).
⑤由方差的定义求D(X).
(2)注意性质的应用:若随机变量X的均值为E(X),则对应随机变量aX+b的均值是aE(X)+b,方差为a2D(X).
(3)如果ξ~B(n,p),则用公式E(ξ)=np,D(ξ)=np(1-p)求解,可大大减少计算量.见举例说明2.
1.体育课的排球发球项目考试的规则是:每位学生最多可发球3次,一旦发球成功,则停止发球,否则一直发到3次为止.设某学生一次发球成功的概率为p(p≠0),发球次数为X,若X的数学期望E(X)>1.75,则p的取值范围是( )
A. B. C. D.
答案 B
解析 根据题意,学生一次发球成功的概率为p,即P(X=1)=p,发球二次的概率P(X=2)=p(1-p),发球三次的概率P(X=3)=(1-p)2,则E(X)=p+2p(1-p)+3(1-p)2=p2-3p+3,依题意有E(X)>1.75,则p2-3p+3>1.75,解得p>或p<,结合p的实际意义,可得0<p<,即p∈.故选B.
2.(2018·贵阳模拟)某高校学生社团为了解“大数据时代”下毕业生对就业情况的满意度,对20名毕业生进行问卷计分调查(满分100分),得到如图所示的茎叶图:
(1)计算男生打分的平均分,观察茎叶图,评价男、女生打分的分散程度;
(2)从打分在80分以上的毕业生中随机抽取3人,求被抽到的女生人数X的分布列和数学期望.
解 (1)男生打分的平均分为×(55+53+62+65+71+70+73+74+86+81)=69.
由茎叶图知,女生打分比较集中,男生打分比较分散.
(2)∵打分在80分以上的毕业生有3女2男,
∴X的可能取值为1,2,3,
P(X=1)==,
P(X=2)==,
P(X=3)==,
∴X的分布列为
X | 1 | 2 | 3 |
P |
E(X)=1×+2×+3×=.
3.某新建公司规定,招聘的职工须参加不小于80小时的某种技能培训才能上班.公司人事部门在招聘的职工中随机抽取200名参加这种技能培训的数据,按时间段[75,80),[80,85),[85,90),[90,95),(95,100](单位:小时)进行统计,其频率分布直方图如图所示.
(1)求抽取的200名职工中,参加这种技能培训时间不少于90小时的人数,并估计从招聘职工中任意选取一人,其参加这种技能培训时间不少于90小时的概率;
(2)从招聘职工(人数很多)中任意选取3人,记X为这3名职工中参加这种技能培训时间不少于90小时的人数,试求X的分布列和数学期望E(X)和方差D(X).
解 (1)依题意,培训时间在[90,95)小时的人数为200×0.06×5=60,
在[95,100)小时的人数为200×0.02×5=20,故满足题意的概率估计为P==.
(2)依题意,随机变量X的可能取值为0,1,2,3,
P(X=0)=C3=,
P(X=1)=C2=,
P(X=2)=C2=,
P(X=3)=C3=,
则随机变量X的分布列为
X | 0 | 1 | 2 | 3 |
P |
∵X~B,
∴E(X)=3×=,D(X)=3××=.
题型 均值与方差在决策中的应用
某投资公司在2018年年初准备将1000万元投资到“低碳”项目上,现有两个项目供选择:
项目一:新能源汽车.据市场调研,投资到该项目上,到年底可能获利30%,也可能亏损15%,且这两种情况发生的概率分别为和;
项目二:通信设备.据市场调研,投资到该项目上,到年底可能获利50%,可能损失30%,也可能不赔不赚,且这三种情况发生的概率分别为,和.
针对以上两个投资项目,请你为投资公司选择一个合理的项目,并说明理由.
解 若按“项目一”投资,设获利为X1万元,则X1的分布列为
∴E(X1)=300×+(-150)×=200.
若按“项目二”投资,设获利为X2万元,
则X2的分布列为
∴E(X2)=500×+(-300)×+0×=200.
D(X1)=(300-200)2×+(-150-200)2×=35000,
D(X2)=(500-200)2×+(-300-200)2×+(0-200)2×=140000.
∴E(X1)=E(X2),D(X1)<D(X2),
这说明虽然项目一、项目二获利相等,但项目一更稳妥.
综上所述,建议该投资公司选择项目一投资.
解离散型随机变量的期望和方差应用问题的方法
(1)求离散型随机变量的期望与方差关键是确定随机变量的所有可能值,写出随机变量的分布列,正确运用期望、方差公式进行计算.
(2)要注意观察随机变量的概率分布特征,若属于二项分布,可用二项分布的期望与方差公式计算,则更为简单.
(3)在实际问题中,若两个随机变量ξ1,ξ2,有E(ξ1)=E(ξ2)或E(ξ1)与E(ξ2)较为接近时,就需要用D(ξ1)与D(ξ2)来比较两个随机变量的稳定程度.即一般地将期望最大(或最小)的方案作为最优方案,若各方案的期望相同,则选择方差最小(或最大)的方案作为最优方案.
(2018·陕西宝鸡月考)某公司在迎新年晚会上举行抽奖活动,有甲、乙两个抽奖方案供员工选择.方案甲:员工最多有两次抽奖机会,每次抽奖的中奖率为.第一次抽奖,若未中奖,则抽奖结束.若中奖,则通过抛一枚质地均匀的硬币,决定是否继续进行第二次抽奖,规定:若抛出硬币,反面朝上,则员工获得500元奖金,不进行第二次抽奖;若正面朝上,则员工须进行第二次抽奖,且在第二次抽奖中,若中奖,获得奖金1000元;若未中奖,则所获奖金为0元.
方案乙:员工连续三次抽奖,每次中奖率均为,每次中奖均可获奖金400元.
(1)求某员工选择方案甲进行抽奖所获奖金X(元)的分布列;
(2)试比较对于员工而言,哪个方案更划算?
解 (1)P(X=0)=+××=,
P(X=500)=×=,
P(X=1000)=××=.
所以某员工选择方案甲进行抽奖所获奖金X(元)的分布列为
(2)由(1)可知,选择方案甲进行抽奖所获得奖金X的均值E(X)=500×+1000×=520,
若选择方案乙进行抽奖,中奖次数ξ~B,
则E(ξ)=3×=,
抽奖所获奖金X的均值E(X)=E(400ξ)=400E(ξ)=480,
故员工选择方案甲较划算.
题型 正态分布的应用
1.设X~N(1,1),其正态分布密度曲线如图所示,那么向正方形ABCD中随机投掷100000个点,则落入阴影部分的点的个数的估计值是( )
(注:若X~N(μ,σ2),则P(μ-σ<X≤μ+σ)=68.26%,P(μ-2σ<X≤μ+2σ)=95.44%.)
A.7539 B.6038 C.7028 D.6587
答案 D
解析 ∵X~N(1,1),∴μ=1,σ=1,μ+σ=2,
∵P(μ-σ<X≤μ+σ)=68.26%,∴则P(0<X≤2)=68.26%,
则P(1<X≤2)=34.13%,
∴阴影部分的面积为0.6587,
∴点落入题图中阴影部分的概率P==0.6587.
∴正方形ABCD中随机投掷100000个点,则落入阴影部分的点的个数的估计值是6587.故选D.
2.(2019·福建泉州模拟)某校在高三第一次模拟考试中约有1000人参加考试,其数学考试成绩近似服从正态分布,即X~N(100,a2)(a>0),试卷满分150分,统计结果显示数学考试成绩不及格(低于90分)的人数占总人数的,则此次数学考试成绩在100分到110分之间的人数约为( )
A.400 B.500 C.600 D.800
答案 A
解析 ∵P(X≤90)=P(X≥110)=,
∴P(90≤X≤110)=1-2×=,
∴P(100≤X≤110)=,
则成绩在100分到110分之间的人数为1000×=400.故选A.
条件探究 若将举例说明1中“正方形”改为“矩形”,“X~N(1,1)”变为“X~N(-1,1),阴影部分如图所示”,则结果如何?
解 对于正态分布N(-1,1),可知μ=-1,σ=1,正态曲线关于直线x=-1对称,故题图中阴影部分的面积为×[P(-3<X≤1)-P(-2<X≤0)]=×[P(μ-2σ<X≤μ+2σ)-P(μ-σ<X≤μ+σ)]=×(0.9544-0.6826)=0.1359,
所以点落入题图中阴影部分的概率P==0.9547,
投入100000个点,落入阴影部分的个数约为100000×0.9547=95470.
正态分布下两类常见的概率计算
(1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x=μ对称,曲线与x轴之间的面积为1.
(2)利用3σ原则求概率问题时,要注意把给出的区间或范围与正态变量的μ,σ进行对比联系,确定它们属于(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)中的哪一个.
1.设两个正态分布N(μ1,σ)(σ1>0)和N(μ2,σ)(σ2>0)的密度函数图象如图所示,则有( )
A.μ1<μ2,σ1<σ2 B.μ1<μ2,σ1>σ2
C.μ1>μ2,σ1<σ2 D.μ1>μ2,σ1>σ2
答案 A
解析 μ反映正态分布的平均水平,x=μ是正态曲线的对称轴,由图知μ1<μ2,σ反映正态分布的离散程度,σ越大,曲线越“矮胖”,表明越分散,σ越小,曲线越“高瘦”,表明越集中,由图知σ1<σ2.
2.在某次数学考试中,考生的成绩ξ服从正态分布,即ξ~N(100,100),已知满分为150分.
(1)试求考试成绩ξ位于区间(80,120]内的概率;
(2)若这次考试共有2000名考生参加,试估计这次考试及格(不小于90分)的人数.
解 (1)由ξ~N(100,100),知μ=100,σ=10.
∴P(80<ξ≤120)=P(100-20<ξ≤100+20)=0.9544,
即考试成绩位于区间(80,120]内的概率为0.9544.
(2)P(90<ξ≤110)=P(100-10<ξ≤100+10)=0.6826,
∴P(ξ>110)=×(1-0.6826)=0.1587,
∴P(ξ≥90)=0.6826+0.1587=0.8413.
∴估计及格人数约为2000×0.8413≈1683.
高频考点 均值、方差的计算和实际应用
考点分析 离散型随机变量的均值、方差是高考大题的必考题型之一.通常以实际问题为背景,综合考查概率计算、求分布列,计算均值、方差还应特别注意与函数知识的综合问题.
[典例] (2017·全国卷Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
以最高气温位于各区间的频率代替最高气温位于该区间的概率.
(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;
(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?
解 (1)由题意知,X所有可能取值为200,300,500,由表格数据知P(X=200)==0.2,
P(X=300)==0.4,
P(X=500)==0.4.
因此X的分布列为
X | 200 | 300 | 500 |
P | 0.2 | 0.4 | 0.4 |
(2)由题意知,这种酸奶一天的需求量至多为500,至少为200,因此只需考虑200≤n≤500.
当300≤n≤500时,
若最高气温不低于25,则Y=6n-4n=2n;
若最高气温位于区间[20,25),则Y=6×300+2(n-300)-4n=1200-2n;
若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n.
因此E(Y)=2n×0.4+(1200-2n)×0.4+(800-2n)×0.2=640-0.4n.
当200≤n<300时,
若最高气温不低于20,则Y=6n-4n=2n;
若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n,
因此E(Y)=2n×(0.4+0.4)+(800-2n)×0.2=160+1.2n.
所以n=300时,Y的数学期望达到最大值,最大值为520元.