还剩27页未读,
继续阅读
所属成套资源:2019版二轮复习数学(理·重点生)通用版讲义精品教案
成套系列资料,整套一键下载
2019版二轮复习数学(理·重点生)通用版讲义:第一部分专题十六概率、随机变量及其分布列
展开
专题十六 概率、随机变量及其分布列
卷Ⅰ
卷Ⅱ
卷Ⅲ
2018
几何概型·T10
古典概型·T8
相互独立事件及二项分布及方差的计算·T8
二项分布、导数的应用及变量的数学期望、决策性问题·T20
2017
数学文化、有关面积的几何概型·T2
二项分布的方差·T13
频数分布表、概率分布列的求解、数学期望的应用·T18
正态分布、二项分布的性质及概率、方差·T19
2016
与长度有关的几何概型·T4
几何概型、随机模拟·T10
____________
柱状图、相互独立事件与互斥事件的概率、分布列和数学期望·T19
互斥事件的概率、条件概率、随机变量的分布列和数学期望·T18
纵向把握趋势
卷Ⅰ3年6考,且每年均有“一小一大”两题同时考查,连续3年均以选择题的形式考查了几何概型,解答题涉及事件的相互独立性、二项分布、数学期望问题,难度适中.2018年高考将二项分布与导数相结合是高考的一大亮点.预计2019年高考仍会延续“一小一大”的命题规律,小题考查古典概型或几何概型,大题考查二项分布及均值、方差
卷Ⅱ3年4考,主要以选择题和填空题的形式考查,涉及古典概型、几何概型、随机模拟、随机变量的分布列和数学期望、二项分布的方差等,难度适中.预计2019年会以解答题的形式考查二项分布的应用问题
卷Ⅲ3年2考,涉及相互独立事件、二项分布及数学期望的应用问题,难度适中.预计2019年高考可能以解答题的形式考查二项分布及其应用问题
横向把握重点
1.概率、随机变量及其分布是高考命题的热点之一,命题形式为“一小一大”,即一道选择题或填空题和一道解答题.
2.选择题或填空题常出现在第4~10题或第13~15题的位置,主要考查随机事件的概率、古典概型、几何概型,难度一般.
古典概型与几何概型
[题组全练]
1.利用计算机在区间(0,1)上产生随机数a,则不等式ln(3a-1)<0成立的概率是( )
A. B.
C. D.
解析:选C 由ln(3a-1)<0得 2.(2018·贵阳模拟)点集Ω={(x,y)|0≤x≤e,0≤y≤e},A={(x,y)|y≥ex,(x,y)∈Ω},在点集Ω中任取一个元素a,则a∈A的概率为( )
A. B.
C. D.
解析:选B 如图,根据题意可知Ω表示的平面区域为正方形BCDO,面积为e2,A表示的区域为图中阴影部分,面积为(e-ex)dx=(ex-ex) =(e-e)-(-1)=1,根据几何概型可知a∈A的概率P=.
3.为美化环境,从红、黄、白、紫4种颜色的花中任选2种颜色的花种在一个花坛中,余下的2种颜色的花种在另一个花坛中,则红色和紫色的花种在同一花坛的概率是( )
A. B.
C. D.
解析:选C 把这4种颜色的花种在两个花坛中的所有情况为(红,黄),(白,紫);(红,白),(黄,紫);(红,紫),(黄,白);(黄,白),(红,紫);(黄,紫),(红,白);(白,紫),(红,黄),共有6种,其中红色和紫色的花种在同一花坛的情况有2种,所以红色和紫色的花种在同一花坛的概率P==.
4.(2018·全国卷Ⅰ)如图,来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC的斜边BC,直角边AB,AC.△ABC的三边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ.在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为p1,p2,p3,则( )
A.p1=p2 B.p1=p3
C.p2=p3 D.p1=p2+p3
解析:选A 法一:∵S△ABC=AB·AC,以AB为直径的半圆的面积为π·2=AB2,以AC为直径的半圆的面积为π·2=AC2,以BC为直径的半圆的面积为π·2=BC2,
∴SⅠ=AB·AC,
SⅢ=BC2-AB·AC,
SⅡ=-
=AB·AC.
∴SⅠ=SⅡ.
由几何概型概率公式得p1=,p2=,
∴p1=p2.故选A.
法二:不妨设△ABC为等腰直角三角形,
AB=AC=2,则BC=2,
所以区域Ⅰ的面积即△ABC的面积,
为S1=×2×2=2,
区域Ⅱ的面积S2=π×12-=2,
区域Ⅲ的面积S3=-2=π-2.
根据几何概型的概率计算公式,
得p1=p2=,p3=,
所以p1≠p3,p2≠p3,
p1≠p2+p3,故选A.
[系统方法]
古典概型、几何概型概率的求法
(1)求古典概型的概率,关键是正确求出基本事件总数和所求事件包含的基本事件总数.常常用到排列、组合的有关知识,计数时要正确分类,做到不重不漏.
(2)求几何概型的概率,构成试验的全部结果的区域和事件发生的区域的寻找是关键,有时需要设出变量,在坐标系中表示所需要的区域.
相互独立事件与独立重复试验
[题组全练]
1.如图,四边形ABCD是以O为圆心、半径为1的圆的内接正方形,四边形EFGH是正方形ABCD的内接正方形,且E,F,G,H分别为AB,BC,CD,DA的中点.将一枚针随机掷到圆O内,用M表示事件“针落在正方形ABCD内”,N表示事件“针落在正方形EFGH内”,则P(N|M)等于( )
A. B.
C. D.
解析:选C 由已知得正方形ABCD的边长为,正方形EFGH的边长为1,
所以P(M)==,P(N)==.
因为P(MN)=P(N),
所以P(N|M)===.
2.生产某零件需要经过两道工序,在第一、第二道工序中产生废品的概率分别为0.01和p,每道工序产生废品相互独立.若经过两道工序后得到的零件不是废品的概率是0.960 3,则p=________.
解析:由题意得(1-0.01)(1-p)=0.960 3,
解得p=0.03.
答案:0.03
3.如图所示,某快递公司送货员从公司A处准备开车送货到某单位B处,有A→C→D→B,A→E→F→B两条路线.若该地各路段发生堵车与否是相互独立的,且各路段发生堵车事件的概率如图所示例如A→C→D算作两个路段,路段AC发生堵车事件的概率为,路段CD发生堵车事件的概率为.若使途中发生堵车事件的概率较小,则由A到B应选择的路线是________.
解析:由已知得路线A→C→D→B途中发生堵车事件的概率为P1=1-××=.
路线A→E→F→B途中发生堵车事件的概率P2=1-××=.
因为<,故应选择路线A→E→F→ B.
答案:A→E→F→B
[系统方法]
1.条件概率的求法
(1)利用定义,分别求P(A)和P(AB),得P(B|A)=.这是通用的求条件概率的方法.
(2)借助古典概型概率公式,先求事件A包含的基本事件数n(A),再在事件A发生的条件下求事件B包含的基本事件数,即n(AB),得P(B|A)=.
2.求复杂事件概率的方法及注意点
(1)直接法:正确分析复杂事件的构成,将复杂事件转化为几个彼此互斥的事件的和事件或几个相互独立事件同时发生的积事件或独立重复试验问题,然后用相应概率公式求解.
(2)间接法:当复杂事件正面情况较多,反面情况较少时,可利用其对立事件进行求解.对于“至少”“至多”等问题往往也用这种方法求解.
(3)注意点:注意辨别独立重复试验的基本特征:
①在每次试验中,试验结果只有发生与不发生两种情况;
②在每次试验中,事件发生的概率相同.
离散型随机变量的分布列及数学期望
[多维例析]
角度一 超几何分布与数学期望的求解
在心理学研究中,常采用对比试验的方法评价不同心理暗示对人的影响,具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示,另一组接受乙种心理暗示,通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗示的作用.现有6名男志愿者A1,A2,A3,A4,A5,A6和4名女志愿者B1,B2,B3,B4,从中随机抽取5人接受甲种心理暗示,另5人接受乙种心理暗示.
(1)求接受甲种心理暗示的志愿者中包含A1但不包含B1的概率;
(2)用X表示接受乙种心理暗示的女志愿者人数,求X的分布列与数学期望E(X).
[解] (1)记接受甲种心理暗示的志愿者中包含A1但不包含B1的事件为M,
则P(M)==.
(2)由题意知X可取的值为:0,1,2,3,4,则
P(X=0)==,
P(X=1)==,
P(X=2)==,
P(X=3)==,
P(X=4)==.
因此X的分布列为
X
0
1
2
3
4
P
故X的数学期望E(X)=0+1×+2×+3×+4×=2.
[类题通法]
1.离散型随机变量分布列的求解步骤
2.超几何分布的概率与期望的求法
对于实际问题中的随机变量X,如果能够断定它服从超几何分布H(N,M,n),则其概率、期望可直接利用公式P(X=k)=(k=0,1,…,m,其中m=min{M,n},且n≤N,M≤N,n,M,N∈N*),E(X)=求解.
角度二 二项分布与数学期望的求解
(2018·惠州第二次调研)某学校为了丰富学生的课余生活,以班级为单位组织学生开展古诗词背诵比赛,随机抽取一首,背诵正确加10分,背诵错误减10分,且背诵结果只有“正确”和“错误”两种.其中某班级学生背诵正确的概率p=,记该班级完成n首背诵后的总得分为Sn.
(1)求S6=20且Si≥0(i=1,2,3)的概率;
(2)记ξ=|S5|,求ξ的分布列及数学期望E(ξ).
[解] (1)当S6=20时,即背诵6首后,正确的有4首,错误的有2首.
由Si≥0(i=1,2,3)可知,若第一首和第二首背诵正确,则其余4首可任意背诵正确2首;
若第一首背诵正确,第二首背诵错误,第三首背诵正确,则其余3首可任意背诵正确2首.
则所求的概率P=2×C2×2+×××C2×=.
(2)由题意知ξ=|S5|的所有可能的取值为10,30,50,
又p=,
∴P(ξ=10)=C3×2+C2×3=,P(ξ=30)=C4×1+C1×4=,P(ξ=50)=C5×0+C0×5=,
∴ξ的分布列为
ξ
10
30
50
P
∴数学期望E(ξ)=10×+30×+50×=.
[类题通法] 与二项分布有关的期望、方差的求法
(1)求随机变量ξ的期望与方差时,可首先分析ξ是否服从二项分布,如果ξ~B(n,p),则用公式E(ξ)=np,D(ξ)=np(1-p)求解,可大大减少计算量.
(2)有些随机变量虽不服从二项分布,但与之具有线性关系的另一随机变量服从二项分布,这时,可以综合应用E(aξ+b)=aE(ξ)+b以及E(ξ)=np求出E(aξ+b),同样还可求出D(aξ+b).
角度三 相互独立事件的概率及其分布列、期望
(2019届高三·益阳、湘潭调研)某乒乓球俱乐部派甲、乙、丙三名运动员参加某运动会的单打资格选拔赛,本次选拔赛只有出线和未出线两种情况.规定一名运动员出线记1分,未出线记0分.假设甲、乙、丙出线的概率分别为,,,他们出线与未出线是相互独立的.
(1)求在这次选拔赛中,这三名运动员至少有一名出线的概率;
(2)记在这次选拔赛中,甲、乙、丙三名运动员的得分之和为随机变量ξ,求随机变量ξ的分布列和数学期望E(ξ).
[解] (1)记“甲出线”为事件A,“乙出线”为事件B,“丙出线”为事件C,“甲、乙、丙至少有一名出线”为事件D,
则P(D)=1-P( )=1-××=.
(2)由题意可得,ξ的所有可能取值为0,1,2,3,
则P(ξ=0)=P( )=××=,
P(ξ=1)=P(A )+P( B)+P( C)=××+××+××=,
P(ξ=2)=P(A B )+P(A C)+P(BC)=××+××+××=,
P(ξ=3)=P(ABC)=××=.
所以ξ的分布列为
ξ
0
1
2
3
P
E(ξ)=0×+1×+2×+3×=.
[类题通法] 解相互独立事件概率问题的策略
(1)会分拆事件,即先把事件分拆成若干个互斥事件,再把其中的每个事件分拆成若干个相互独立事件;
(2)会用公式,若事件A,B是相互独立事件,则P(AB)=P(A)P(B),若事件A,B是互斥事件,则P(A+B)=P(A)+P(B).
[综合训练]
(2017·全国卷Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
最高气温
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40)
天数
2
16
36
25
7
4
以最高气温位于各区间的频率代替最高气温位于该区间的概率.
(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;
(2)设六月份一天销售这种酸奶的利润为Y(单位:元).当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?
解:(1)由题意知,X所有可能取值为200,300,500,
由表格数据知
P(X=200)==0.2,P(X=300)==0.4,
P(X=500)==0.4.
因此X的分布列为:
X
200
300
500
P
0.2
0.4
0.4
(2)由题意知,这种酸奶一天的需求量至多为500,至少为200,因此只需考虑200≤n≤500.
当300≤n≤500时,
若最高气温不低于25,则Y=6n-4n=2n;
若最高气温位于区间[20,25),则Y=6×300+2(n-300)-4n=1 200-2n;
若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n.
因此E(Y)=2n×0.4+(1 200-2n)×0.4+(800-2n)×0.2=640-0.4n.
当200≤n<300时,
若最高气温不低于20,则Y=6n-4n=2n;
若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n.
因此E(Y)=2n×(0.4+0.4)+(800-2n)×0.2=160+1.2n.
所以n=300时,Y的数学期望达到最大值,最大值为520元.
样本的均值、方差与正态分布的综合问题
[由题知法]
为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
①试说明上述监控生产过程方法的合理性;
②下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得=i=9.97,s==≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(-3,+3)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-3σ
[解] (1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.997 4,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.002 6,故X~B(16,0.002 6).因此P(X≥1)=1-P(X=0)=1-0.997 416≈0.040 8.
X的数学期望为EX=16×0.002 6=0.041 6.
(2)①如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
②由=9.97,s≈0.212,得μ的估计值为=9.97,σ的估计值为=0.212,由样本数据可以看出有一个零件的尺寸在(-3,+3)之外,因此需对当天的生产过程进行检查.
剔除(-3,+3)之外的数据9.22,剩下数据的平均数为(16×9.97-9.22)=10.02,
因此μ的估计值为10.02.
=16×0.2122+16×9.972≈1 591.134,
剔除(-3,+3)之外的数据9.22,剩下数据的样本方差为(1 591.134-9.222-15×10.022)≈0.008,
因此σ的估计值为≈0.09.
[类题通法] 正态分布下两类常见的概率计算
(1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x=μ对称,曲线与x轴之间的面积为1.
(2)利用3σ原则求概率问题时,要注意把给出的区间或范围与正态变量的μ,σ进行对比联系,确定它们属于(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)中的哪一个.
[应用通关]
从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图.
(1)求这500件产品质量指标值的样本平均数和样本方差s2(同一组中的数据用该组区间的中点值作代表).
(2)由直方图可以认为,这种产品的质量指标值Z服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2.
①利用该正态分布,求P(187.8
②某用户从该企业购买了100件这种产品,记X表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数.利用①的结果,求E(X).
附:≈12.2.若Z~N(μ,σ2),则P(μ-σ
解:(1)抽取产品的质量指标值的样本平均数和样本方差s2分别为=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200,
s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+0×0.33+102×0.24+202×0.08+302×0.02=150.
(2)①由(1)知,Z~N(200,150),从而P(187.8
②由①知,一件产品的质量指标值位于区间(187.8,212.2)的概率为0.682 7,
依题意知X~B(100,0.682 7),
所以E(X)=100×0.682 7=68.27.
[高考大题通法点拨]
概率与统计问题重在“辨”——辨析、辨型
[思维流程]
[策略指导]
(1)准确弄清问题所涉及的事件有什么特点,事件之间有什么关系,如互斥、对立、独立等;
(2)理清事件以什么形式发生,如同时发生、至少有几个发生、至多有几个发生、恰有几个发生等;
(3)明确抽取方式,如放回还是不放回、抽取有无顺序等;
(4)准确选择排列组合的方法来计算基本事件发生数和事件总数,或根据概率计算公式和性质来计算事件的概率;
(5)确定随机变量取值并求其对应的概率,写出分布列后再求期望.
(6)会套用求、K2的公式求值,再作进一步求值与分析.
某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数
0
1
2
3
4
≥5
保费
0.85a
a
1.25a
1.5a
1.75a
2a
设该险种一续保人一年内出险次数与相应概率如下:
一年内出险次数
0
1
2
3
4
≥5
概率
0.30
0.15
0.20
0.20
0.10
0.05
(1)求一续保人本年度的保费高于基本保费的概率;
(2)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率;
(3)求续保人本年度的平均保费与基本保费的比值.
[破题思路]
第(1)问
求什么想什么
求一续保人本年度的保费高于基本保费的概率,想到保费高于基本保费的出现次数及相应的概率
给什么用什么
题目中的表格给出了一年内出险次数所对应的概率和保费,想到互斥事件的概率,利用互斥事件的概率公式求解
第(2)问
求什么想什么
求其保费比基本保费高出60%的概率,想到保费比基本保费高出60%的情况有哪些
给什么用什么
题目给出的条件为“一续保人本年度的保费高于基本保费”,因此根据条件概率的定义可知该事件属于条件概率,可用条件概率公式求解
缺什么找什么
要利用条件概率公式求解,缺少“一续保人本年度的保费高于基本保费”的概率以及“该续保人本年度的保费高于基本保费且保费比基本保费高出60%的概率”,从题目表格中的数据可知
第(3)问
求什么想什么
求续保人本年度的平均保费与基本保费的比值,想到求平均保费即保费的均值
给什么用什么
结合题目中的两个表格,可知保费为0.85a,a,1.25a,1.5a,1.75a,2a,所对应的概率分别为0.30,0.15,0.20,0.20,0.10,0.05,利用均值公式求解即可
[规范解答]
(1)设A表示事件:“一续保人本年度的保费高于基本保费”,
则事件A发生当且仅当一年内出险次数大于1,故P(A)=0.20+0.20+0.10+0.05=0.55.
(2)设B表示事件:“一续保人本年度的保费比基本保费高出60%”,则事件B发生当且仅当一年内出险次数大于3,故P(B)=0.10+0.05=0.15.
又P(AB)=P(B),
故P(B|A)==
==.
因此所求概率为.
(3)记续保人本年度的保费为X,则X的分布列为
X
0.85a
a
1.25a
1.5a
1.75a
2a
P
0.30
0.15
0.20
0.20
0.10
0.05
E(X)=0.85a×0.30+a×0.15+1.25a×0.20+1.5a×0.20+1.75a×0.10+2a×0.05=1.23a.
因此续保人本年度的平均保费与基本保费的比值为1.23.
[关键点拨]
(1)会判断,先判断事件的类型,再利用对立事件的概率公式、条件概率的公式等求解概率;
(2)会计算,要求随机变量X的期望,需先求出X的所有可能取值,然后求出随机变量X取每个值时的概率,再利用随机变量的数学期望的定义进行计算.
为研究家用轿车在高速公路上的车速情况,交通部门随机选取100名家用轿车驾驶员进行调查,得到其在高速公路上行驶时的平均车速情况为:在55名男性驾驶员中,平均车速超过100 km/h的有40人,不超过100 km/h 的有15人;在45名女性驾驶员中,平均车速超过100 km/h的有20人,不超过100 km/h的有25人.
(1)完成下面列联表,并判断能否在犯错误概率不超过0.005 的前提下认为“平均车速超过100 km/h与性别有关”?
平均车速超过100 km/h
平均车速不超过100 km/h
总计
男性驾驶员
女性驾驶员
总计
附:K2=,其中n=a+b+c+ d.
P(K2≥k0)
0.150
0.100
0.050
0.010
0.005
0.001
k0
2.072
2.706
3.841
6.635
7.879
10.828
(2)在被调查的驾驶员中,从平均车速不超过100 km/h的人中随机抽取2人,求这2人恰好有1名男性驾驶员和1名女性驾驶员的概率;
(3)以样本数据估计总体,从高速公路上行驶的家用轿车中随机抽取3辆,记这3辆车平均车速超过100 km/h且为男性驾驶员的车辆数为X,求X的分布列和数学期望E(X).
[破题思路]
第(1)问
求什么想什么
判断能否在犯错误概率不超过0.005的前提下认为“平均车速超过100 km/h与性别有关”,想到计算K2的观测值
给什么用什么
分别给出55名男性驾驶员和45名女性驾驶员中平均速度超过100 km/h和不超过100 km/h的人数,利用2×2列联表进行数据整理,并代入K2公式求解,并对照附表中数据给出结论
第(2)问
求什么想什么
求抽取的2人中恰有1名男性驾驶员和1名女性驾驶员的概率,想到判断概率模型及相应的概率公式
给什么用什么
题目条件中给出平均车速不超过100 km/h的男、女驾驶员的人数,可借助组合的知识求出从中随机抽取2人的所有情况数及恰有1男、1女的情况,代入古典概型的概率公式求解即可
第(3)问
求什么想什么
求X的分布列和E(X),想到X的可能取值及其对应的概率值
给什么用什么
题目条件中给出抽样方法,由于是从高速公路上行驶的家用轿车中随机抽取3辆,总体容量非常大,故可认为该抽样中的随机变量服从二项分布
差什么找什么
缺少X的可能取值及其对应的概率值,结合已知条件,利用二项分布求得分布列及E(X)
[规范解答]
(1)完成的列联表如下:
平均车速超过100 km/h
平均车速不超过100 km/h
总计
男性驾驶员
40
15
55
女性驾驶员
20
25
45
总计
60
40
100
由表中数据得K2的观测值k=≈8.249>7.879,
所以能在犯错误的概率不超过0.005的前提下认为“平均车速超过100 km/h与性别有关”.
(2)平均车速不超过100 km/h的驾驶员有40人,从中随机抽取2人的方法总数为C,记
“这2人恰好有1名男性驾驶员和1名女性驾驶员”为事件A,
则事件A所包含的基本事件数为CC,
所以所求的概率P(A)===.
(3)根据样本估计总体的思想,从总体中任取1辆车,平均车速超过100 km/h且为男性驾驶员的概率为=,
故X~B.
所以P(X=0)
=C03=,
P(X=1)=C12=,
P(X=2)=C21=,
P(X=3)=C30=.
所以X的分布列为
X
0
1
2
3
P
E(X)=0×+1×+2×+3×=.
[关键点拨]
(1)会利用两个基本计数原理、排列与组合,以及古典概型的概率公式求随机变量的概率;能准确判断随机变量X的所有可能取值,然后求出随机变量X取每个值时的概率,即可得随机变量X的分布列;还需活用定义,即会活用随机变量的数学期望的定义进行计算.
(2)独立性检验是用来考察两个分类变量是否有关系,计算随机变量的观测值K2,K2越大,说明两个分类变量有关系的可能性越大.
[对点训练]
(2018·辽宁大连期中)某工厂为了对新研发的产品进行合理定价,将该产品按事先拟定的单价进行试销,得到一组检测数据(xi,yi)(i=1,2,…,6)如表所示.
试销单价x/元
4
5
6
7
a
9
产品销量y/件
b
84
83
80
75
68
已知变量x,y具有线性负相关关系,且i=39,i=480,现有甲、乙、丙三位同学通过计算求得其回归方程分别为:甲:y=4x+54;乙:y=-4x+106;丙:y=-4.2x+105.其中有且仅有一位同学的计算结果是正确的.
(1)试判断谁的计算结果正确,并求出a,b的值;
(2)若由线性回归方程得到的估计数据(xi,i)中的i与检测数据(xi,yi)中的yi差的绝对值不超过1,则称该检测数据是“理想数据”,现从检测数据中随机抽取3个,求“理想数据”的个数ξ的分布列和数学期望.
解:(1)已知变量x,y具有线性负相关关系,故甲的计算结果不对,由题意得,==6.5,==80,
将=6.5,=80分别代入乙、丙的回归方程,经验证知乙的计算结果正确,
故回归方程为y=-4x+106.
由i=4+5+6+7+a+9=39,得a=8,
由i=b+84+83+80+75+68=480,得b=90.
(2)列出估计数据(xi,i)与检测数据(xi,yi)如表.
x
4
5
6
7
8
9
y
90
84
83
80
75
68
90
86
82
78
74
70
易知有3个“理想数据”,故“理想数据”的个数ξ的所有可能取值为0,1,2,3.
P(ξ=0)==,P(ξ=1)==,
P(ξ=2)==,
P(ξ=3)==.
故ξ的分布列为
ξ
0
1
2
3
P
E(ξ)=0×+1×+2×+3×=.
[总结升华]
概率与统计问题的求解关键是辨别它的模型,只要找到模型,问题便迎刃而解.而概率模型的提取往往需要经过观察、分析、归纳、判断等复杂的辨析思维过程,常常因题设条件理解不准,某个概念认识不清而误入歧途.另外,还需弄清楚概率模型中等可能事件、互斥事件、对立事件、独立事件等事件间的关系,注意放回和不放回试验的区别,合理划分复合事件.
[专题跟踪检测](对应配套卷P203)
一、全练保分考法——保大分
1.(2018·全国卷Ⅱ)我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30=7+23.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是( )
A. B.
C. D.
解析:选C 不超过30的所有素数为2,3,5,7,11,13,17,19,23,29,共10个,随机选取两个不同的数,共有C=45种情况,而和为30的有7+23,11+19,13+17这3种情况,∴所求概率为=.故选C.
2.(2018·武汉调研)将一枚质地均匀的骰子投掷两次,得到的点数依次记为a和b,则方程ax2+bx+1=0有实数解的概率是( )
A. B.
C. D.
解析:选C 投掷骰子两次,所得的点数a和b满足的关系为∴a和b的组合有36种,若方程ax2+bx+1=0有实数解,则Δ=b2-4a≥0,∴b2≥4a.
当b=1时,没有a符合条件;当b=2时,a可取1;当b=3时,a可取1,2;当b=4时,a可取1,2,3,4;当b=5时,a可取1,2,3,4,5,6;当b=6时,a可取1,2,3,4,5,6.
满足条件的组合有19种,则方程ax2+bx+1=0有实数解的概率P=.
3.(2018·合肥质检)已知某公司生产的一种产品的质量X(单位:克)服从正态分布N(100,4).现从该产品的生产线上随机抽取10 000件产品,其中质量在[98,104]内的产品估计有( )
附:若X服从正态分布N(μ,σ2),则P(μ-σ<X<μ+σ)≈0.682 7,P(μ-2σ<X<μ+2σ)≈0.954 5.
A.3 413件 B.4 772件
C.6 826件 D.8 186件
解析:选D 由题意知μ=100,σ=2,则P(98<X<104)=[P(μ-σ<X<μ+σ)+P(μ-2σ<X<μ+2σ)]≈0.818 6,所以质量在[98,104]内的产品估计有10 000×0.818 6=8 186件.
4.(2019届高三·洛阳联考)如图,圆O:x2+y2=π2内的正弦曲线y=sin x与x轴围成的区域记为M(图中阴影部分),随机往圆O内投一个点A,则点A落在区域M内的概率是( )
A. B.
C. D.
解析:选B 由题意知圆O的面积为π3,正弦曲线y=sin x,x∈[-π,π]与x轴围成的区域记为M,根据图形的对称性得区域M的面积S=2sin xdx=-2cos x=4,由几何概型的概率计算公式可得,随机往圆O内投一个点A,则点A落在区域M内的概率P=,故选 B.
5.(2018·潍坊模拟)某篮球队对队员进行考核,规则是:①每人进行3个轮次的投篮;②每个轮次每人投篮2次,若至少投中1次,则本轮通过,否则不通过.已知队员甲投篮1次投中的概率为,如果甲各次投篮投中与否互不影响,那么甲3个轮次通过的次数X的期望是( )
A.3 B.
C.2 D.
解析:选B 每个轮次甲不能通过的概率为×=,通过的概率为1-=,因为甲3个轮次通过的次数X服从二项分布B,所以X的数学期望为3×=.
6.(2018·潍坊模拟)如图,六边形ABCDEF是一个正六边形,若在正六边形内任取一点,则该点恰好在图中阴影部分的概率是( )
A. B.
C. D.
解析:选C 设正六边形的中心为点O,BD与AC交于点G,BC=1,则BG=CG,∠BGC=120°,在△BCG中,由余弦定理得1=BG2+BG2-2BG2cos 120°,得BG=,所以S△BCG=×BG×BG×sin 120°=×××=,因为S六边形ABCDEF=S△BOC×6=×1×1×sin 60°×6=,所以该点恰好在图中阴影部分的概率是1-=.
7.(2018·福州模拟)某商店随机将三幅分别印有福州三宝(脱胎漆器、角梳、油纸伞)的宣传画并排贴在同一面墙上,则角梳与油纸伞的宣传画相邻的概率是________.
解析:记脱胎漆器、角梳、油纸伞的宣传画分别为a,b,c,则并排贴的情况有abc,acb,bac,bca,cab,cba,共6种,其中b,c相邻的情况有abc,acb,bca,cba,共4种,故由古典概型的概率计算公式,得所求概率P==.
答案:
8.(2018·唐山模拟)向圆(x-2)2+(y-)2=4内随机投掷一点,则该点落在x轴下方的概率为________.
解析:如图,连接CA,CB,依题意,圆心C到x轴的距离为,所以弦AB的长为2.又圆的半径为2,所以弓形ADB的面积为×π×2-×2×=π-,所以向圆(x-2)2+(y-)2=4内随机投掷一点,则该点落在x轴下方的概率P=-.
答案:-
9.从混有5张假钞的20张百元钞票中任意抽取两张,将其中一张放到验钞机上检验发现是假钞,则两张都是假钞的概率是________.
解析:设事件A为“抽到的两张都是假钞”,事件B为“抽到的两张至少有一张假钞”,则所求的概率为P(A|B),
因为P(AB)=P(A)==,
P(B)==,
所以P(A|B)===.
答案:
10.(2018·唐山模拟)某篮球队在某赛季已结束的8场比赛中,队员甲得分统计的茎叶图如图.
(1)根据这8场比赛,估计甲每场比赛中得分的均值μ和标准差σ;
(2)假设甲在每场比赛的得分服从正态分布N(μ,σ2),且各场比赛间相互没有影响,依此估计甲在82场比赛中得分在26分以上的平均场数.
参考数据:
≈5.66,≈5.68,≈5.70.
正态总体N(μ,σ2)在区间(μ-2σ,μ+2σ)内取值的概率约为0.954.
解:(1)μ=(7+8+10+15+17+19+21+23)=15,σ2=[(-8)2+(-7)2+(-5)2+02+22+42+62+82]=32.25.
所以σ≈5.68.
所以估计甲每场比赛中得分的均值μ为15,标准差σ为5.68.
(2)由(1)得甲在每场比赛中得分在26分以上的概率
P(X≥26)≈[1-P(μ-2σ<X<μ+2σ)]≈(1-0.954)=0.023,
设在82场比赛中,甲得分在26分以上的次数为Y,则Y~B(82,0.023).Y的均值E(Y)=82×0.023=1.886.
由此估计甲在82场比赛中得分在26分以上的平均场数为1.886.
11.某化妆品公司从国外进口美容型和疗效型两种化妆品,分别经过本公司的两条生产线分装后进行销售,两种化妆品的标准质量都是100克/瓶,误差不超过±5克/瓶即视为合格产品,否则视为不合格产品.现随机抽取两种产品各60瓶进行检测,检测结果统计如下:
质量/克
[90,95)
[95,100)
[100,105)
[105,110]
美容型化妆品/瓶
5
22
23
10
疗效型化妆品/瓶
5
21
19
15
(1)根据上述检测结果,若从这两种化妆品中各任取一瓶,以频率作为概率,分别计算这两瓶化妆品为合格产品的概率;
(2)对于一瓶美容型化妆品,若是合格产品,则可获得的利润为a(单位:百元),若不是合格产品,则亏损a2(单位:百元);对于一瓶疗效型化妆品,若是合格产品,则可获得的利润为a(单位:百元),若不是合格产品,则亏损2a2(单位:百元).那么当a为何值时,该公司各销售一瓶这两种化妆品所获得的利润最大?
解:(1)由表可知,任取一瓶美容型化妆品,其为合格产品的概率为=;
任取一瓶疗效型化妆品,其为合格产品的概率为=.
(2)记X为任意一瓶美容型化妆品和一瓶疗效型化妆品所获得的利润之和,则X的所有可能取值为a,a-2a2,a-a2,-3a2,
则P=×=,
P(X=a-2a2)=×=,
P=×=,
P(X=-3a2)=×=,
所以随机变量X的分布列为
X
a
a-2a2
a-a2
-3a2
P
所以E(X)=a×+(a-2a2)×+×+(-3a2)×=-a2+a=-(a-2)2+,
所以当a=2时,E(X)取得最大值,
即当a为2时,该公司各销售一瓶这两种化妆品所获得的利润最大.
12.(2019届高三·贵阳模拟)从A地到B地共有两条路径L1和L2,经过这两条路径所用的时间互不影响,且经过L1和L2所用时间的频率分布直方图分别如图(1)和(2).现甲选择L1或L2在40分钟内从A地到B地,乙选择L1或L2在50分钟内从A地到B地.
(1)求图(1)中a的值;并回答,为了尽最大可能在各自允许的时间内赶到B地,甲和乙应如何选择各自的路径?
(2)用X表示甲、乙两人中在允许的时间内能赶到B地的人数,针对(1)中的选择方案,求X的分布列和数学期望.
解:(1)由图(1)可得(0.01+0.02×3+a)×10=1,
解得a=0.03,
用Ai表示甲选择Li(i=1,2)在40分钟内从A地到B地,用Bi表示乙选择Li(i=1,2)在50分钟内从A地到B地,则P(A1)=(0.01+0.02+0.03)×10=0.6,P(A2)=(0.01+0.04)×10=0.5,
因为P(A1)>P(A2),所以甲应选择L1.
又P(B1)=(0.01+0.02+0.03+0.02)×10=0.8,
P(B2)=(0.01+0.04+0.04)×10=0.9,
因为P(B2)>P(B1),所以乙应选择L2.
(2)用M,N分别表示针对(1)的选择方案,甲、乙两人在各自允许的时间内赶到B地,由(1)知P(M)=0.6,P(N)=0.9,X的可能取值为0,1,2.
由题意知,M,N相互独立,
∴P(X=0)=0.4×0.1=0.04,
P(X=1)=0.4×0.9+0.6×0.1=0.42,
P(X=2)=0.6×0.9=0.54,
∴X的分布列为
X
0
1
2
P
0.04
0.42
0.54
∴E(X)=0×0.04+1×0.42+2×0.54=1.5.
13.(2018·全国卷Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验.设每件产品为不合格品的概率都为p(0 (1)记20件产品中恰有2件不合格品的概率为f (p),求f (p)的最大值点p0.
(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.
①若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求EX;
②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
解:(1)因为20件产品中恰有2件不合格品的概率为
f (p)=Cp2·(1-p)18,
所以f ′(p)=C[2p(1-p)18-18p2(1-p)17]
=2Cp(1-p)17(1-10p).
令f ′(p)=0,得p=0.1.
当p∈(0,0.1)时,f ′(p)>0;
当p∈(0.1,1)时,f ′(p)<0.
所以f (p)的最大值点为p0=0.1.
(2)由(1)知,p=0.1.
①令Y表示余下的180件产品中的不合格品件数,依题意知Y~B(180,0.1),X=20×2+25Y,即X=40+25Y.所以EX=E(40+25Y)=40+25EY=490.
②若对余下的产品作检验,则这一箱产品所需要的检验费用为400元.由于EX>400,故应该对余下的产品作检验.
二、加练大题考法——少失分
1.(2018·郑州质检)为了减少雾霾,还城市一片蓝天,某市政府于12月4日到12月31日在主城区实行车辆限号出行政策,鼓励民众不开车低碳出行.市政府为了了解民众低碳出行的情况,统计了该市甲、乙两个单位各200名员工12月5日到12月14日共10天的低碳出行的人数,画出茎叶图如图所示,
(1)若甲单位数据的平均数是122,求x的值;
(2)现从图中的数据中任取4天的数据(甲、乙两个单位中各取2天),记抽取的4天中甲、乙两个单位员工低碳出行的人数不低于130的天数分别为ξ1,ξ2,令η=ξ1+ξ2,求η的分布列和数学期望.
解:(1)由题意知,×[105+107+113+115+119+126+(120+x)+132+134+141]=122,解得x=8.
(2)由题得ξ1的所有可能取值为0,1,2,ξ2的所有可能取值为0,1,2,因为η=ξ1+ξ2,所以随机变量η的所有可能取值为0,1,2,3,4.
因为甲单位低碳出行的人数不低于130的天数为3,乙单位低碳出行的人数不低于130的天数为4,
所以P(η=0)==,
P(η=1)==,
P(η=2)==,
P(η=3)==,
P(η=4)==.
所以η的分布列为
η
0
1
2
3
4
P
所以E(η)=0×+1×+2×+3×+4×=.
2.(2018·福州模拟)某学校八年级共有学生400人,现对该校八年级学生随机抽取50名进行实践操作能力测试,实践操作能力测试结果分为四个等级水平,一、二等级水平的学生实践操作能力较弱,三、四等级水平的学生实践操作能力较强,测试结果统计如下表:
等级
水平一
水平二
水平三
水平四
男生/名
4
8
12
6
女生/名
6
8
4
2
(1)根据表中统计的数据填写下面2×2列联表,并判断是否有95%的把握认为学生实践操作能力强弱与性别有关?
实践操作能力较弱
实践操作能力较强
总计
男生/名
女生/名
总计
(2)现从测试结果为水平一的学生中随机抽取4名进行学习能力测试,记抽到水平一的男生的人数为ξ,求ξ的分布列和数学期望.
下面的临界值表供参考:
P(K2≥k0)
0.10
0.05
0.010
0.005
0.001
k0
2.706
3.841
6.635
7.879
10.828
参考公式:K2=,
其中n=a+b+c+d.
解:(1)补充2×2列联表如下:
实践操作能力较弱
实践操作能力较强
总计
男生/名
12
18
30
女生/名
14
6
20
总计
26
24
50
∴K2=≈4.327>3.841.
∴有95%的把握认为学生实践操作能力强弱与性别有关.
(2)ξ的可能取值为0,1,2,3,4.
P(ξ=0)==,P(ξ=1)==,
P(ξ=2)==,P(ξ=3)==,
P(ξ=4)==.
∴ξ的分布列为
ξ
0
1
2
3
4
P
∴E(ξ)=0×+1×+2×+3×+4×=.
3.(2018·开封模拟)某产品按行业生产标准分成8个等级,等级系数X依次为1,2,…,8,其中X≥5为标准A,X≥3为标准B,已知甲厂执行标准A生产该产品,产品的零售价为6元/件;乙厂执行标准B生产该产品,产品的零售价为4元/件.假定甲、乙两厂的产品都符合相应的执行标准.
(1)已知甲厂产品的等级系数X1的概率分布列如下表所示:
X1
5
6
7
8
P
0.4
a
b
0.1
且X1的数学期望E(X1)=6,求a,b的值;
(2)为分析乙厂产品的等级系数X2,从该厂生产的产品中随机抽取30件,相应的等级系数组成一个样本,数据如下:
用这个样本的频率分布估计总体分布,将频率视为概率,求等级系数X2的数学期望;
(3)在(1),(2)的条件下,若以“性价比”为判断标准,判断哪个工厂的产品更具可购买性?并说明理由.
注:①产品的“性价比”=产品的等级系数的数学期望/产品的零售价;
②“性价比”大的产品更具可购买性.
解:(1)∵E(X1)=6,∴5×0.4+6a+7b+8×0.1=6,
即6a+7b=3.2.①
又0.4+a+b+0.1=1,即a+b=0.5.②
联立①②解得a=0.3,b=0.2.
(2)由已知,用这个样本的频率分布估计总体分布,将频率视为概率,可得等级系数X2的概率分布列如下:
X2
3
4
5
6
7
8
P
0.3
0.2
0.2
0.1
0.1
0.1
∴E(X2)=3×0.3+4×0.2+5×0.2+6×0.1+7×0.1+8×0.1=4.8,
即乙厂产品的等级系数X2的数学期望等于4.8.
(3)乙厂的产品更具可购买性,理由如下:
∵甲厂产品的等级系数的数学期望等于6,价格为6元/件,
∴其性价比为=1,
∵乙厂产品的等级系数的数学期望等于4.8,价格为4元/件,
∴其性价比为=1.2,
又1.2>1,∴乙厂的产品更具可购买性.
4.(2019届高三·洛阳联考)随着移动互联网的快速发展,基于互联网的共享单车应运而生.某市场研究人员为了了解共享单车运营公司M的经营状况,对该公司6个月内的市场占有率进行了统计,并绘制了相应的折线图.
(1)由折线图可以看出,可用线性回归模型拟合月度市场占有率y与月份代码x之间的关系.求y关于x的线性回归方程,并预测M公司2019年2月份(即x=8时)的市场占有率;
(2)为进一步扩大市场,公司拟再采购一批单车.现有采购成本分别为1 000元/辆和1 200元/辆的A,B两款车型可供选择,按规定每辆单车最多使用4年,但由于多种原因(如骑行频率等)会导致车辆使用年限各不相同.考虑到公司运营的经济效益,该公司决定先对两款车型的单车各100辆进行科学模拟测试,得到两款单车使用年限频数表如下:
使用年限
车型
1年
2年
3年
4年
总计
A
20
35
35
10
100
B
10
30
40
20
100
经测算,平均每辆单车每年可以带来收入500元.不考虑除采购成本之外的其他成本,假设每辆单车的使用年限都是整数,且以频率作为每辆单车使用年限的概率.如果你是M公司的负责人,以每辆单车产生利润的期望值为决策依据,你会选择采购哪款车型?
参考公式:回归直线方程为=x+,
其中=,=-.
解:(1)由数据计算可得==3.5,
==16.
iyi=1×11+2×13+3×16+4×15+5×20+6×21=371,
=12+22+32+42+52+62=91,
∴==2,=16-2×3.5=9.
∴月度市场占有率y与月份代码x之间的线性回归方程为=2x+9.
当x=8时,=2×8+9=25.
故M公司2019年2月份的市场占有率预计为25%.
(2)由频率估计概率,每辆A款车可使用1年,2年,3年和4年的概率分别为0.2,0.35,0.35和0.1,
∴每辆A款车产生利润的期望值为
E(X)=(500-1 000)×0.2+(1 000-1 000)×0.35+(1 500-1 000)×0.35+(2 000-1 000)×0.1=175(元).
由频率估计概率,每辆B款车可使用1年,2年,3年和4年的概率分别为0.1,0.3,0.4和0.2,
∴每辆B款车产生利润的期望值为
E(Y)=(500-1 200)×0.1+(1 000-1 200)×0.3+(1 500-1 200)×0.4+(2 000-1 200)×0.2=150(元).
∴E(X)>E(Y),∴应该采购A款单车.
卷Ⅰ
卷Ⅱ
卷Ⅲ
2018
几何概型·T10
古典概型·T8
相互独立事件及二项分布及方差的计算·T8
二项分布、导数的应用及变量的数学期望、决策性问题·T20
2017
数学文化、有关面积的几何概型·T2
二项分布的方差·T13
频数分布表、概率分布列的求解、数学期望的应用·T18
正态分布、二项分布的性质及概率、方差·T19
2016
与长度有关的几何概型·T4
几何概型、随机模拟·T10
____________
柱状图、相互独立事件与互斥事件的概率、分布列和数学期望·T19
互斥事件的概率、条件概率、随机变量的分布列和数学期望·T18
纵向把握趋势
卷Ⅰ3年6考,且每年均有“一小一大”两题同时考查,连续3年均以选择题的形式考查了几何概型,解答题涉及事件的相互独立性、二项分布、数学期望问题,难度适中.2018年高考将二项分布与导数相结合是高考的一大亮点.预计2019年高考仍会延续“一小一大”的命题规律,小题考查古典概型或几何概型,大题考查二项分布及均值、方差
卷Ⅱ3年4考,主要以选择题和填空题的形式考查,涉及古典概型、几何概型、随机模拟、随机变量的分布列和数学期望、二项分布的方差等,难度适中.预计2019年会以解答题的形式考查二项分布的应用问题
卷Ⅲ3年2考,涉及相互独立事件、二项分布及数学期望的应用问题,难度适中.预计2019年高考可能以解答题的形式考查二项分布及其应用问题
横向把握重点
1.概率、随机变量及其分布是高考命题的热点之一,命题形式为“一小一大”,即一道选择题或填空题和一道解答题.
2.选择题或填空题常出现在第4~10题或第13~15题的位置,主要考查随机事件的概率、古典概型、几何概型,难度一般.
古典概型与几何概型
[题组全练]
1.利用计算机在区间(0,1)上产生随机数a,则不等式ln(3a-1)<0成立的概率是( )
A. B.
C. D.
解析:选C 由ln(3a-1)<0得 2.(2018·贵阳模拟)点集Ω={(x,y)|0≤x≤e,0≤y≤e},A={(x,y)|y≥ex,(x,y)∈Ω},在点集Ω中任取一个元素a,则a∈A的概率为( )
A. B.
C. D.
解析:选B 如图,根据题意可知Ω表示的平面区域为正方形BCDO,面积为e2,A表示的区域为图中阴影部分,面积为(e-ex)dx=(ex-ex) =(e-e)-(-1)=1,根据几何概型可知a∈A的概率P=.
3.为美化环境,从红、黄、白、紫4种颜色的花中任选2种颜色的花种在一个花坛中,余下的2种颜色的花种在另一个花坛中,则红色和紫色的花种在同一花坛的概率是( )
A. B.
C. D.
解析:选C 把这4种颜色的花种在两个花坛中的所有情况为(红,黄),(白,紫);(红,白),(黄,紫);(红,紫),(黄,白);(黄,白),(红,紫);(黄,紫),(红,白);(白,紫),(红,黄),共有6种,其中红色和紫色的花种在同一花坛的情况有2种,所以红色和紫色的花种在同一花坛的概率P==.
4.(2018·全国卷Ⅰ)如图,来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC的斜边BC,直角边AB,AC.△ABC的三边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ.在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为p1,p2,p3,则( )
A.p1=p2 B.p1=p3
C.p2=p3 D.p1=p2+p3
解析:选A 法一:∵S△ABC=AB·AC,以AB为直径的半圆的面积为π·2=AB2,以AC为直径的半圆的面积为π·2=AC2,以BC为直径的半圆的面积为π·2=BC2,
∴SⅠ=AB·AC,
SⅢ=BC2-AB·AC,
SⅡ=-
=AB·AC.
∴SⅠ=SⅡ.
由几何概型概率公式得p1=,p2=,
∴p1=p2.故选A.
法二:不妨设△ABC为等腰直角三角形,
AB=AC=2,则BC=2,
所以区域Ⅰ的面积即△ABC的面积,
为S1=×2×2=2,
区域Ⅱ的面积S2=π×12-=2,
区域Ⅲ的面积S3=-2=π-2.
根据几何概型的概率计算公式,
得p1=p2=,p3=,
所以p1≠p3,p2≠p3,
p1≠p2+p3,故选A.
[系统方法]
古典概型、几何概型概率的求法
(1)求古典概型的概率,关键是正确求出基本事件总数和所求事件包含的基本事件总数.常常用到排列、组合的有关知识,计数时要正确分类,做到不重不漏.
(2)求几何概型的概率,构成试验的全部结果的区域和事件发生的区域的寻找是关键,有时需要设出变量,在坐标系中表示所需要的区域.
相互独立事件与独立重复试验
[题组全练]
1.如图,四边形ABCD是以O为圆心、半径为1的圆的内接正方形,四边形EFGH是正方形ABCD的内接正方形,且E,F,G,H分别为AB,BC,CD,DA的中点.将一枚针随机掷到圆O内,用M表示事件“针落在正方形ABCD内”,N表示事件“针落在正方形EFGH内”,则P(N|M)等于( )
A. B.
C. D.
解析:选C 由已知得正方形ABCD的边长为,正方形EFGH的边长为1,
所以P(M)==,P(N)==.
因为P(MN)=P(N),
所以P(N|M)===.
2.生产某零件需要经过两道工序,在第一、第二道工序中产生废品的概率分别为0.01和p,每道工序产生废品相互独立.若经过两道工序后得到的零件不是废品的概率是0.960 3,则p=________.
解析:由题意得(1-0.01)(1-p)=0.960 3,
解得p=0.03.
答案:0.03
3.如图所示,某快递公司送货员从公司A处准备开车送货到某单位B处,有A→C→D→B,A→E→F→B两条路线.若该地各路段发生堵车与否是相互独立的,且各路段发生堵车事件的概率如图所示例如A→C→D算作两个路段,路段AC发生堵车事件的概率为,路段CD发生堵车事件的概率为.若使途中发生堵车事件的概率较小,则由A到B应选择的路线是________.
解析:由已知得路线A→C→D→B途中发生堵车事件的概率为P1=1-××=.
路线A→E→F→B途中发生堵车事件的概率P2=1-××=.
因为<,故应选择路线A→E→F→ B.
答案:A→E→F→B
[系统方法]
1.条件概率的求法
(1)利用定义,分别求P(A)和P(AB),得P(B|A)=.这是通用的求条件概率的方法.
(2)借助古典概型概率公式,先求事件A包含的基本事件数n(A),再在事件A发生的条件下求事件B包含的基本事件数,即n(AB),得P(B|A)=.
2.求复杂事件概率的方法及注意点
(1)直接法:正确分析复杂事件的构成,将复杂事件转化为几个彼此互斥的事件的和事件或几个相互独立事件同时发生的积事件或独立重复试验问题,然后用相应概率公式求解.
(2)间接法:当复杂事件正面情况较多,反面情况较少时,可利用其对立事件进行求解.对于“至少”“至多”等问题往往也用这种方法求解.
(3)注意点:注意辨别独立重复试验的基本特征:
①在每次试验中,试验结果只有发生与不发生两种情况;
②在每次试验中,事件发生的概率相同.
离散型随机变量的分布列及数学期望
[多维例析]
角度一 超几何分布与数学期望的求解
在心理学研究中,常采用对比试验的方法评价不同心理暗示对人的影响,具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示,另一组接受乙种心理暗示,通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗示的作用.现有6名男志愿者A1,A2,A3,A4,A5,A6和4名女志愿者B1,B2,B3,B4,从中随机抽取5人接受甲种心理暗示,另5人接受乙种心理暗示.
(1)求接受甲种心理暗示的志愿者中包含A1但不包含B1的概率;
(2)用X表示接受乙种心理暗示的女志愿者人数,求X的分布列与数学期望E(X).
[解] (1)记接受甲种心理暗示的志愿者中包含A1但不包含B1的事件为M,
则P(M)==.
(2)由题意知X可取的值为:0,1,2,3,4,则
P(X=0)==,
P(X=1)==,
P(X=2)==,
P(X=3)==,
P(X=4)==.
因此X的分布列为
X
0
1
2
3
4
P
故X的数学期望E(X)=0+1×+2×+3×+4×=2.
[类题通法]
1.离散型随机变量分布列的求解步骤
2.超几何分布的概率与期望的求法
对于实际问题中的随机变量X,如果能够断定它服从超几何分布H(N,M,n),则其概率、期望可直接利用公式P(X=k)=(k=0,1,…,m,其中m=min{M,n},且n≤N,M≤N,n,M,N∈N*),E(X)=求解.
角度二 二项分布与数学期望的求解
(2018·惠州第二次调研)某学校为了丰富学生的课余生活,以班级为单位组织学生开展古诗词背诵比赛,随机抽取一首,背诵正确加10分,背诵错误减10分,且背诵结果只有“正确”和“错误”两种.其中某班级学生背诵正确的概率p=,记该班级完成n首背诵后的总得分为Sn.
(1)求S6=20且Si≥0(i=1,2,3)的概率;
(2)记ξ=|S5|,求ξ的分布列及数学期望E(ξ).
[解] (1)当S6=20时,即背诵6首后,正确的有4首,错误的有2首.
由Si≥0(i=1,2,3)可知,若第一首和第二首背诵正确,则其余4首可任意背诵正确2首;
若第一首背诵正确,第二首背诵错误,第三首背诵正确,则其余3首可任意背诵正确2首.
则所求的概率P=2×C2×2+×××C2×=.
(2)由题意知ξ=|S5|的所有可能的取值为10,30,50,
又p=,
∴P(ξ=10)=C3×2+C2×3=,P(ξ=30)=C4×1+C1×4=,P(ξ=50)=C5×0+C0×5=,
∴ξ的分布列为
ξ
10
30
50
P
∴数学期望E(ξ)=10×+30×+50×=.
[类题通法] 与二项分布有关的期望、方差的求法
(1)求随机变量ξ的期望与方差时,可首先分析ξ是否服从二项分布,如果ξ~B(n,p),则用公式E(ξ)=np,D(ξ)=np(1-p)求解,可大大减少计算量.
(2)有些随机变量虽不服从二项分布,但与之具有线性关系的另一随机变量服从二项分布,这时,可以综合应用E(aξ+b)=aE(ξ)+b以及E(ξ)=np求出E(aξ+b),同样还可求出D(aξ+b).
角度三 相互独立事件的概率及其分布列、期望
(2019届高三·益阳、湘潭调研)某乒乓球俱乐部派甲、乙、丙三名运动员参加某运动会的单打资格选拔赛,本次选拔赛只有出线和未出线两种情况.规定一名运动员出线记1分,未出线记0分.假设甲、乙、丙出线的概率分别为,,,他们出线与未出线是相互独立的.
(1)求在这次选拔赛中,这三名运动员至少有一名出线的概率;
(2)记在这次选拔赛中,甲、乙、丙三名运动员的得分之和为随机变量ξ,求随机变量ξ的分布列和数学期望E(ξ).
[解] (1)记“甲出线”为事件A,“乙出线”为事件B,“丙出线”为事件C,“甲、乙、丙至少有一名出线”为事件D,
则P(D)=1-P( )=1-××=.
(2)由题意可得,ξ的所有可能取值为0,1,2,3,
则P(ξ=0)=P( )=××=,
P(ξ=1)=P(A )+P( B)+P( C)=××+××+××=,
P(ξ=2)=P(A B )+P(A C)+P(BC)=××+××+××=,
P(ξ=3)=P(ABC)=××=.
所以ξ的分布列为
ξ
0
1
2
3
P
E(ξ)=0×+1×+2×+3×=.
[类题通法] 解相互独立事件概率问题的策略
(1)会分拆事件,即先把事件分拆成若干个互斥事件,再把其中的每个事件分拆成若干个相互独立事件;
(2)会用公式,若事件A,B是相互独立事件,则P(AB)=P(A)P(B),若事件A,B是互斥事件,则P(A+B)=P(A)+P(B).
[综合训练]
(2017·全国卷Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
最高气温
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40)
天数
2
16
36
25
7
4
以最高气温位于各区间的频率代替最高气温位于该区间的概率.
(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;
(2)设六月份一天销售这种酸奶的利润为Y(单位:元).当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?
解:(1)由题意知,X所有可能取值为200,300,500,
由表格数据知
P(X=200)==0.2,P(X=300)==0.4,
P(X=500)==0.4.
因此X的分布列为:
X
200
300
500
P
0.2
0.4
0.4
(2)由题意知,这种酸奶一天的需求量至多为500,至少为200,因此只需考虑200≤n≤500.
当300≤n≤500时,
若最高气温不低于25,则Y=6n-4n=2n;
若最高气温位于区间[20,25),则Y=6×300+2(n-300)-4n=1 200-2n;
若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n.
因此E(Y)=2n×0.4+(1 200-2n)×0.4+(800-2n)×0.2=640-0.4n.
当200≤n<300时,
若最高气温不低于20,则Y=6n-4n=2n;
若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n.
因此E(Y)=2n×(0.4+0.4)+(800-2n)×0.2=160+1.2n.
所以n=300时,Y的数学期望达到最大值,最大值为520元.
样本的均值、方差与正态分布的综合问题
[由题知法]
为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
①试说明上述监控生产过程方法的合理性;
②下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得=i=9.97,s==≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(-3,+3)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-3σ
X的数学期望为EX=16×0.002 6=0.041 6.
(2)①如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
②由=9.97,s≈0.212,得μ的估计值为=9.97,σ的估计值为=0.212,由样本数据可以看出有一个零件的尺寸在(-3,+3)之外,因此需对当天的生产过程进行检查.
剔除(-3,+3)之外的数据9.22,剩下数据的平均数为(16×9.97-9.22)=10.02,
因此μ的估计值为10.02.
=16×0.2122+16×9.972≈1 591.134,
剔除(-3,+3)之外的数据9.22,剩下数据的样本方差为(1 591.134-9.222-15×10.022)≈0.008,
因此σ的估计值为≈0.09.
[类题通法] 正态分布下两类常见的概率计算
(1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x=μ对称,曲线与x轴之间的面积为1.
(2)利用3σ原则求概率问题时,要注意把给出的区间或范围与正态变量的μ,σ进行对比联系,确定它们属于(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)中的哪一个.
[应用通关]
从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图.
(1)求这500件产品质量指标值的样本平均数和样本方差s2(同一组中的数据用该组区间的中点值作代表).
(2)由直方图可以认为,这种产品的质量指标值Z服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2.
①利用该正态分布,求P(187.8
附:≈12.2.若Z~N(μ,σ2),则P(μ-σ
s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+0×0.33+102×0.24+202×0.08+302×0.02=150.
(2)①由(1)知,Z~N(200,150),从而P(187.8
依题意知X~B(100,0.682 7),
所以E(X)=100×0.682 7=68.27.
[高考大题通法点拨]
概率与统计问题重在“辨”——辨析、辨型
[思维流程]
[策略指导]
(1)准确弄清问题所涉及的事件有什么特点,事件之间有什么关系,如互斥、对立、独立等;
(2)理清事件以什么形式发生,如同时发生、至少有几个发生、至多有几个发生、恰有几个发生等;
(3)明确抽取方式,如放回还是不放回、抽取有无顺序等;
(4)准确选择排列组合的方法来计算基本事件发生数和事件总数,或根据概率计算公式和性质来计算事件的概率;
(5)确定随机变量取值并求其对应的概率,写出分布列后再求期望.
(6)会套用求、K2的公式求值,再作进一步求值与分析.
某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数
0
1
2
3
4
≥5
保费
0.85a
a
1.25a
1.5a
1.75a
2a
设该险种一续保人一年内出险次数与相应概率如下:
一年内出险次数
0
1
2
3
4
≥5
概率
0.30
0.15
0.20
0.20
0.10
0.05
(1)求一续保人本年度的保费高于基本保费的概率;
(2)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率;
(3)求续保人本年度的平均保费与基本保费的比值.
[破题思路]
第(1)问
求什么想什么
求一续保人本年度的保费高于基本保费的概率,想到保费高于基本保费的出现次数及相应的概率
给什么用什么
题目中的表格给出了一年内出险次数所对应的概率和保费,想到互斥事件的概率,利用互斥事件的概率公式求解
第(2)问
求什么想什么
求其保费比基本保费高出60%的概率,想到保费比基本保费高出60%的情况有哪些
给什么用什么
题目给出的条件为“一续保人本年度的保费高于基本保费”,因此根据条件概率的定义可知该事件属于条件概率,可用条件概率公式求解
缺什么找什么
要利用条件概率公式求解,缺少“一续保人本年度的保费高于基本保费”的概率以及“该续保人本年度的保费高于基本保费且保费比基本保费高出60%的概率”,从题目表格中的数据可知
第(3)问
求什么想什么
求续保人本年度的平均保费与基本保费的比值,想到求平均保费即保费的均值
给什么用什么
结合题目中的两个表格,可知保费为0.85a,a,1.25a,1.5a,1.75a,2a,所对应的概率分别为0.30,0.15,0.20,0.20,0.10,0.05,利用均值公式求解即可
[规范解答]
(1)设A表示事件:“一续保人本年度的保费高于基本保费”,
则事件A发生当且仅当一年内出险次数大于1,故P(A)=0.20+0.20+0.10+0.05=0.55.
(2)设B表示事件:“一续保人本年度的保费比基本保费高出60%”,则事件B发生当且仅当一年内出险次数大于3,故P(B)=0.10+0.05=0.15.
又P(AB)=P(B),
故P(B|A)==
==.
因此所求概率为.
(3)记续保人本年度的保费为X,则X的分布列为
X
0.85a
a
1.25a
1.5a
1.75a
2a
P
0.30
0.15
0.20
0.20
0.10
0.05
E(X)=0.85a×0.30+a×0.15+1.25a×0.20+1.5a×0.20+1.75a×0.10+2a×0.05=1.23a.
因此续保人本年度的平均保费与基本保费的比值为1.23.
[关键点拨]
(1)会判断,先判断事件的类型,再利用对立事件的概率公式、条件概率的公式等求解概率;
(2)会计算,要求随机变量X的期望,需先求出X的所有可能取值,然后求出随机变量X取每个值时的概率,再利用随机变量的数学期望的定义进行计算.
为研究家用轿车在高速公路上的车速情况,交通部门随机选取100名家用轿车驾驶员进行调查,得到其在高速公路上行驶时的平均车速情况为:在55名男性驾驶员中,平均车速超过100 km/h的有40人,不超过100 km/h 的有15人;在45名女性驾驶员中,平均车速超过100 km/h的有20人,不超过100 km/h的有25人.
(1)完成下面列联表,并判断能否在犯错误概率不超过0.005 的前提下认为“平均车速超过100 km/h与性别有关”?
平均车速超过100 km/h
平均车速不超过100 km/h
总计
男性驾驶员
女性驾驶员
总计
附:K2=,其中n=a+b+c+ d.
P(K2≥k0)
0.150
0.100
0.050
0.010
0.005
0.001
k0
2.072
2.706
3.841
6.635
7.879
10.828
(2)在被调查的驾驶员中,从平均车速不超过100 km/h的人中随机抽取2人,求这2人恰好有1名男性驾驶员和1名女性驾驶员的概率;
(3)以样本数据估计总体,从高速公路上行驶的家用轿车中随机抽取3辆,记这3辆车平均车速超过100 km/h且为男性驾驶员的车辆数为X,求X的分布列和数学期望E(X).
[破题思路]
第(1)问
求什么想什么
判断能否在犯错误概率不超过0.005的前提下认为“平均车速超过100 km/h与性别有关”,想到计算K2的观测值
给什么用什么
分别给出55名男性驾驶员和45名女性驾驶员中平均速度超过100 km/h和不超过100 km/h的人数,利用2×2列联表进行数据整理,并代入K2公式求解,并对照附表中数据给出结论
第(2)问
求什么想什么
求抽取的2人中恰有1名男性驾驶员和1名女性驾驶员的概率,想到判断概率模型及相应的概率公式
给什么用什么
题目条件中给出平均车速不超过100 km/h的男、女驾驶员的人数,可借助组合的知识求出从中随机抽取2人的所有情况数及恰有1男、1女的情况,代入古典概型的概率公式求解即可
第(3)问
求什么想什么
求X的分布列和E(X),想到X的可能取值及其对应的概率值
给什么用什么
题目条件中给出抽样方法,由于是从高速公路上行驶的家用轿车中随机抽取3辆,总体容量非常大,故可认为该抽样中的随机变量服从二项分布
差什么找什么
缺少X的可能取值及其对应的概率值,结合已知条件,利用二项分布求得分布列及E(X)
[规范解答]
(1)完成的列联表如下:
平均车速超过100 km/h
平均车速不超过100 km/h
总计
男性驾驶员
40
15
55
女性驾驶员
20
25
45
总计
60
40
100
由表中数据得K2的观测值k=≈8.249>7.879,
所以能在犯错误的概率不超过0.005的前提下认为“平均车速超过100 km/h与性别有关”.
(2)平均车速不超过100 km/h的驾驶员有40人,从中随机抽取2人的方法总数为C,记
“这2人恰好有1名男性驾驶员和1名女性驾驶员”为事件A,
则事件A所包含的基本事件数为CC,
所以所求的概率P(A)===.
(3)根据样本估计总体的思想,从总体中任取1辆车,平均车速超过100 km/h且为男性驾驶员的概率为=,
故X~B.
所以P(X=0)
=C03=,
P(X=1)=C12=,
P(X=2)=C21=,
P(X=3)=C30=.
所以X的分布列为
X
0
1
2
3
P
E(X)=0×+1×+2×+3×=.
[关键点拨]
(1)会利用两个基本计数原理、排列与组合,以及古典概型的概率公式求随机变量的概率;能准确判断随机变量X的所有可能取值,然后求出随机变量X取每个值时的概率,即可得随机变量X的分布列;还需活用定义,即会活用随机变量的数学期望的定义进行计算.
(2)独立性检验是用来考察两个分类变量是否有关系,计算随机变量的观测值K2,K2越大,说明两个分类变量有关系的可能性越大.
[对点训练]
(2018·辽宁大连期中)某工厂为了对新研发的产品进行合理定价,将该产品按事先拟定的单价进行试销,得到一组检测数据(xi,yi)(i=1,2,…,6)如表所示.
试销单价x/元
4
5
6
7
a
9
产品销量y/件
b
84
83
80
75
68
已知变量x,y具有线性负相关关系,且i=39,i=480,现有甲、乙、丙三位同学通过计算求得其回归方程分别为:甲:y=4x+54;乙:y=-4x+106;丙:y=-4.2x+105.其中有且仅有一位同学的计算结果是正确的.
(1)试判断谁的计算结果正确,并求出a,b的值;
(2)若由线性回归方程得到的估计数据(xi,i)中的i与检测数据(xi,yi)中的yi差的绝对值不超过1,则称该检测数据是“理想数据”,现从检测数据中随机抽取3个,求“理想数据”的个数ξ的分布列和数学期望.
解:(1)已知变量x,y具有线性负相关关系,故甲的计算结果不对,由题意得,==6.5,==80,
将=6.5,=80分别代入乙、丙的回归方程,经验证知乙的计算结果正确,
故回归方程为y=-4x+106.
由i=4+5+6+7+a+9=39,得a=8,
由i=b+84+83+80+75+68=480,得b=90.
(2)列出估计数据(xi,i)与检测数据(xi,yi)如表.
x
4
5
6
7
8
9
y
90
84
83
80
75
68
90
86
82
78
74
70
易知有3个“理想数据”,故“理想数据”的个数ξ的所有可能取值为0,1,2,3.
P(ξ=0)==,P(ξ=1)==,
P(ξ=2)==,
P(ξ=3)==.
故ξ的分布列为
ξ
0
1
2
3
P
E(ξ)=0×+1×+2×+3×=.
[总结升华]
概率与统计问题的求解关键是辨别它的模型,只要找到模型,问题便迎刃而解.而概率模型的提取往往需要经过观察、分析、归纳、判断等复杂的辨析思维过程,常常因题设条件理解不准,某个概念认识不清而误入歧途.另外,还需弄清楚概率模型中等可能事件、互斥事件、对立事件、独立事件等事件间的关系,注意放回和不放回试验的区别,合理划分复合事件.
[专题跟踪检测](对应配套卷P203)
一、全练保分考法——保大分
1.(2018·全国卷Ⅱ)我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30=7+23.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是( )
A. B.
C. D.
解析:选C 不超过30的所有素数为2,3,5,7,11,13,17,19,23,29,共10个,随机选取两个不同的数,共有C=45种情况,而和为30的有7+23,11+19,13+17这3种情况,∴所求概率为=.故选C.
2.(2018·武汉调研)将一枚质地均匀的骰子投掷两次,得到的点数依次记为a和b,则方程ax2+bx+1=0有实数解的概率是( )
A. B.
C. D.
解析:选C 投掷骰子两次,所得的点数a和b满足的关系为∴a和b的组合有36种,若方程ax2+bx+1=0有实数解,则Δ=b2-4a≥0,∴b2≥4a.
当b=1时,没有a符合条件;当b=2时,a可取1;当b=3时,a可取1,2;当b=4时,a可取1,2,3,4;当b=5时,a可取1,2,3,4,5,6;当b=6时,a可取1,2,3,4,5,6.
满足条件的组合有19种,则方程ax2+bx+1=0有实数解的概率P=.
3.(2018·合肥质检)已知某公司生产的一种产品的质量X(单位:克)服从正态分布N(100,4).现从该产品的生产线上随机抽取10 000件产品,其中质量在[98,104]内的产品估计有( )
附:若X服从正态分布N(μ,σ2),则P(μ-σ<X<μ+σ)≈0.682 7,P(μ-2σ<X<μ+2σ)≈0.954 5.
A.3 413件 B.4 772件
C.6 826件 D.8 186件
解析:选D 由题意知μ=100,σ=2,则P(98<X<104)=[P(μ-σ<X<μ+σ)+P(μ-2σ<X<μ+2σ)]≈0.818 6,所以质量在[98,104]内的产品估计有10 000×0.818 6=8 186件.
4.(2019届高三·洛阳联考)如图,圆O:x2+y2=π2内的正弦曲线y=sin x与x轴围成的区域记为M(图中阴影部分),随机往圆O内投一个点A,则点A落在区域M内的概率是( )
A. B.
C. D.
解析:选B 由题意知圆O的面积为π3,正弦曲线y=sin x,x∈[-π,π]与x轴围成的区域记为M,根据图形的对称性得区域M的面积S=2sin xdx=-2cos x=4,由几何概型的概率计算公式可得,随机往圆O内投一个点A,则点A落在区域M内的概率P=,故选 B.
5.(2018·潍坊模拟)某篮球队对队员进行考核,规则是:①每人进行3个轮次的投篮;②每个轮次每人投篮2次,若至少投中1次,则本轮通过,否则不通过.已知队员甲投篮1次投中的概率为,如果甲各次投篮投中与否互不影响,那么甲3个轮次通过的次数X的期望是( )
A.3 B.
C.2 D.
解析:选B 每个轮次甲不能通过的概率为×=,通过的概率为1-=,因为甲3个轮次通过的次数X服从二项分布B,所以X的数学期望为3×=.
6.(2018·潍坊模拟)如图,六边形ABCDEF是一个正六边形,若在正六边形内任取一点,则该点恰好在图中阴影部分的概率是( )
A. B.
C. D.
解析:选C 设正六边形的中心为点O,BD与AC交于点G,BC=1,则BG=CG,∠BGC=120°,在△BCG中,由余弦定理得1=BG2+BG2-2BG2cos 120°,得BG=,所以S△BCG=×BG×BG×sin 120°=×××=,因为S六边形ABCDEF=S△BOC×6=×1×1×sin 60°×6=,所以该点恰好在图中阴影部分的概率是1-=.
7.(2018·福州模拟)某商店随机将三幅分别印有福州三宝(脱胎漆器、角梳、油纸伞)的宣传画并排贴在同一面墙上,则角梳与油纸伞的宣传画相邻的概率是________.
解析:记脱胎漆器、角梳、油纸伞的宣传画分别为a,b,c,则并排贴的情况有abc,acb,bac,bca,cab,cba,共6种,其中b,c相邻的情况有abc,acb,bca,cba,共4种,故由古典概型的概率计算公式,得所求概率P==.
答案:
8.(2018·唐山模拟)向圆(x-2)2+(y-)2=4内随机投掷一点,则该点落在x轴下方的概率为________.
解析:如图,连接CA,CB,依题意,圆心C到x轴的距离为,所以弦AB的长为2.又圆的半径为2,所以弓形ADB的面积为×π×2-×2×=π-,所以向圆(x-2)2+(y-)2=4内随机投掷一点,则该点落在x轴下方的概率P=-.
答案:-
9.从混有5张假钞的20张百元钞票中任意抽取两张,将其中一张放到验钞机上检验发现是假钞,则两张都是假钞的概率是________.
解析:设事件A为“抽到的两张都是假钞”,事件B为“抽到的两张至少有一张假钞”,则所求的概率为P(A|B),
因为P(AB)=P(A)==,
P(B)==,
所以P(A|B)===.
答案:
10.(2018·唐山模拟)某篮球队在某赛季已结束的8场比赛中,队员甲得分统计的茎叶图如图.
(1)根据这8场比赛,估计甲每场比赛中得分的均值μ和标准差σ;
(2)假设甲在每场比赛的得分服从正态分布N(μ,σ2),且各场比赛间相互没有影响,依此估计甲在82场比赛中得分在26分以上的平均场数.
参考数据:
≈5.66,≈5.68,≈5.70.
正态总体N(μ,σ2)在区间(μ-2σ,μ+2σ)内取值的概率约为0.954.
解:(1)μ=(7+8+10+15+17+19+21+23)=15,σ2=[(-8)2+(-7)2+(-5)2+02+22+42+62+82]=32.25.
所以σ≈5.68.
所以估计甲每场比赛中得分的均值μ为15,标准差σ为5.68.
(2)由(1)得甲在每场比赛中得分在26分以上的概率
P(X≥26)≈[1-P(μ-2σ<X<μ+2σ)]≈(1-0.954)=0.023,
设在82场比赛中,甲得分在26分以上的次数为Y,则Y~B(82,0.023).Y的均值E(Y)=82×0.023=1.886.
由此估计甲在82场比赛中得分在26分以上的平均场数为1.886.
11.某化妆品公司从国外进口美容型和疗效型两种化妆品,分别经过本公司的两条生产线分装后进行销售,两种化妆品的标准质量都是100克/瓶,误差不超过±5克/瓶即视为合格产品,否则视为不合格产品.现随机抽取两种产品各60瓶进行检测,检测结果统计如下:
质量/克
[90,95)
[95,100)
[100,105)
[105,110]
美容型化妆品/瓶
5
22
23
10
疗效型化妆品/瓶
5
21
19
15
(1)根据上述检测结果,若从这两种化妆品中各任取一瓶,以频率作为概率,分别计算这两瓶化妆品为合格产品的概率;
(2)对于一瓶美容型化妆品,若是合格产品,则可获得的利润为a(单位:百元),若不是合格产品,则亏损a2(单位:百元);对于一瓶疗效型化妆品,若是合格产品,则可获得的利润为a(单位:百元),若不是合格产品,则亏损2a2(单位:百元).那么当a为何值时,该公司各销售一瓶这两种化妆品所获得的利润最大?
解:(1)由表可知,任取一瓶美容型化妆品,其为合格产品的概率为=;
任取一瓶疗效型化妆品,其为合格产品的概率为=.
(2)记X为任意一瓶美容型化妆品和一瓶疗效型化妆品所获得的利润之和,则X的所有可能取值为a,a-2a2,a-a2,-3a2,
则P=×=,
P(X=a-2a2)=×=,
P=×=,
P(X=-3a2)=×=,
所以随机变量X的分布列为
X
a
a-2a2
a-a2
-3a2
P
所以E(X)=a×+(a-2a2)×+×+(-3a2)×=-a2+a=-(a-2)2+,
所以当a=2时,E(X)取得最大值,
即当a为2时,该公司各销售一瓶这两种化妆品所获得的利润最大.
12.(2019届高三·贵阳模拟)从A地到B地共有两条路径L1和L2,经过这两条路径所用的时间互不影响,且经过L1和L2所用时间的频率分布直方图分别如图(1)和(2).现甲选择L1或L2在40分钟内从A地到B地,乙选择L1或L2在50分钟内从A地到B地.
(1)求图(1)中a的值;并回答,为了尽最大可能在各自允许的时间内赶到B地,甲和乙应如何选择各自的路径?
(2)用X表示甲、乙两人中在允许的时间内能赶到B地的人数,针对(1)中的选择方案,求X的分布列和数学期望.
解:(1)由图(1)可得(0.01+0.02×3+a)×10=1,
解得a=0.03,
用Ai表示甲选择Li(i=1,2)在40分钟内从A地到B地,用Bi表示乙选择Li(i=1,2)在50分钟内从A地到B地,则P(A1)=(0.01+0.02+0.03)×10=0.6,P(A2)=(0.01+0.04)×10=0.5,
因为P(A1)>P(A2),所以甲应选择L1.
又P(B1)=(0.01+0.02+0.03+0.02)×10=0.8,
P(B2)=(0.01+0.04+0.04)×10=0.9,
因为P(B2)>P(B1),所以乙应选择L2.
(2)用M,N分别表示针对(1)的选择方案,甲、乙两人在各自允许的时间内赶到B地,由(1)知P(M)=0.6,P(N)=0.9,X的可能取值为0,1,2.
由题意知,M,N相互独立,
∴P(X=0)=0.4×0.1=0.04,
P(X=1)=0.4×0.9+0.6×0.1=0.42,
P(X=2)=0.6×0.9=0.54,
∴X的分布列为
X
0
1
2
P
0.04
0.42
0.54
∴E(X)=0×0.04+1×0.42+2×0.54=1.5.
13.(2018·全国卷Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验.设每件产品为不合格品的概率都为p(0 (1)记20件产品中恰有2件不合格品的概率为f (p),求f (p)的最大值点p0.
(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.
①若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求EX;
②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
解:(1)因为20件产品中恰有2件不合格品的概率为
f (p)=Cp2·(1-p)18,
所以f ′(p)=C[2p(1-p)18-18p2(1-p)17]
=2Cp(1-p)17(1-10p).
令f ′(p)=0,得p=0.1.
当p∈(0,0.1)时,f ′(p)>0;
当p∈(0.1,1)时,f ′(p)<0.
所以f (p)的最大值点为p0=0.1.
(2)由(1)知,p=0.1.
①令Y表示余下的180件产品中的不合格品件数,依题意知Y~B(180,0.1),X=20×2+25Y,即X=40+25Y.所以EX=E(40+25Y)=40+25EY=490.
②若对余下的产品作检验,则这一箱产品所需要的检验费用为400元.由于EX>400,故应该对余下的产品作检验.
二、加练大题考法——少失分
1.(2018·郑州质检)为了减少雾霾,还城市一片蓝天,某市政府于12月4日到12月31日在主城区实行车辆限号出行政策,鼓励民众不开车低碳出行.市政府为了了解民众低碳出行的情况,统计了该市甲、乙两个单位各200名员工12月5日到12月14日共10天的低碳出行的人数,画出茎叶图如图所示,
(1)若甲单位数据的平均数是122,求x的值;
(2)现从图中的数据中任取4天的数据(甲、乙两个单位中各取2天),记抽取的4天中甲、乙两个单位员工低碳出行的人数不低于130的天数分别为ξ1,ξ2,令η=ξ1+ξ2,求η的分布列和数学期望.
解:(1)由题意知,×[105+107+113+115+119+126+(120+x)+132+134+141]=122,解得x=8.
(2)由题得ξ1的所有可能取值为0,1,2,ξ2的所有可能取值为0,1,2,因为η=ξ1+ξ2,所以随机变量η的所有可能取值为0,1,2,3,4.
因为甲单位低碳出行的人数不低于130的天数为3,乙单位低碳出行的人数不低于130的天数为4,
所以P(η=0)==,
P(η=1)==,
P(η=2)==,
P(η=3)==,
P(η=4)==.
所以η的分布列为
η
0
1
2
3
4
P
所以E(η)=0×+1×+2×+3×+4×=.
2.(2018·福州模拟)某学校八年级共有学生400人,现对该校八年级学生随机抽取50名进行实践操作能力测试,实践操作能力测试结果分为四个等级水平,一、二等级水平的学生实践操作能力较弱,三、四等级水平的学生实践操作能力较强,测试结果统计如下表:
等级
水平一
水平二
水平三
水平四
男生/名
4
8
12
6
女生/名
6
8
4
2
(1)根据表中统计的数据填写下面2×2列联表,并判断是否有95%的把握认为学生实践操作能力强弱与性别有关?
实践操作能力较弱
实践操作能力较强
总计
男生/名
女生/名
总计
(2)现从测试结果为水平一的学生中随机抽取4名进行学习能力测试,记抽到水平一的男生的人数为ξ,求ξ的分布列和数学期望.
下面的临界值表供参考:
P(K2≥k0)
0.10
0.05
0.010
0.005
0.001
k0
2.706
3.841
6.635
7.879
10.828
参考公式:K2=,
其中n=a+b+c+d.
解:(1)补充2×2列联表如下:
实践操作能力较弱
实践操作能力较强
总计
男生/名
12
18
30
女生/名
14
6
20
总计
26
24
50
∴K2=≈4.327>3.841.
∴有95%的把握认为学生实践操作能力强弱与性别有关.
(2)ξ的可能取值为0,1,2,3,4.
P(ξ=0)==,P(ξ=1)==,
P(ξ=2)==,P(ξ=3)==,
P(ξ=4)==.
∴ξ的分布列为
ξ
0
1
2
3
4
P
∴E(ξ)=0×+1×+2×+3×+4×=.
3.(2018·开封模拟)某产品按行业生产标准分成8个等级,等级系数X依次为1,2,…,8,其中X≥5为标准A,X≥3为标准B,已知甲厂执行标准A生产该产品,产品的零售价为6元/件;乙厂执行标准B生产该产品,产品的零售价为4元/件.假定甲、乙两厂的产品都符合相应的执行标准.
(1)已知甲厂产品的等级系数X1的概率分布列如下表所示:
X1
5
6
7
8
P
0.4
a
b
0.1
且X1的数学期望E(X1)=6,求a,b的值;
(2)为分析乙厂产品的等级系数X2,从该厂生产的产品中随机抽取30件,相应的等级系数组成一个样本,数据如下:
用这个样本的频率分布估计总体分布,将频率视为概率,求等级系数X2的数学期望;
(3)在(1),(2)的条件下,若以“性价比”为判断标准,判断哪个工厂的产品更具可购买性?并说明理由.
注:①产品的“性价比”=产品的等级系数的数学期望/产品的零售价;
②“性价比”大的产品更具可购买性.
解:(1)∵E(X1)=6,∴5×0.4+6a+7b+8×0.1=6,
即6a+7b=3.2.①
又0.4+a+b+0.1=1,即a+b=0.5.②
联立①②解得a=0.3,b=0.2.
(2)由已知,用这个样本的频率分布估计总体分布,将频率视为概率,可得等级系数X2的概率分布列如下:
X2
3
4
5
6
7
8
P
0.3
0.2
0.2
0.1
0.1
0.1
∴E(X2)=3×0.3+4×0.2+5×0.2+6×0.1+7×0.1+8×0.1=4.8,
即乙厂产品的等级系数X2的数学期望等于4.8.
(3)乙厂的产品更具可购买性,理由如下:
∵甲厂产品的等级系数的数学期望等于6,价格为6元/件,
∴其性价比为=1,
∵乙厂产品的等级系数的数学期望等于4.8,价格为4元/件,
∴其性价比为=1.2,
又1.2>1,∴乙厂的产品更具可购买性.
4.(2019届高三·洛阳联考)随着移动互联网的快速发展,基于互联网的共享单车应运而生.某市场研究人员为了了解共享单车运营公司M的经营状况,对该公司6个月内的市场占有率进行了统计,并绘制了相应的折线图.
(1)由折线图可以看出,可用线性回归模型拟合月度市场占有率y与月份代码x之间的关系.求y关于x的线性回归方程,并预测M公司2019年2月份(即x=8时)的市场占有率;
(2)为进一步扩大市场,公司拟再采购一批单车.现有采购成本分别为1 000元/辆和1 200元/辆的A,B两款车型可供选择,按规定每辆单车最多使用4年,但由于多种原因(如骑行频率等)会导致车辆使用年限各不相同.考虑到公司运营的经济效益,该公司决定先对两款车型的单车各100辆进行科学模拟测试,得到两款单车使用年限频数表如下:
使用年限
车型
1年
2年
3年
4年
总计
A
20
35
35
10
100
B
10
30
40
20
100
经测算,平均每辆单车每年可以带来收入500元.不考虑除采购成本之外的其他成本,假设每辆单车的使用年限都是整数,且以频率作为每辆单车使用年限的概率.如果你是M公司的负责人,以每辆单车产生利润的期望值为决策依据,你会选择采购哪款车型?
参考公式:回归直线方程为=x+,
其中=,=-.
解:(1)由数据计算可得==3.5,
==16.
iyi=1×11+2×13+3×16+4×15+5×20+6×21=371,
=12+22+32+42+52+62=91,
∴==2,=16-2×3.5=9.
∴月度市场占有率y与月份代码x之间的线性回归方程为=2x+9.
当x=8时,=2×8+9=25.
故M公司2019年2月份的市场占有率预计为25%.
(2)由频率估计概率,每辆A款车可使用1年,2年,3年和4年的概率分别为0.2,0.35,0.35和0.1,
∴每辆A款车产生利润的期望值为
E(X)=(500-1 000)×0.2+(1 000-1 000)×0.35+(1 500-1 000)×0.35+(2 000-1 000)×0.1=175(元).
由频率估计概率,每辆B款车可使用1年,2年,3年和4年的概率分别为0.1,0.3,0.4和0.2,
∴每辆B款车产生利润的期望值为
E(Y)=(500-1 200)×0.1+(1 000-1 200)×0.3+(1 500-1 200)×0.4+(2 000-1 200)×0.2=150(元).
∴E(X)>E(Y),∴应该采购A款单车.
相关资料
更多