高考数学科学创新复习方案提升版高考大题冲关系列(6)概率与随机变量及其分布列的热点题型学案(Word版附解析)
展开题型1 求离散型随机变量的均值与方差
例1 (2021·新高考Ⅰ卷)某学校组织“一带一路”知识竞赛,有A,B两类问题.每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分.已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.
(1)若小明先回答A类问题,记X为小明的累计得分,求X的分布列;
(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.
解 (1)随机变量X的所有可能取值为0,20,100.
P(X=0)=1-0.8=0.2,P(X=20)=0.8×(1-0.6)=0.32,P(X=100)=0.8×0.6=0.48.
故随机变量X的分布列如下:
(2)设小明先回答B类问题,记Y为小明的累计得分,
则随机变量Y的所有可能取值为0,80,100,
P(Y=0)=1-0.6=0.4,P(Y=80)=0.6×(1-0.8)=0.12,P(Y=100)=0.6×0.8=0.48.
故E(Y)=0×0.4+80×0.12+100×0.48=57.6.
由(1)知E(X)=0×0.2+20×0.32+100×0.48=54.4.
因为E(Y)>E(X),故应先回答B类问题.
变式训练1 (2024·保定开学考试)2015年5月,国务院印发《中国制造2025》,是我国由制造业大国转向制造业强国战略的行动纲领.经过多年的发展,我国制造业的水平有了很大的提高,出现了一批在国际上有影响的制造企业.我国的造船业、光伏产业、5G等已经在国际上处于领先地位,我国的精密制造也有了长足发展.已知某精密设备制造企业生产某种零件,根据长期检测结果,得知生产该零件的生产线的产品质量指标值X服从正态分布N(64,100),且质量指标值在[54,84]内的零件称为优等品.
(1)求该企业生产的零件为优等品的概率(结果精确到0.01);
(2)从该生产线生产的零件中随机抽取5件,随机变量Y表示抽取的5件中优等品的个数,求Y的分布列、数学期望和方差.
附:若X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.6827,P(μ-2σ≤X≤μ+2σ)≈0.9545,P(μ-3σ≤X≤μ+3σ)≈0.9973.
解 (1)由题意知,X~N(64,100),则μ=64,σ=10,54=μ-σ,84=μ+2σ,
由P(μ-σ≤X≤μ+σ)≈0.6827,
P(μ-2σ≤X≤μ+2σ)≈0.9545,
得P(54≤X≤84)=P(54≤X≤64)+P(64≤X≤84)=eq \f(1,2)×0.6827+eq \f(1,2)×0.9545≈0.82.
故该企业生产的零件为优等品的概率为0.82.
(2)Y的所有可能取值为0,1,2,3,4,5,
P(Y=0)=(1-0.82)5,
P(Y=1)=Ceq \\al(1,5)×0.82×(1-0.82)4,
P(Y=2)=Ceq \\al(2,5)×0.822×(1-0.82)3,
P(Y=3)=Ceq \\al(3,5)×0.823×(1-0.82)2,
P(Y=4)=Ceq \\al(4,5)×0.824×(1-0.82),
P(Y=5)=0.825,
则Y的分布列为
由Y~B(5,0.82),则E(Y)=5×0.82=4.1,D(Y)=5×0.82×(1-0.82)=0.738.
题型2 概率与统计的综合问题
例2 (2022·新高考Ⅱ卷)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;
(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001)
解 (1)平均年龄eq \(x,\s\up6(-))=(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023+55×0.020+65×0.017+75×0.006+85×0.002)×10=47.9(岁).
(2)由于患者的年龄位于区间[20,70)是由患者的年龄位于区间[20,30),[30,40),[40,50),[50,60),[60,70)组成的,
所以所求概率P=(0.012+0.017×2+0.023+0.020)×10=0.89.
(3)设从该地区任选一人,年龄位于区间[40,50)为事件A,患这种疾病为事件B,则P(A)=16%,
由频率分布直方图知,这种疾病患者的年龄位于区间[40,50)的概率为0.023×10=0.23,
结合该地区这种疾病的患病率为0.1%,可得P(AB)=0.1%×0.23=0.00023,
所以从该地区任选一人,若年龄位于区间[40,50),则此人患这种疾病的概率为P(B|A)=eq \f(P(AB),P(A))=eq \f(0.00023,16%)≈0.0014.
变式训练2 (2023·深圳模拟)某校举行“学习二十大,奋进新征程”知识竞赛,知识竞赛包含预赛和决赛.
(1)下表为某10位同学的预赛成绩:
求该10位同学预赛成绩的上四分位数(第75百分位数)和平均数;
(2)决赛共有编号为A,B,C,D,E的5道题,学生甲按照A,B,C,D,E的顺序依次作答,答对的概率依次为eq \f(2,3),eq \f(1,2),eq \f(1,2),eq \f(1,3),eq \f(1,3),各题作答互不影响,若累计答错两道题或五道题全部答完则比赛结束,记X为比赛结束时学生甲已作答的题数,求X的分布列和数学期望.
解 (1)因为10×0.75=7.5,所以上四分位数为第8个成绩,为96;
平均数为eq \f(93×2+94×2+95×3+96+97+98,10)=95.
(2)由题意可知,X的所有可能取值为2,3,4,5,
所以P(X=2)=eq \f(1,3)×eq \f(1,2)=eq \f(1,6),
P(X=3)=eq \f(1,3)×eq \f(1,2)×eq \f(1,2)+eq \f(2,3)×eq \f(1,2)×eq \f(1,2)=eq \f(3,12)=eq \f(1,4),
P(X=4)=eq \f(1,3)×eq \f(1,2)×eq \f(1,2)×eq \f(2,3)+eq \f(2,3)×eq \f(1,2)×eq \f(1,2)×eq \f(2,3)+eq \f(2,3)×eq \f(1,2)×eq \f(1,2)×eq \f(2,3)=eq \f(10,36)=eq \f(5,18),
P(X=5)=eq \f(2,3)×eq \f(1,2)×eq \f(1,2)×eq \f(1,3)+eq \f(1,3)×eq \f(1,2)×eq \f(1,2)×eq \f(1,3)+eq \f(2,3)×eq \f(1,2)×eq \f(1,2)×eq \f(1,3)+eq \f(2,3)×eq \f(1,2)×eq \f(1,2)×eq \f(1,3)+eq \f(2,3)×eq \f(1,2)×eq \f(1,2)×eq \f(2,3)=eq \f(11,36),
所以X的分布列为
E(X)=2×eq \f(1,6)+3×eq \f(1,4)+4×eq \f(5,18)+5×eq \f(11,36)=eq \f(134,36)=eq \f(67,18).
题型3 概率与线性回归的综合问题
例3 某人经营淡水池塘养草鱼,根据过去40期的养殖档案,该池塘的养殖重量X(百斤)都在20百斤以上,其中不足40百斤的有8期,不低于40百斤且不超过60百斤的有24期,超过60百斤的有8期.根据统计,该池塘的草鱼重量的增加量y(百斤)与使用某种饵料的质量x(百斤)之间的关系如图所示.
(1)根据数据可知y与x具有线性相关关系,请建立y关于x的经验回归方程eq \a\vs4\al(\(y,\s\up6(^)))=eq \a\vs4\al(\(b,\s\up6(^)))x+eq \a\vs4\al(\(a,\s\up6(^)));如果此人设想使用某种饵料10百斤时,草鱼重量的增加量须多于5百斤,请根据回归方程计算,确定此方案是否可行?并说明理由;
(2)养鱼的池塘对水质含氧量与新鲜度要求较高,某商家为该养殖户提供收费服务,即提供不超过3台增氧冲水机,每期养殖使用的增氧冲水机运行台数与鱼塘的鱼重量X有如下关系:
若某台增氧冲水机运行,则商家每期可获利5千元;若某台增氧冲水机未运行,则商家每期亏损2千元.视频率为概率,商家欲使每期增氧冲水机总利润的均值达到最大,应提供几台增氧冲水机?
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归直线eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))的斜率和截距的最小二乘估计公式分别为eq \(b,\s\up6(^))=
解 (1)依题意,得
所以eq \(y,\s\up6(^))=eq \f(3,13)x+eq \f(37,13),
当x=10时,eq \(y,\s\up6(^))=eq \f(67,13)>5,故此方案可行.
(2)设盈利为Y,提供1台,盈利Y=5000.
提供2台,当20
所以E(Y)=eq \f(1,5)×3000+eq \f(4,5)×10000=8600.
提供3台,当20
当X>60时,Y=15000,P=eq \f(1,5).
所以E(Y)=1000×eq \f(1,5)+8000×eq \f(3,5)+15000×eq \f(1,5)=8000.
因为8600>8000,故应提供2台增氧冲水机.
变式训练3 抗体药物的研究是生物技术制药领域的一个重要组成部分,抗体药物的摄入量与体内抗体数量的关系成为研究抗体药物的一个重要方面.某研究团队收集了10组抗体药物的摄入量与体内抗体数量的数据,并对这些数据做了初步处理,得到了如图所示的散点图及一些统计量的值,抗体药物摄入量为x(单位:mg),体内抗体数量为y(单位:AU/mL).
表中ti=ln xi,si=ln yi.
(1)根据经验,我们选择y=cxd作为体内抗体数量y关于抗体药物摄入量x的经验回归方程,将y=cxd两边取对数,得ln y=ln c+dln x,可以看出ln x与ln y具有线性相关关系,试根据参考数据建立y关于x的经验回归方程,并预测抗体药物摄入量为25 mg时,体内抗体数量y的值;
(2)经技术改造后,该抗体药物的有效率z大幅提高,经试验统计得z服从正态分布N(0.48,0.032),那这种抗体药物的有效率z超过0.54的概率约为多少?
附:①对于一组数据(ui,vi)(i=1,2,…,n),其经验回归直线eq \(v,\s\up6(^))=eq \(β,\s\up6(^))u+eq \(α,\s\up6(^))的斜率和截距的最小二乘估计分别为eq \(β,\s\up6(^))=eq \f(\(∑,\s\up10(n),\s\d8(i=1))uivi-n\(u,\s\up6(-))\(v,\s\up6(-)),\(∑,\s\up10(n),\s\d8(i=1))ueq \\al(2,i)-n\(u,\s\up6(-))2),eq \(α,\s\up6(^))=eq \(v,\s\up6(-))-eq \(β,\s\up6(^))eq \(u,\s\up6(-));
②若随机变量Z~N(μ,σ2),则有P(μ-σ≤Z≤μ+σ)≈0.6827,P(μ-2σ≤Z≤μ+2σ)≈0.9545,P(μ-3σ≤Z≤μ+3σ)≈0.9974;
③取e≈2.7.
解 (1)将y=cxd两边取对数,得ln y=ln c+dln x,
由题知,s=ln y,t=ln x,则经验回归方程变为s=ln c+dt,
由表中数据可知,eq \(s,\s\up6(-))=eq \f(1,10)eq \(∑,\s\up10(10),\s\d8(i=1))si=1.6,eq \(t,\s\up6(-))=eq \f(1,10)eq \(∑,\s\up10(10),\s\d8(i=1))ti=1.2,
所以eq \(d,\s\up6(^))=eq \f(\(∑,\s\up10(10),\s\d8(i=1))tisi-10\(t,\s\up6(-))\(s,\s\up6(-)),\(∑,\s\up10(10),\s\d8(i=1))teq \\al(2,i)-10\(t,\s\up6(-))2)=eq \f(29.2-10×1.2×1.6,34.4-10×1.22)=0.5,ln eq \(c,\s\up6(^))=eq \(s,\s\up6(-))-eq \(d,\s\up6(^))eq \(t,\s\up6(-))=1.6-0.5×1.2=1,
所以eq \(s,\s\up6(^))=1+0.5t,即ln eq \(y,\s\up6(^))=1+0.5ln x=ln e+ln x0.5=ln ex0.5,
故y关于x的经验回归方程为eq \(y,\s\up6(^))=ex0.5,
当x=25 mg时,eq \(y,\s\up6(^))=e·250.5≈2.7×5=13.5 AU/mL.
(2)因为z服从正态分布N(0.48,0.032),其中μ=0.48,σ=0.03,
所以P(μ-2σ≤z≤μ+2σ)=P(0.42≤z≤0.54)≈0.9545,
所以P(z>0.54)=eq \f(1-P(0.42≤z≤0.54),2)≈eq \f(1-0.9545,2)=0.02275.
故这种抗体药物的有效率z超过0.54的概率约为0.02275.
题型4 概率与独立性检验的综合问题
例4 (2022·新高考Ⅰ卷改编)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
(1)依据小概率值α=0.010的独立性检验,能否认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.eq \f(P(B|A),P(\(B,\s\up6(-))|A))与eq \f(P(B|\(A,\s\up6(-))),P(\(B,\s\up6(-))|\(A,\s\up6(-))))的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(ⅰ)证明:R=eq \f(P(A|B),P(\(A,\s\up6(-))|B))·eq \f(P(\(A,\s\up6(-))|\(B,\s\up6(-))),P(A|\(B,\s\up6(-))));
(ⅱ)利用该调查数据,给出P(A|B),P(A|eq \(B,\s\up6(-)))的估计值,并利用(ⅰ)的结果给出R的估计值.
附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),
解 (1)零假设H0:患该疾病群体与未患该疾病群体的卫生习惯无差异.
χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))
=eq \f(200×(40×90-60×10)2,100×100×50×150)
=24>6.635=x0.010,
依据小概率值α=0.010的独立性检验,推断H0不成立,即认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)(ⅰ)证明:因为R=eq \f(P(B|A),P(\(B,\s\up6(-))|A))·eq \f(P(\(B,\s\up6(-))|\(A,\s\up6(-))),P(B|\(A,\s\up6(-))))=eq \f(P(AB),P(A))·eq \f(P(A),P(A\(B,\s\up6(-))))·eq \f(P(\(A,\s\up6(-))\(B,\s\up6(-))),P(\(A,\s\up6(-))))·eq \f(P(\(A,\s\up6(-))),P(\(A,\s\up6(-))B))=eq \f(P(AB),P(A\(B,\s\up6(-))))·eq \f(P(\(A,\s\up6(-))\(B,\s\up6(-))),P(\(A,\s\up6(-))B)),
而eq \f(P(A|B),P(\(A,\s\up6(-))|B))·eq \f(P(\(A,\s\up6(-))|\(B,\s\up6(-))),P(A|\(B,\s\up6(-))))=eq \f(P(AB),P(B))·eq \f(P(B),P(\(A,\s\up6(-))B))·eq \f(P(\(A,\s\up6(-))\(B,\s\up6(-))),P(\(B,\s\up6(-))))·eq \f(P(\(B,\s\up6(-))),P(A\(B,\s\up6(-))))=eq \f(P(AB),P(\(A,\s\up6(-))B))·eq \f(P(\(A,\s\up6(-))\(B,\s\up6(-))),P(A\(B,\s\up6(-)))),
所以R=eq \f(P(A|B),P(\(A,\s\up6(-))|B))·eq \f(P(\(A,\s\up6(-))|\(B,\s\up6(-))),P(A|\(B,\s\up6(-)))).
(ⅱ)由已知P(A|B)=eq \f(40,100)=eq \f(2,5),P(A|eq \(B,\s\up6(-)))=eq \f(10,100)=eq \f(1,10),
又P(eq \(A,\s\up6(-))|B)=eq \f(60,100)=eq \f(3,5),P(eq \(A,\s\up6(-))|eq \(B,\s\up6(-)))=eq \f(90,100)=eq \f(9,10),
所以R=eq \f(P(A|B),P(\(A,\s\up6(-))|B))·eq \f(P(\(A,\s\up6(-))|\(B,\s\up6(-))),P(A|\(B,\s\up6(-))))=6.
变式训练4 (2023·全国甲卷)为探究某药物对小鼠的生长抑制作用,将40只小鼠均分为两组,分别为对照组(不加药物)和实验组(加药物).
(1)设指定的两只小鼠中对照组小鼠数目为X,求X的分布列和数学期望;
(2)测得40只小鼠体重如下(单位:g):(已按从小到大排好)
对照组:
17.3 18.4 20.1 20.4 21.5 23.2 24.6 24.8 25.0 25.4
26.1 26.3 26.4 26.5 26.8 27.0 27.4 27.5 27.6 28.3
实验组:
5.4 6.6 6.8 6.9 7.8 8.2 9.4 10.0 10.4 11.2
14.4 17.3 19.2 20.2 23.6 23.8 24.5 25.1 25.2 26.0
(ⅰ)求40只小鼠体重的中位数m,并完成下面2×2列联表:
(ⅱ)根据2×2列联表,能否有95%的把握认为药物对小鼠生长有抑制作用?
参考数据:
解 (1)依题意,X的可能取值为0,1,2,
则P(X=0)=eq \f(Ceq \\al(0,20)Ceq \\al(2,20),Ceq \\al(2,40))=eq \f(19,78),
P(X=1)=eq \f(Ceq \\al(1,20)Ceq \\al(1,20),Ceq \\al(2,40))=eq \f(20,39),
P(X=2)=eq \f(Ceq \\al(2,20)Ceq \\al(0,20),Ceq \\al(2,40))=eq \f(19,78),
所以X的分布列为
故E(X)=0×eq \f(19,78)+1×eq \f(20,39)+2×eq \f(19,78)=1.
(2)(ⅰ)依题意,可知这40只小鼠体重的中位数是将两组数据合在一起,从小到大排好后第20位与第21位数据的平均数,
由于原数据已经按从小到大排好,所以我们只需要观察对照组第一排数据与实验组第二排数据即可,
可得第11位数据为14.4,后续依次为17.3,17.3,18.4,19.2,20.1,20.2,20.4,21.5,23.2,23.6,…,
故第20位数据为23.2,第21位数据为23.6,
所以m=eq \f(23.2+23.6,2)=23.4,
故列联表为
(ⅱ)由(ⅰ)可得,K2=eq \f(40×(6×6-14×14)2,20×20×20×20)=6.4>3.841,
所以能有95%的把握认为药物对小鼠生长有抑制作用.
X
0
20
100
P
0.2
0.32
0.48
离散型随机变量的均值和方差的求解,一般分两步:一是定型,即先判断随机变量的分布是特殊类型,还是一般类型,如两点分布、二项分布、超几何分布等属于特殊类型;二是定性,对于特殊类型的均值和方差可以直接代入相应公式求解,而对于一般类型的随机变量,应先求其分布列然后代入相应公式计算,注意离散型随机变量的取值与概率的对应.
Y
0
1
2
P
(1-0.82)5
Ceq \\al(1,5)×0.82×(1-0.82)4
Ceq \\al(2,5)×0.822×(1-0.82)3
Y
3
4
5
P
Ceq \\al(3,5)×0.823×(1-0.82)2
Ceq \\al(4,5)×0.824×(1-0.82)
0.825
概率与统计作为考查考生应用意识的重要载体,已成为高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.统计以考查抽样方法、样本的频率分布、样本特征数的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题.
得分
93
94
95
96
97
98
人数
2
2
3
1
1
1
X
2
3
4
5
P
eq \f(1,6)
eq \f(1,4)
eq \f(5,18)
eq \f(11,36)
鱼的重量(单位:百斤)
20
X>60
增氧冲水机运行台数
1
2
3
本题主要考查概率与回归方程等知识,考查学生的数据处理能力和应用意识,注意分析数据,定型求解,正确计算是关键.
eq \(∑,\s\up10(10),\s\d8(i=1))tisi
eq \(∑,\s\up10(10),\s\d8(i=1))ti
eq \(∑,\s\up10(10),\s\d8(i=1))si
eq \(∑,\s\up10(10),\s\d8(i=1))teq \\al(2,i)
29.2
12
16
34.4
组别
生活习惯
不够良好
良好
病例组
40
60
对照组
10
90
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
此类题目虽然涉及的知识点较多,但每个知识点考查程度相对较浅,考查深度有限,所以解决此类问题,最主要的是正确掌握概率与统计案例的基本知识,并能对这些知识点进行有效的融合,把统计图表中的量转化为概率及分布列求解中的有用的量是解决此类问题的关键所在.
<m
≥m
对照组
实验组
P(K2≥k0)
0.10
0.05
0.010
k0
2.706
3.841
6.635
X
0
1
2
P
eq \f(19,78)
eq \f(20,39)
eq \f(19,78)
<m
≥m
对照组
6
14
实验组
14
6
高考数学科学创新复习方案提升版高考大题冲关系列(5)解析几何中的热点题型学案(Word版附解析): 这是一份高考数学科学创新复习方案提升版高考大题冲关系列(5)解析几何中的热点题型学案(Word版附解析),共38页。
2023高考数学科学复习创新方案(新高考题型版)第9章高考大题冲关系列(5)Word版含解析: 这是一份2023高考数学科学复习创新方案(新高考题型版)第9章高考大题冲关系列(5)Word版含解析,共21页。
2023高考数学科学复习创新方案(新高考题型版)第6章第4讲 复数Word版含解析: 这是一份2023高考数学科学复习创新方案(新高考题型版)第6章第4讲 复数Word版含解析,共17页。试卷主要包含了复数的有关概念,复数的几何意义,复数的运算,已知复数z=eq \f,则,给出下列命题,下列命题正确的是等内容,欢迎下载使用。