2025版高考数学全程一轮复习练习第十章计数原理概率随机变量及其分布列高考大题研究课十一概率与统计的综合问题
展开在掌握概率与统计的基本知识和基本技能的前提下,重点掌握离散型随机变量的分布列与统计图表、回归模型以及独立性检验的结合,培养学生的数据分析和数学运算核心素养.
关键能力·题型剖析
题型一 概率与频率分布直方图的综合
例1 [2024·河北衡水模拟]温室是以采光覆盖材料作为全部或部分围护结构材料,具有透光、避雨、保温、控温等功能,可在冬季或其他不适宜露地植物生长的季节供栽培植物的建筑,而温室蔬菜种植技术是一种比较常见的技术,它具有较好的保温性能,使人们在任何时间都可吃到反季节的蔬菜,深受大众喜爱.温室蔬菜生长和蔬菜产品卫生质量要求的温室内土壤、灌溉水、环境空气等环境质量指标,其温室蔬菜产地环境质量等级划定如表所示.
各环境要素的综合质量指数超标,灌溉水、环境空气可认为污染,土壤则应做进一步调研,若确对其所影响的植物(生长发育、可食部分超标或用作饮料部分超标)或周围环境(地下水、地表水、大气等)有危害,方能确定为污染.某乡政府计划对所管辖的甲、乙、丙、丁、戊、己、庚、辛,共8个村发展温室蔬菜种植,对各村试验温室蔬菜环境产地质量监测得到的相关数据如下:
(1)若从这8个村中随机抽取2个进行调查,求抽取的2个村应对土壤做进一步调研的概率;
(2)现有一技术人员在这8个村中随机选取3个进行技术指导,记ξ为技术员选中村的环境空气等级为尚清洁的个数,求ξ的分布列和数学期望.
题后师说
概率与统计图表的综合主要以频率分布直方图、扇形图、折线图为载体,考查样本的频率分布、样本特征数以及概率的计算,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题.
巩固训练1
[2024·安徽合肥模拟]渔船海上外出作业受天气限制,尤其浪高对渔船安全影响最大,二月份是某海域风浪最平静的月份,浪高一般不超过3 m.某研究小组从前些年二月份各天的浪高数据中,随机抽取50天数据作为样本,制成频率分布直方图:(如图)
根据海浪高度将海浪划分为如下等级:
海事管理部门规定:海浪等级在“大浪”及以上禁止渔船出海作业.
(1)某渔船出海作业除受浪高限制外,还受其他因素影响,根据以往经验可知:“微浪”情况下出海作业的概率为0.9,“小浪”情况下出海作业的概率为0.8,“中浪”情况下出海作业的概率为0.6,请根据上面频率分布直方图,估计二月份的某天各种海浪等级出现的概率,并求该渔船在这天出海作业的概率;
(2)气象预报预计未来三天内会持续“中浪”或“大浪”,根据以往经验可知:若某天是“大浪”,则第二天是“大浪”的概率为,“中浪”的概率为;若某天是“中浪”,则第二天是“大浪”的概率为,“中浪”的概率为.现已知某天为“中浪”,记该天的后三天出现“大浪”的天数为X,求X的分布列和数学期望.
题型二 概率与回归模型的综合
例2 [2024·山东菏泽模拟]南水北调中线工程建成以来,通过生态补水和减少地下水开采,华北地下水位有了较大的回升,水质有了较大的改善,为了研究地下水位的回升情况,对2015年~2021年河北平原地区地下水埋深进行统计,所得数据如下表:
根据散点图知,该地区地下水位埋深y与年份t(2015年作为第1年)可以用直线y=bt+a拟合.
(1)根据所给数据求经验回归方程 eq \(y,\s\up6(^)) = eq \(b,\s\up6(^)) t+ eq \(a,\s\up6(^)) ,并利用该回归方程预测2023年河北平原地区地下水位埋深;
(2)从2016年至2021年这6年中任取3年,该地区这3年中每一年地下水位与该地区上一年地下水位相比回升超过0.5米的年份数为X,求X的分布列与数学期望.
附相关表数据: eq \i\su(i=1,7,y) i=164.01, eq \i\su(i=1,7,y) iti=631.26.
参考公式: eq \(y,\s\up6(^)) = eq \(b,\s\up6(^)) t+ eq \(a,\s\up6(^)) ,其中 eq \(b,\s\up6(^)) = eq \f(\i\su(i=1,n,y)iti-n\(y,\s\up6(-))\(t,\s\up6(-)),\i\su(i=1,n, )(ti-\(t,\s\up6(-)))2) , eq \(a,\s\up6(^)) = eq \(y,\s\up6(-)) - eq \(b,\s\up6(^)) eq \(t,\s\up6(-)) .
题后师说
求解概率与回归模型的综合问题时,一要正确运用回归模型有关的公式和数据计算,二要注意概率模型的应用,明确所求问题所属的事件类型是关键.
巩固训练2
2022年,中国新能源汽车销售火爆,A省相关部门调查了该省2022年1月份至10月份的新能源汽车销量情况,得到一组样本数据(xi,yi)(i=1,2,…,10),其中xi表示第i个月,yi表示第i个月A省新能源汽车的销量(单位:万辆),由样本数据的散点图可知,y与x具有线性相关关系,并将这10个月的数据作了初步处理,得到下面一些统计量的值:
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归方程 eq \(y,\s\up6(^)) = eq \(a,\s\up6(^)) + eq \(b,\s\up6(^)) x的斜率和截距的最小二乘估计分别为 eq \(b,\s\up6(^)) = eq \f(\(∑,\s\up6(n),\s\d4(i=1))xiyi-n\(x,\s\up6(-))\(y,\s\up6(-)),\(∑,\s\up6(n),\s\d4(i=1))x eq \\al(\s\up1(2),\s\d1(i)) -n\(x,\s\up6(-))2) , eq \(a,\s\up6(^)) = eq \(y,\s\up6(-)) - eq \(b,\s\up6(^)) eq \(x,\s\up6(-)) .
(1)建立y关于x的经验回归方程,并估计A省12月份新能源汽车的销量;
(2)为鼓励新能源汽车销售商积极参与调查,A省汽车行业协会针对新能源汽车销售商开展抽奖活动,所有费用由某新能源汽车厂商赞助.奖项共设一、二、三等奖共三个奖项,其中一、二、三等奖分别奖励2万元、1万元、5千元,抽中一、二、三等奖的概率分别为,,.现有甲、乙两家汽车销售商参加了抽奖活动,假设他们是否中奖相互独立,求这两家汽车销售商所获奖金总额X(单位:万元)的分布列及均值.
题型三 概率与独立性检验的综合
例3 [2024·湖北孝感模拟]为了研究吸烟是否与患肺癌有关,某研究所采取有放回简单随机抽样的方法,调查了100人,得到成对样本观测数据的分类统计结果如下表所示:
(1)依据小概率α=0.001的独立性检验,分析吸烟是否会增加患肺癌的风险;
(2)从这100人中采用分层抽样,按照是否患肺癌抽取5人,再从这5人中随机抽2人,记这2人中不患肺癌的人数为X,求X的分布列和均值;
(3)某药厂研制出一种新药,声称对治疗肺癌的有效率为90%.现随机选择了10名肺癌患者,经过使用药物治疗后,治愈的人数不超过7人.请问你是否怀疑该药厂的宣传,请说明理由.
参考公式和数据:
①χ2= eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)) ,其中n=a+b+c+d;且x0.001=10.828 .
②0.98≈0.430;概率低于0.08的事件称为小概率事件,一般认为在一次试验中是几乎不发生的.
题后师说
求解概率与独立性检验的综合问题时,一要根据公式计算准确,二要注意概率模型的应用,明确所求问题所属的事件类型是关键.
巩固训练3
[2024·河北衡水模拟]某医疗科研小组为研究某市市民患有疾病A与是否具有生活习惯B的关系,从该市市民中随机抽查了100人,得到如下数据:
(1)依据α=0.01的独立性检验,能否认为该市市民患有疾病A与是否具有生活习惯B有关?
(2)从该市市民中任选一人,M表示事件“选到的人不具有生活习惯B”,N表示事件“选到的人患有疾病A”,试利用该调查数据,给出P( eq \(N,\s\up6(-)) | eq \(M,\s\up6(-)) )的估计值;
(3)从该市市民中任选3人,记这3人中具有生活习惯B,且未患有疾病A的人数为X,试利用该调查数据,给出X的数学期望的估计值.
附:χ2= eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)) ,其中n=a+b+c+d.
高考大题研究课十一 概率与统计的综合问题
关键能力·题型剖析
例1 解析:(1)由折线图可知:应对土壤做进一步调研的村共4个,
从8个村中随机抽取2个进行调查,基本事件总数有C eq \\al(\s\up11(2),\s\d4(8)) =28个;
其中抽取的2个村应对土壤做进一步调研的基本事件个数有C eq \\al(\s\up11(2),\s\d4(4)) =6个,
∴所求概率P= eq \f(6,28) = eq \f(3,14) .
(2)由折线图可知:环境空气等级为尚清洁的村共有5个,则ξ所有可能的取值为0,1,2,3,
∵P(ξ=0)= eq \f(C eq \\al(\s\up1(3),\s\d1(3)) ,C eq \\al(\s\up1(3),\s\d1(8)) ) = eq \f(1,56) ;
P(ξ=1)= eq \f(C eq \\al(\s\up1(2),\s\d1(3)) C eq \\al(\s\up1(1),\s\d1(5)) ,C eq \\al(\s\up1(3),\s\d1(8)) ) = eq \f(15,56) ;
P(ξ=2)= eq \f(C eq \\al(\s\up1(1),\s\d1(3)) C eq \\al(\s\up1(2),\s\d1(5)) ,C eq \\al(\s\up1(3),\s\d1(8)) ) = eq \f(30,56) = eq \f(15,28) ;
P(ξ=3)= eq \f(C eq \\al(\s\up1(3),\s\d1(5)) ,C eq \\al(\s\up1(3),\s\d1(8)) ) = eq \f(10,56) = eq \f(5,28) ;
∴ξ的分布列为:
∴数学期望E(ξ)=0× eq \f(1,56) +1× eq \f(15,56) +2× eq \f(15,28) +3× eq \f(5,28) = eq \f(15,8) .
巩固训练1 解析:(1)记这天浪级是“微浪”为事件A1,浪级是“小浪”为事件A2,浪级是“中浪”为事件A3,浪级是“大浪”为事件A4.该渔船当天出海作业为事件B,则由题意可知:P(A1)=50×0.004=0.2,P(A2)=50×0.006=0.3,
P(A3)=50×0.004+50×0.002=0.3,
P(A4)=50×0.002+50×0.002=0.2.
∴P(B)=P(BA1)+P(BA2)+P(BA3)
=P(B|A1)P(A1)+P(B|A2)P(A2)+P(B|A3)P(A3)
=0.9×0.2+0.8×0.3+0.6×0.3
=0.18+0.24+0.18
=0.6.
(2)依题意可知,X的所有可能取值为0,1,2,3,
∴P(X=0)=( eq \f(2,3) )3= eq \f(8,27) ,
P(X=1)= eq \f(1,3) × eq \f(1,2) × eq \f(2,3) + eq \f(2,3) × eq \f(1,3) × eq \f(1,2) + eq \f(2,3) × eq \f(2,3) × eq \f(1,3) = eq \f(10,27) ,
P(X=2)= eq \f(1,3) × eq \f(1,2) × eq \f(1,2) + eq \f(1,3) × eq \f(1,2) × eq \f(1,3) + eq \f(2,3) × eq \f(1,3) × eq \f(1,2) = eq \f(1,4) ,
P(X=3)= eq \f(1,3) × eq \f(1,2) × eq \f(1,2) = eq \f(1,12) ,
则X的分布列为
数学期望E(X)=0× eq \f(8,27) +1× eq \f(10,27) +2× eq \f(1,4) +3× eq \f(1,12) = eq \f(121,108) .
例2 解析:(1) eq \(t,\s\up6(-)) = eq \f(1+2+3+4+5+6+7,7) =4,
eq \(y,\s\up6(-)) = eq \f(164.01,7) =23.43, eq \i\su(i=1,7,y) iti=631.26,
eq \i\su(i=1,7, ) (ti- eq \(t,\s\up6(-)) )2=(1-4)2+(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2+(7-4)2=28,
所以 eq \(b,\s\up6(^)) = eq \f(631.26-7×23.43×4,28) =-0.885, eq \(a,\s\up6(^)) = eq \(y,\s\up6(-)) - eq \(b,\s\up6(^)) eq \(t,\s\up6(-)) =23.43+0.885×4=26.97,
所以所求经验回归方程为 eq \(y,\s\up6(^)) =-0.885t+26.97.
当t=9时, eq \(y,\s\up6(^)) =-0.885×9+26.97=19.005米.
所以预测2023年河北平原地区地下水位埋深为19.005米.
(2)因为25.74-25.22=0.52>0.5,25.22-24.95=0.27<0.5,
24.95-23.02=1.93>0.5,23.02-22.69=0.33<0.5,
22.69-22.03=0.66>0.5,22.03-20.36=1.67>0.5,
所以从2016年至2021年这6年中,每一年地下水位与该地区上一年地下水位相比回升超过0.5米的年份有2016,2018,2020,2021,共4个年份,
X的所有可能取值为1,2,3,
P(X=1)= eq \f(C eq \\al(\s\up1(1),\s\d1(4)) C eq \\al(\s\up1(2),\s\d1(2)) ,C eq \\al(\s\up1(3),\s\d1(6)) ) = eq \f(1,5) ,
P(X=2)= eq \f(C eq \\al(\s\up1(2),\s\d1(4)) C eq \\al(\s\up1(1),\s\d1(2)) ,C eq \\al(\s\up1(3),\s\d1(6)) ) = eq \f(3,5) ,
P(X=3)= eq \f(C eq \\al(\s\up1(3),\s\d1(4)) ,C eq \\al(\s\up1(3),\s\d1(6)) ) = eq \f(1,5) ,
所以X的分布列为:
E(X)=1× eq \f(1,5) +2× eq \f(3,5) +3× eq \f(1,5) =2.
巩固训练2 解析:(1)由题意得,
eq \(x,\s\up6(-)) = eq \f(1+2+3+…+9+10,10) =5.5,
又 eq \(y,\s\up6(-)) =1.5, eq \(∑,\s\up11(10),\s\d4(i=1)) xiyi=89.1,
eq \(∑,\s\up11(10),\s\d4(i=1)) x eq \\al(\s\up11(2),\s\d4(i)) =385,
所以 eq \(b,\s\up6(^)) = eq \f(\(∑,\s\up6(10),\s\d4(i=1))xiyi-10\(x,\s\up6(-))\(y,\s\up6(-)),\(∑,\s\up6(n),\s\d4(i=1))x eq \\al(\s\up1(2),\s\d1(i)) -10\(x,\s\up6(-))2)
= eq \f(89.1-10×5.5×1.5,385-10×5.52) =0.08,
eq \(a,\s\up6(^)) =1.5-0.08×5.5=1.06,
则y关于x的经验回归方程为 eq \(y,\s\up6(^)) =1.06+0.08x,
当x=12时, eq \(y,\s\up6(^)) =2.02,
故A省12月份新能源汽车的销量约为2.02万辆.
(2)这两家汽车销售商所获得的奖金总额X的所有可能取值为4,3,2.5,2,1.5,1,
P(X=4)= eq \f(1,6) × eq \f(1,6) = eq \f(1,36) ,
P(X=3)=2× eq \f(1,6) × eq \f(1,3) = eq \f(1,9) ,
P(X=2.5)=2× eq \f(1,6) × eq \f(1,2) = eq \f(1,6) ,
P(X=2)= eq \f(1,3) × eq \f(1,3) = eq \f(1,9) ,
P(X=1.5)=2× eq \f(1,3) × eq \f(1,2) = eq \f(1,3) ,
P(X=1)= eq \f(1,2) × eq \f(1,2) = eq \f(1,4) ,
则X的分布列为
E(X)=4× eq \f(1,36) +3× eq \f(1,9) +2.5× eq \f(1,6) +2× eq \f(1,9) +1.5× eq \f(1,3) +1× eq \f(1,4) = eq \f(11,6) .
例3 解析:(1)零假设为H0:吸烟与患肺癌之间无关,
根据列联表中的数据,得χ2= eq \f(100×(25×50-15×10)2,40×60×35×65) = eq \f(6 050,273) ≈22.161>10.828,
依据小概率α=0.001的独立性检验,认为H0不成立,即吸烟会增加患肺癌的风险.
(2)由已知可得:抽取的5人中,不患肺癌的有2人,患肺癌的有3人.
所以随机变量X的可能取值有0、1、2,
且P(X=0)= eq \f(C eq \\al(\s\up1(2),\s\d1(3)) ,C eq \\al(\s\up1(2),\s\d1(5)) ) = eq \f(3,10) ,
P(X=1)= eq \f(C eq \\al(\s\up1(1),\s\d1(2)) C eq \\al(\s\up1(1),\s\d1(3)) ,C eq \\al(\s\up1(2),\s\d1(5)) ) = eq \f(3,5) ,
P(X=2)= eq \f(C eq \\al(\s\up1(2),\s\d1(2)) ,C eq \\al(\s\up1(2),\s\d1(5)) ) = eq \f(1,10) ,
故X的分布列为:
所以E(X)=0× eq \f(3,10) +1× eq \f(3,5) +2× eq \f(1,10) = eq \f(4,5) .
(3)随机选取10个病人,治愈人数不超过于7人的概率为
P=1-C eq \\al(\s\up11(8),\s\d4(10)) ·0.98×0.12-C eq \\al(\s\up11(9),\s\d4(10)) ·0.99×0.1-0.910
≈1-45×0.430×0.01-10×0.430×0.9×0.1-0.430×0.81=0.071 2<0.08,
从而该事件称为小概率事件,一般认为在一次试验中是几乎不发生的,所以可以怀疑该药厂是虚假宣传.
巩固训练3 解析:(1)由已知得列联表如下:
零假设为H0:该市市民患有疾病A与是否具有生活习惯B无关.
根据列联表中的数据,经计算得到
χ2= eq \f(100×(40×25-15×20)2,45×55×40×60) = eq \f(2 450,297) ≈8.249>6.635=x0.01.
依据α=0.01的独立性检验,推断H0不成立,即认为该市市民患有疾病A与是否具有生活习惯B有关,此推断犯错误的概率不大于0.01.
(2)由(1)数据可得:P( eq \(M,\s\up6(-)) )= eq \f(45,100) = eq \f(9,20) ,P( eq \(N,\s\up6(-)) eq \(M,\s\up6(-)) )= eq \f(20,100) = eq \f(1,5) ,
所以P( eq \(N,\s\up6(-)) | eq \(M,\s\up6(-)) )= eq \f(P(\(N,\s\up6(-))\(M,\s\up6(-))),P(\(M,\s\up6(-)))) = eq \f(\f(1,5),\f(9,20)) = eq \f(4,9) .
(3)由题意知可用B(3, eq \f(1,5) )估计X的分布,
所以E(X)的估计值为np=3× eq \f(1,5) = eq \f(3,5) .
环境质量等级
土壤各单项或综合质量指数
灌溉水各单项或综合质量指数
环境空气各单项或综合质量指数
等级名称
1
≤0.7
≤0.5
≤0.6
清洁
2
0.7~1.0
0.5~1.0
0.6~1.0
尚清洁
3
>1.0
>1.0
>1.0
超标
浪高(cm)
(0,50)
[50,100)
[100,200)
[200,300]
海浪等级
微浪
小浪
中浪
大浪
年份
2015
2016
2017
2018
2019
2020
2021
埋深(单位:米)
25.74
25.22
24.95
23.02
22.69
22.03
20.36
eq \(y,\s\up6(-))
eq \i\su(i=1,10,x) iyi
eq \i\su(i=1,10,x) eq \\al(\s\up11(2),\s\d4(i))
eq \i\su(i=1,10,y) i
1.5
89.1
385
15
吸烟
肺癌
合计
非肺癌患者
肺癌患者
非吸烟者
25
10
35
吸烟者
15
50
65
合计
40
60
100
疾病A
生活习惯B
具有
不具有
患病
25
15
未患病
20
40
α
0.10
0.05
0.010
0.001
xα
2.706
3.841
6.635
10.828
ξ
0
1
2
3
P
eq \f(1,56)
eq \f(15,56)
eq \f(15,28)
eq \f(5,28)
X
0
1
2
3
P
eq \f(8,27)
eq \f(10,27)
eq \f(1,4)
eq \f(1,12)
X
1
2
3
P
eq \f(1,5)
eq \f(3,5)
eq \f(1,5)
X
4
3
2.5
2
1.5
1
P
eq \f(1,36)
eq \f(1,9)
eq \f(1,6)
eq \f(1,9)
eq \f(1,3)
eq \f(1,4)
X
0
1
2
P
eq \f(3,10)
eq \f(3,5)
eq \f(1,10)
疾病A
生活习惯B
合计
具有
不具有
患病
25
15
40
未患病
20
40
60
合计
45
55
100
2025版高考数学全程一轮复习课后定时检测练习78概率与统计的综合问题(Word版附解析): 这是一份2025版高考数学全程一轮复习课后定时检测练习78概率与统计的综合问题(Word版附解析),共7页。试卷主要包含了635,,841等内容,欢迎下载使用。
2025届高考数学一轮总复习第十一章计数原理概率随机变量及其分布课时规范练66概率与统计综合问题: 这是一份2025届高考数学一轮总复习第十一章计数原理概率随机变量及其分布课时规范练66概率与统计综合问题,共7页。试卷主要包含了9a-297,635=x0,01等内容,欢迎下载使用。
备考2024届高考数学一轮复习好题精练第十章计数原理概率随机变量及其分布突破2概率与统计的综合: 这是一份备考2024届高考数学一轮复习好题精练第十章计数原理概率随机变量及其分布突破2概率与统计的综合,共8页。试卷主要包含了第31届世界大学生夏季运动会,020+0,524>6,52),等内容,欢迎下载使用。