2021届山东高考数学一轮创新教学案:解答题专项突破(六) 概率与统计的综合问题
展开解答题专项突破(六) 概率与统计的综合问题
通过对近几年高考试题分析,在高考解答题中,概率与回归分析、独立性检验相结合的综合问题既是考查的热点又是重点,设计成包含概率、统计图表的识别与应用等知识的综合题,以实际应用问题为载体,考查考生应用数学知识和基本方法分析问题和解决问题的能力.试题难度一般不大,为中、低档题型.
热点题型1 古典概型与样本数字特征的综合问题
,典例) (2019·辽宁大连三模)某度假酒店为了解会员对酒店的满意度,从中抽取50名会员进行调查,把会员对酒店的“住宿满意度”与“餐饮满意度”都分为五个评分标准:1分(很不满意);2分(不满意);3分(一般);4分(满意);5分(很满意).其统计结果如下表(住宿满意度为x,餐饮满意度为y,单位:分):
餐饮满意度y 人数 住宿满意度x | 1 | 2 | 3 | 4 | 5 |
1 | 1 | 1 | 2 | 1 | 0 |
2 | 2 | 1 | 3 | 2 | 1 |
3 | 1 | 2 | 5 | 3 | 4 |
4 | 0 | 3 | 5 | 4 | 3 |
5 | 0 | 0 | 1 | 2 | 3 |
(1)求“住宿满意度”分数的平均数;
(2)求“住宿满意度”为3分时的5个“餐饮满意度”人数的方差;
(3)为提高会员对酒店的满意度,现从2≤x≤3且1≤y≤2的会员中随机抽取2人征求意见,求至少有1人的“住宿满意度”为2分的概率.
解题思路 (1)读懂题意,明确“住宿满意度”1分的有5人,2分的有9人,3分的有15人,4分的有15人,5分的有6人,易求平均数.
(2)明确5个“餐饮满意度”人数分别为1,2,5,3,4.用方差公式求值.
(3)利用列举法以及古典概型的概率公式求解.
规范解答 (1)“住宿满意度”分数的平均数为
=3.16.
(2)当“住宿满意度”为3分时的5个“餐饮满意度”人数的平均数为=3,其方差为
=2.
(3)符合条件的所有会员共6人,其中“住宿满意度”为2分的3人分别记为a,b,c.“住宿满意度”为3分的3人分别记为d,e,f.
从这6人中抽取2人有如下情况(a,b),(a,c),(a,d),(a,e),(a,f),(b,c),(b,d),(b,e),(b,f),(c,d),(c,e),(c,f),(d,e),(d,f),(e,f),共15种等可能的情况,所以至少有1人的“住宿满意度”为2分的概率P==.
热点题型2 古典概型与统计图表的综合问题
,典例) (2019·佛山一中模拟)十九大提出,坚决打赢脱贫攻坚战,某帮扶单位为帮助定点扶贫村真脱贫,坚持扶贫同扶智相结合,帮助贫困村种植蜜柚,并利用电商进行销售,为了更好地销售,现从该村的蜜柚树上随机摘下了100个蜜柚进行测重,其质量分别在[1500,1750),[1750,2000),[2000,2250),[2250,2500),[2500,2750),[2750,3000](单位:克)中,其频率分布直方图如图所示.
(1)按分层抽样的方法从质量落在[1750,2000),[2000,2250)的蜜柚中抽取5个,再从这5个蜜柚中随机抽取2个,求这2个蜜柚质量均小于2000克的概率;
(2)以各组数据的中间值代表这组数据的平均值,以频率代表概率,已知该贫困村的蜜柚树上大约还有5000个蜜柚等待出售,某电商提出两种收购方案:
A.所有蜜柚均以40元/千克收购;
B.低于2250克的蜜柚以60元/个收购,高于或等于2250克的以80元/个收购.请你通过计算为该村选择收益最好的方案.
解题思路 (1)根据频率确定抽取的5个蜜柚中落在[1500,1750)和[2000,2250)中的个数,利用古典概型的概率公式计算.
(2)先计算出各组的频率,再利用组中值计算出5000个蜜柚在各组中分布的个数,最后按各自方案计算出收益,选择收益大的方案.
规范解答 (1)由题意,得蜜柚质量在[1750,2000)和[2000,2250)的比例为2∶3,∴应分别在质量为[1750,2000),[2000,2250)的蜜柚中各抽取2个和3个.记抽取质量在[1750,2000)的蜜柚为A1,A2,质量在[2000,2250)的蜜柚为B1,B2,B3,
则从这5个蜜柚中随机抽取2个的情况共有以下10种:
A1A2,A1B1,A1B2,A1B3,A2B1,A2B2,A2B3,B1B2,B1B3,B2B3,这10种情况发生的可能性是相等的.其中质量均小于2000克的仅有A1A2这1种情况,故所求概率为.
(2)方案A好,理由如下:
由频率分布直方图可知,蜜柚质量在[1500,1750)的频率为250×0.0004=0.1,同理,蜜柚质量在[1750,2000),[2000,2250),[2250,2500),[2500,2750),[2750,3000]的频率依次为0,1,0.15,0.4,0.2,0.05.
若按A方案收购:
根据题意各段蜜柚个数依次为500,500,750,2000,1000,250,于是总收益为
×40÷1000=×250×[(6+7)×2+(7+8)×2+(8+9)×3+(9+10)×8+(10+11)×4+(11+12)×1]×40÷1000=25×50×[26+30+51+152+84+23]=457500(元)
若按B方案收购:
∵蜜柚质量低于2250克的个数为(0.1+0.1+0.15)×5000=1750,
蜜柚质量高于或等于2250克的个数为5000-1750=3250,
∴收益为1750×60+3250×80=250×20×[7×3+13×4]=365000(元).
∴方案A的收益比方案B的收益高,应该选择方案A.
热点题型3 古典概型与回归分析的综合问题
,典例) (2019·昆明模拟)改革开放以来,我国农村7亿多贫困人口摆脱贫困,贫困发生率由1978年的97.5%下降到2018年底的1.4%,创造了人类减贫史上的中国奇迹,为全球减贫事业贡献了中国智慧和中国方案.“贫困发生率”是指低于贫困线的人口占全体人口的比例.2012年至2018年我国贫困发生率的数据如表所示,
年份(t) | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 | 2018 |
贫困发生 率y(%) | 10.2 | 8.5 | 7.2 | 5.7 | 4.5 | 3.1 | 1.4 |
(1)从表中所给的7个贫困发生率数据中任选2个,求这2个都低于5%的概率;
(2)设年份代码x=t-2015,利用回归方程,分析2012年至2018年贫困发生率的变化情况,并预测2019年的贫困发生率.
附:回归直线=x+的斜率和截距的最小二乘估计公式为=,=- .
解题思路 (1)用列举法得出基本事件总数,再用古典概型的概率公式求解.
(2)由题意列出年份代码x与贫困发生率y的对应表格,计算,,iyi,,根据公式求与写出回归方程.
规范解答 (1)设2012年至2015年贫困发生率分别为A1,A2,A3,A4,均大于5%,
设2016年至2018年贫困发生率分别为B1,B2,B3,均小于5%.
从2012年至2018年贫困发生率的7个数据中任选2个,可能的情况如下,
{A1,A2},{A1,A3},{A1,A4},{A1,B1},{A1,B2},{A1,B3},{A2,A3},{A2,A4},{A2,B1},{A2,B2},{A2,B3},{A3,A4},{A3,B1},{A3,B2},{A3,B3},{A4,B1},{A4,B2},{A4,B3},{B1,B2},{B1,B3},{B2,B3},共有21种等可能的情况,这2个都低于5%的情况有{B1,B2},{B1,B3},{B2,B3},共3种,
所以,这2个都低于5%的概率为=.
(2)由题意可得,
年份(t) | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 | 2018 |
年份代 码(x) | -3 | -2 | -1 | 0 | 1 | 2 | 3 |
贫困发生 率y(%) | 10.2 | 8.5 | 7.2 | 5.7 | 4.5 | 3.1 | 1.4 |
由上表可算得=0,
==5.8,
iyi=-3×(10.2-1.4)-2×(8.5-3.1)-(7.2-4.5)=-39.9,
=(-3)2+(-2)2+(-1)2+02+12+22+32=28.
所以,==
=-1.425,
=- =5.8-(-1.425)×0=5.8,所以,线性回归方程为=-1.425x+5.8,
由以上方程得<0,所以在2012年至2018年贫困发生率在逐年下降,平均每年下降1.425%;
当x=4时,=-1.425×4+5.8=0.1,所以,可预测2019年底我国贫困发生率为0.1%.
热点题型4 古典概型与独立性检验的综合问题
,典例) (2019·山东师范大学附中模拟)随着网络和智能手机的普及,许多可以解答各科问题的搜题软件走红.有教育工作者认为:网搜答案可以起到拓展思路的作用,但是对多数学生来讲,容易产生依赖心理,对学习能力造成损害.为了了解网络搜题在学生中的使用情况,某校对学生在一周时间内进行网络搜题的频数进行了问卷调查,并从参与调查的学生中抽取了男、女学生各50人进行抽样分析,得到如下样本频数分布表:
一周时间内进行网 络搜题的频数区间 | 男生频数 | 女生频数 |
[0,10] | 10 | 3 |
(10,20] | 15 | 7 |
(20,30] | 11 | 17 |
(30,40] | 8 | 20 |
(40,50] | 6 | 3 |
将学生在一周时间内进行网络搜题的频数超过20次的行为视为“经常使用网络搜题”,不超过20次的视为“偶尔或不用网络搜题”.
(1)根据已有数据,完成下列2×2列联表(单位:人),并判断是否有99%的把握认为使用网络搜题与性别有关?
| 经常使用网络搜题 | 偶尔或不用网络搜题 | 合计 |
男生 |
|
|
|
女生 |
|
|
|
合计 |
|
|
|
(2)现从所抽取的女生中利用分层抽样的方法再抽取5人,再从这5人中随机选出3人参加座谈,求选出的3人中恰有2人经常使用网络搜题的概率.
参考方式:K2=,其中n=a+b+c+d.
参考数据:
P(K2≥k0) | 0.050 | 0.010 | 0.001 |
k0 | 3.841 | 6.635 | 10.828 |
解题思路 (1)先根据样本频数分布表和题意,计算相关数据填表,再计算K2,作出推断.
(2)先计算分层抽样中经常使用网络搜题的人数和偶尔或不用网络搜题的人数,列举出所有基本事件,用古典概型的概率公式求解.
规范解答 (1)
| 经常使用网络搜题 | 偶尔或不用网络搜题 | 合计 |
男生 | 25 | 25 | 50 |
女生 | 40 | 10 | 50 |
合计 | 65 | 35 | 100 |
∵K2=≈9.890>6.635,
∴有99%的把握认为使用网络搜题与性别有关.
(2)依题意,可知所抽取的5名女生中,经常使用网络搜题的有40×=4人,将这4人记作A,B,C,D;偶尔或不用网络搜题的有10×=1人,将这1人记作a.
从这5人中随机选出3人的所有基本事件为(A,B,C),(A,B,D),(A,B,a),(A,C,D),(A,C,a),(A,D,a),(B,C,D),(B,C,a),(B,D,a),(C,D,a),共10个等可能的基本事件.
选出的3人中恰有2人经常使用网络搜题的所有基本事件为(A,B,a),(A,C,a),(A,D,a),(B,C,a),(B,D,a),(C,D,a),共6个.故选出的3人中恰有2人经常使用网络搜题的概率为P==.