所属成套资源:2020高考理科数学北师大版一轮复习教学案()
2020版新一线高考理科数学(北师大版)一轮复习教学案:高考大题增分课6概率与统计中的高考热点问题
展开
[命题解读] 1.概率与统计是高考中相对独立的一个内容,处理问题的方式、方法体现了较高的思维含量.该类问题以应用题为载体,注重考查应用意识及阅读理解能力、分类讨论与化归转化能力.
2.概率问题的核心是概率计算,其中事件的互斥、对立、独立是概率计算的核心,排列组合是进行概率计算的工具,统计问题的核心是样本数据的获得及分析方法,重点是频率分布直方图、茎叶图和样本的数字特征,但近两年全国卷突出回归分析与独立性检验的考查.
3.离散型随机变量的分布列及其均值的考查是历年高考的重点,难度多为中档类题目,特别是与统计内容渗透,背景新颖,充分体现了概率与统计的工具性和交汇性.
统计与统计案例
以实际生活中的事例为背景,通过对相关数据的统计分析、抽象概括,作出估计、判断,常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查,考查数据处理能力,分析问题、解决问题的能力.
【例1】 (2018·全国卷Ⅱ)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:y=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y=99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
[解] (1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y=-30.4+13.5×19=226.1(亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为y=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
(以上给出了2种理由,答出其中任意一种或其他合理理由均可)
[律方规法] 1.在求两变量相关系数和两变量的回归方程时,由于r和b的公式组成比较复杂,求它们的值计算量比较大,为了计算准确,可将其分成几个部分分别计算,这样等同于分散难点,各个攻破,提高了计算的准确度.
2.有关独立性检验的问题的解题步骤:(1)作出2×2列联表;(2)计算随机变量K2的值;(3)查临界值,检验作答.
科技扶贫是精准扶贫的一项重要措施,某科研机构将自己研发的一项葡萄种植技术提供给某山区果农.为验证该技术的效果,该果农选择40株葡萄树进行试验,其中20株不进行任何处理,记为对照组,另外20株采用新技术培养,记为实验组.葡萄成熟收割后,该果农统计了这40株葡萄树的年产量数据(单位:kg).
对照组
12
15
21
23
26
24
35
35
34
32
51
52
49
46
43
53
44
61
63
43
实验组
23
32
34
36
42
41
51
59
46
43
43
45
52
67
65
65
62
56
55
58
(1)根据数据完成对照组和试验组葡萄产量的茎叶图,并通过茎叶图比较对照组和实验组葡萄产量的平均值和方差的大小(不要求计算出具体值,得出结论即可);
(2)若每株葡萄树的年产量不低于45 kg,则认为“产量高”,否则认为“产量一般”.请根据此样本完成此2×2列联表,并据此样本分析是否有95%的把握认为产量的提高与使用新技术有关;
对照组
实验组
合计
产量高
产量一般
合计
(3)从“产量高”的数据中随意抽取3株做进一步科学研究中,计算恰好有2株来自实验组的概率.
附:χ2=,其中n=a+b+c+ d.
P(χ2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
[解] (1)实验组的葡萄平均产量要高于对照组的葡萄平均产量;实验组的葡萄产量的方差要小于对照组葡萄产量的方差.
(2)完成2×2列联表如下表所示:
对照组
实验组
合计
产量高
7
12
19
产量一般
13
8
21
合计
20
20
40
所以χ2的观测值
k=≈2.506<3.841.
所以没有95%的把握认为产量的提高与使用新技术有关.
(3)记事件A为“这3株中恰好有2株来自实验组”,则P(A)==.
所以恰好有2株来自实验组的概率为.
离散型随机变量的分布列、均值和方差的应用
离散型随机变量及其分布列、均值与方差及应用是高考的一大热点,每年均有解答题,属于中档题.复习时应强化应用题的理解与掌握,弄清随机变量的所有取值是正确列随机变量分布列和求均值与方差的关键,对概率的确定与转化是解题的基础,准确计算是解题的核心.
【例2】 (本题满分12分)(2016·全国卷Ⅰ)某公司计划购买2台机器,该种机器使用三年后即被淘汰.
机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.①
现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得如图所示的②
以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,③
n表示购买2台机器的同时购买的易损零件数.
(1)求X的分布列;
(2)若要求④确定n的最小值;
(3)以购买易损零件所需费用的期望值为决策依据,在n=19与n=20之中选其一,应选用哪个?
[信息提取] 看到①这种条件,想到解题时可能要分类求解;
看到②想到频数与频率间的关系,想到横轴中的取值含义;
看到③想到X的所有可能取值;
看到④想到X和n的含义,想到(1)中的分布列.
[规范解答] (1)由柱状图及以频率代替概率可得,一台机器在三年内需更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2. ·················1分
由题意可知X的所有可能取值为16,17,18,19,20,21,22.
从而P(X=16)=0.2×0.2=0.04;
P(X=17)=2×0.2×0.4=0.16;
P(X=18)=2×0.2×0.2+0.4×0.4=0.24;
P(X=19)=2×0.2×0.2+2×0.4×0.2=0.24;
P(X=20)=2×0.2×0.4+0.2×0.2=0.2;
P(X=21)=2×0.2×0.2=0.08;
P(X=22)=0.2×0.2=0.04. ····································4分
所以X的分布列为
X
16
17
18
19
20
21
22
P
0.04
0.16
0.24
0.24
0.2
0.08
0.04
·····························································6分
(2)由(1)知P(X≤18)=0.44,P(X≤19)=0.68,
故n的最小值为19. ···········································7分
(3)记Y表示2台机器在购买易损零件上所需的费用(单位:元).
当n=19时,
E(Y)=19×200×0.68+(19×200+500)×0.2+(19×200+2×500)×0.08+(19×200+3×500)×0.04=4 040;···································9分
当n=20时,
E(Y)=20×200×0.88+(20×200+500)×0.08+(20×200+2×500)×0.04=4 080. ··························································11分
可知当n=19时所需费用的期望值小于当n=20时所需费用的期望值,故应选n=19. ·······················································12分
[易错与防范]
易错点
防范措施
忽视X的实际含义导致取值错误,进而导致概率计算错误.
细心审题,把握题干中的重要字眼,关键处加标记,同时理解X取每个值的含义.
忽视P(X≤n)≥0.5的含义,导致不会求解.
结合(1)中的分布列及n的含义,推理求解便可.
忽视n=19与n=20的含义导致无法解题.
本题中购买零件所需费用包含两部分,一部分为购买机器时购买零件的费用,另一部分为备件不足时额外购买的费用.
[通性通法] 解答离散型随机变量的分布列及相关问题的一般思路:
(1)明确随机变量可能取哪些值.
(2)结合事件特点选取恰当的计算方法计算这些可能取值的概率值.
(3)根据分布列和均值、方差公式求解.
某校首届安琪杯教职工运动会上有一个扑克小游戏,游戏规则如下:甲、乙双方每局比赛均从5张扑克牌(3张红桃A,2张黑桃A)中轮流抽取1张,抽取到第2张黑桃A的人获胜,并结束该局比赛.每三局比赛为一轮.
(1)若在第一局比赛中甲先抽牌,求甲获胜的概率;
(2)若在一轮比赛中规定:第一局由甲先抽牌,并且上一局比赛输的人下一局比赛先抽,每一局比赛先抽牌并获胜的人得1分,后抽牌并获胜的人得2分,未获胜的人得0分.求此轮比赛中甲得分X的概率分布列及其数学期望E(X).
[解] (1)设“在第一局比赛中甲先抽牌,甲获胜”为事件M,
甲先抽牌,甲获胜等价于把这5张牌进行排序,
第二张黑桃A排在3号位置或5号位置,共有2+4=6(种),
而2张黑桃A的位置共有C=10(种).
所以P(M)==.
(2)甲得分X的所有可能取值为0,1,2,3,5.
由(1)知在一局比赛中,先抽牌并获胜(后抽牌并输)的概率为,
则后抽牌并获胜(先抽牌并输)的概率为.
当X=0时,即三局甲都输,P(X=0)=××=;
当X=1时,即第一局甲胜,二、三局甲输或第二局甲胜,一、三局甲输或第三局甲胜,一、二局甲输,P(X=1)=××+××+××=;当X=2时,即第一局甲胜,第二局甲输,第三局甲胜,P(X=2)=××=;
当X=3时,即第一局甲输,二、三两局甲都胜或者第一局甲胜,第二局甲胜,第三局甲输,P(X=3)=××+××==;
当X=5时,即三局甲都胜,P(X=5)=××=.
所以此轮比赛中甲得分X的概率分布列为
X
0
1
2
3
5
P
E(X)=0×+1×+2×+3×+5×=.
概率与统计的综合应用
概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下功夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及均值与方差的运算.
【例3】 (2014·全国卷Ⅰ)从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如图所示的频率分布直方图:
(1)求这500件产品质量指标值的样本平均数和样本方差s2(同一组中的数据用该组区间的中点值作代表);
(2)由直方图可以认为,这种产品的质量指标值Z服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2.
①利用该正态分布,求P(187.8