专题03 概率与统计(文科专用)-【大题小卷】冲刺2022年高考数学大题限时集训(全国通用)
展开专题03 概率与统计
概率统计一般作为全国卷第18题或第19题,文科主要是以回归方程,独立性检验,以及统计中均值方差的运算为主要考查对象。
类型一:统计及统计案例应用
例题1.有20种不同的零食,每100 g可食部分包含的能量(单位:kJ)如下:
110
120
123
165
432
190
174
235
428
318
249
280
162
146
210
120
123
120
150
140
(1)以上述20个数据组成总体,求总体平均数与总体标准差.
(2)设计恰当的随机抽样方法,从总体中抽取一个容量为7的样本,求样本的平均数与标准差.
(3)利用上面的抽样方法,再抽取容量为7的样本,计算样本的平均数和标准差.这个样本的平均数和标准差与(2)中的结果一样吗?为什么?
(4)利用(2)中的随机抽样方法,分别从总体中抽取一个容量为10,13,16,19的样本,求样本的平均数与标准差.分析样本容量与样本的平均数和标准差对总体的估计效果之间有什么关系.
【答案】(1);95.26(2)抓阄法(3)见解析(4)见解析
【解析】
(1)总体平均数为.
总体标准差为.
(2)可以使用抓阄法进行抽样.
(3)由样本的随机性,知(2)和(3)的计算结果不相同的概率相当大,而相同的概率很小.
(4)随着样本容量的增加,分别用样本平均数和样本标准差估计总体平均数和总体标准差的效果会越来越好(即精度会越来越高).但是由于样本的随机性,也有极个别(小概率)的例外情况.
对点训练1 为纪念建党100周年,某校举办党史知识竞赛,现从参加竞赛的同学中,选取200名同学并将其成绩(百分制,均为整数)分成六组:第1组,第2组,第3组,第4组,第5组,第6组.得到如图所示的频率分布直方图.
(1)求的值,并估计这200名学生成绩的中位数;
(2)若先用分层抽样的方法从得分在和的学生中抽取5人,然后再从抽出的5人中任意选取2人,求此2人得分恰在同一组的概率.
【答案】(1)0.006;76(2)
【解析】
(1)由频率分布直方图可得:,解得;
由频率分布的直方图可得设中位数为m,故可得,解得,
所以这200名学生成绩中位数的估计值为76;
(2)由频率分布直方图可知:得分在和内的频率分别为0.04和0.06,
采用分层抽样知,抽取的5人,在内的人数为2人,在内的人数为3人.
设分数在[ 40,50 )内的2人为,分数在[ 50,60 )内的3人为,
则在这5人中抽取2人的情况有:,,,,,,,,,,共有10种情况,
其中分数在同一组的2人有,,,,有4种情况,
所以概率为.
类型二:回归方程应用
例题 2 如图是某地2014年至2020年生活垃圾无害化处理量(单位:万吨)的折线图.
注:年份代码1~7分别对应年份2014~2020.
(1)由折线图看出,可用线性回归模型拟合与的关系,请用相关系数加以证明;
(2)建立关于的回归方程(系数精确到0.01),预测2022年某地生活垃圾无害化处理量.
附注:
参考数据:,,,.
参考公式:相关系数,回归方程中斜率和截距的最小二乘法估计公式分别为,.
【答案】(1)存在较强的正相关关系,理由见解析
(2),1.82万吨
【解析】
(1)由折线图看出,与之间存在较强的正相关关系,理由如下:
,,,,
.
,故与之间存在较强的正相关关系.
(2)
由(1)结合题中数据可得,
,
关于的回归方程,2022年对应的值为9,故,
预测2022年该地生活垃圾无害化处理量为1.82万吨.
例题3 千百年来,人们一直在通过不同的方式传递信息.在古代,烽火狼烟、飞鸽传书、快马驿站等通信方式被人们广泛应用;第二次工业革命后,科技的进步带动了电讯事业的发展,电报电话的发明让通信领域发生了翻天覆地的变化;之后,计算机和互联网的出现则使得“千里眼”“顺风耳”变为现实.现在,的到来给人们的生活带来颠覆性的变革,某科技创新公司基于领先技术的支持,经济收入在短期内逐月攀升,该创新公司在第月份至6月份的经济收入(单位:百万元)关于月份的数据如表:
时间(月份)
1
2
3
4
5
6
收入(百万元)
根据以上数据绘制散点图,如图.
(1)根据散点图判断,与均为常数)哪一个适宜作为经济收入关于月份的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的结果及表中的数据,求出关于的回归方程,并预测该公司8月份的经济收入;
(3)从前6个月的收入中抽取个﹐记月收入超过百万的个数为,求的分布列和数学期望.
参考数据:
其中设
参考公式和数据:对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计公式分别为:,
【答案】(1);
(2),百万元;
(3)分布列见解析,2.
【解析】(1)根据散点图判断,适宜作为经济收入关于月份的回归方程类型.
(2)因为,所以两边同时取常用对数﹐得,
设,所以,又因为,
所以,,
所以,即,
令,得,故预测该公司月份的经济收入为百万元.
(3)前个月的收入中,月收入超过百万的有个,所以的取值为,
,,,
所以的分布列为
所以.
类型三: 独立性检验
例题4.“双减”政策实施后,小学生的周末体育锻炼时间得到增加,为了解低年级(一、二、三年级)和高年级(四、五、六年级)学生的周末体育锻炼时间是否有差异,研究人员随机调查了100名小学生,所得数据统计如下表所示.已知从这100人中随机抽取1人,抽到周末体育锻炼时间超过120min的学生的概率为.
周末体育锻炼时间
超过120 min
不超过120 min
低年级
m
20
高年级
45
n
(1)求m,n的值;
(2)是否有99.9%的把握认为低年级和高年级学生的周末体育锻炼时何有差异?
附表及公式:
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
,.
【答案】(1), (2)是
【解析】:由(1)可得列联表如下所示:
周末体育锻炼时间
超过120 min
不超过120 min
合计
低年级
30
20
50
高年级
45
5
50
合计
75
25
100
所以,
故有99.9%的把握认为低年级和高年级学生的周末体育锻炼时间有差异.
1.(2022·四川省高县中学校高三阶段练习)为了解某高校学生中午午休时间玩手机情况,随机抽取了100名大学生进行调查.下面是根据调查结果绘制的学生日均午休时玩手机时间的频率分布直方图:将日均午休时玩手机不低于40分钟的学生称为“手机控”.
非手机控
手机控
合计
男
x
m
n
女
y
10
55
合计
______
______
______
(1)求列表中数据的值;
(2)能否有的把握认为“手机控”与性别有关?
独立性检验临界值表:
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
参考公式及数据:,其中
【答案】(1)x=30,y=45,m=15,n=45
(2)没有95%把握认为“手机控”与性别有关
【解析】
(1)解:由频率分布直方图可知,在抽取的100人中,“手机控”有:100×(0.2+0.05)=25人,非手机控75人,∴x=30,y=45,m=15,n=45;
(2):由(1)可得2×2列联表如下:
非手机控
手机控
合计
男
30
15
45
女
45
10
55
合计
75
25
100
所以K2=≈3.030<3.841,
所以没有95%把握认为“手机控”与性别有关.
2.(2022·湖南·长沙一中高三阶段练习)为了巩固拓展脱贫攻坚的成果,振兴乡村经济,某知名电商平台决定为脱贫乡村的特色水果开设直播带货专场.该特色水果的热卖黄金时段为2021年7月10日至9月10日,为了解直播的效果和关注度,该电商平台统计了已直播的2021年7月10日至7月14日时段中的相关数据,这5天的第x天到该电商平台专营店购物的人数y(单位:万人)的数据如下表:
日期
7月10日
7月11日
7月12日
7月13日
7月14日
第x天
1
2
3
4
5
人数y(单位:万人)
75
84
93
98
100
(1)依据表中的统计数据,请判断该电商平台的第x天与到该电商平台专营店购物的人数y(单位:万人)是否具有较高的线性相关程度?(参考:若,则线性相关程度一般,若,则线性相关程度较高,计算r时精确度为0.01)
(2)求购买人数y与直播的第x天的线性回归方程;用样本估计总体,请预测从2021年7月10日起的第38天到该专营店购物的人数(单位:万人).
参考数据:,,.
附:相关系数,回归直线方程的斜率,截距.
【答案】(1)具有较高的线性相关程度
(2),314万人
【解析】
(1)由表中数据可得,所以,
又,
所以,
所以该电商平台直播黄金时段的天数x与购买人数y具有较高的线性相关程度.
所以可用线性回归模型拟合人数y与天数x之间的关系.
(2)由表中数据可得,
则,所以,
令,可得(万人)
3.(2022·四川省高县中学校模拟预测(文))在某校高二年级的一次数学素养能力测试中,甲、乙两个班级(各40名学生)在这次能力测试中的成绩的频率分布直方图如图所示.
(1)依据频率分布直方图估计甲、乙两个班级平均成绩;
(2)若规定:成绩不低于90分的为优秀,低于90分的为不优秀.用分层抽样从甲、乙两个班在这次测试成绩优秀的学生中抽取3人,再从这3人抽取2人作深度分析,求这2人来自不同班级的概率.
【答案】(1)分和分 (2)
【解析】
(1)同一组数据用该区间的中点值作代表,
则甲班的平均成绩为:,
乙班的平均成绩为:,
故甲、乙两个班级平均成绩分别为分和分;
(2)由题意,甲班优秀的人数为人,
乙班优秀的人数为人,
因此抽取3人中,甲班2人,乙班1人.
不妨设甲班抽取的2人为a,b,乙班抽取的1人为c,
则从a,b,c这3人中抽取2人的总的基本事件有ab,ac,bc,共3个,
其中这2人来自不同班级的基本事件有ac,bc,共2个,故所求的概率为.
4.(2022·全国·高三专题练习)我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金,现该企业为了解年研发资金投入额x(单位:亿元)对年盈利额y(单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额和年盈利额的数据.通过对比分析,建立了两个函数模型:①;②,其中均为常数,e为自然对数的底数.令,,经计算得如下数据:
26
215
65
2
680
5.36
11250
130
2.6
12
(1)请从相关系数的角度,分析哪一个模型拟合程度更好;
(2)根据(1)的选择及表中数据,建立y关于x的回归方程(回归系数精确到0.01).
附:相关系数,
线性回归直线方程,其中附:,.
【答案】(1)模型②更好,理由见解析;
(2).
【解析】若选择模型①,
故可得其相关系数
若选择模型②,,
故可得其相关系数
则,因此从相关系数的角度,模型的拟合程度更好.
(2)
先建立关于的线性回归方程,由得,即.
,,
故关于的线性回归方程为:,
故,即,
故y关于x的回归方程为:.
1.(2022·全国·)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备
9.8
10.3
10.0
10.2
9.9
9.8
10.0
10.1
10.2
9.7
新设备
10.1
10.4
10.1
10.0
10.1
10.3
10.6
10.5
10.4
10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
(1)求,,,;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
【答案】(1);(2)新设备生产产品的该项指标的均值较旧设备有显著提高.
【解析】
【详解】(1),
,
,
.
(2)依题意,,,
,所以新设备生产产品的该项指标的均值较旧设备有显著提高.
2.(2022·全国·)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品
二级品
合计
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
附:
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)75%;60%;(2)能.
【解析】
(1)甲机床生产的产品中的一级品的频率为,
乙机床生产的产品中的一级品的频率为.
(2),
故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.
3.(2022·全国·(文))某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
的分组
企业数
2
24
53
14
7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:.
【答案】(1) 增长率超过的企业比例为,产值负增长的企业比例为;(2)平均数;标准差.
【解析】
【分析】(1)由题意可知,随机调查的个企业中增长率超过的企业有个,
产值负增长的企业有个,
所以增长率超过的企业比例为,产值负增长的企业比例为.
(2)由题意可知,平均值,
标准差的平方:
,
所以标准差.
4.(2019·全国·(文))某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意
不满意
男顾客
40
10
女顾客
30
20
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?
附:.
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1);
(2)能有的把握认为男、女顾客对该商场服务的评价有差异.
【解析】
(1)由题中表格可知,50名男顾客对商场服务满意的有40人,
所以男顾客对商场服务满意率估计为,
50名女顾客对商场满意的有30人,
所以女顾客对商场服务满意率估计为,
(2)由列联表可知,
所以能有的把握认为男、女顾客对该商场服务的评价有差异.
5.(2020·全国·)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次
空气质量等级
[0,200]
(200,400]
(400,600]
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤400
人次>400
空气质量好
空气质量不好
附:,
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)该市一天的空气质量等级分别为、、、的概率分别为、、、;(2);(3)有,理由见解析.
【解析】
【分析】(1)由频数分布表可知,该市一天的空气质量等级为的概率为,等级为的概率为,等级为的概率为,等级为的概率为;
(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为
(3)列联表如下:
人次
人次
空气质量不好
空气质量好
,
因此,有的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
6.(2020·全国·)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=,≈1.414.
【答案】(1);(2);(3)详见解析
【解析】(1)样区野生动物平均数为,
地块数为200,该地区这种野生动物的估计值为
(2)样本(i=1,2,…,20)的相关系数为
(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,
由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,
采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,
从而可以获得该地区这种野生动物数量更准确的估计.
7.(2020·全国·)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:
甲分厂产品等级的频数分布表
等级
A
B
C
D
频数
40
20
20
20
乙分厂产品等级的频数分布表
等级
A
B
C
D
频数
28
17
34
21
(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;
(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?
【答案】(1)甲分厂加工出来的级品的概率为,乙分厂加工出来的级品的概率为;(2)选甲分厂,理由见解析.
【解析】
【分析】(1)由表可知,甲厂加工出来的一件产品为级品的概率为,乙厂加工出来的一件产品为级品的概率为;
(2)甲分厂加工件产品的总利润为元,
所以甲分厂加工件产品的平均利润为元每件;
乙分厂加工件产品的总利润为
元,
所以乙分厂加工件产品的平均利润为元每件.
故厂家选择甲分厂承接加工任务.
专题06 函数与导数-【大题小卷】冲刺2022年高考数学大题限时集训(全国通用): 这是一份专题06 函数与导数-【大题小卷】冲刺2022年高考数学大题限时集训(全国通用),文件包含专题06函数与导数-大题小卷冲刺2022年高考数学大题限时集训解析版docx、专题06函数与导数-大题小卷冲刺2022年高考数学大题限时集训原卷版docx等2份试卷配套教学资源,其中试卷共63页, 欢迎下载使用。
专题04 立体几何(文科专用)-【大题小卷】冲刺2022年高考数学大题限时集训(全国通用): 这是一份专题04 立体几何(文科专用)-【大题小卷】冲刺2022年高考数学大题限时集训(全国通用),文件包含专题04立体几何文科-大题小卷冲刺2022年高考数学大题限时集训解析版docx、专题04立体几何文科-大题小卷冲刺2022年高考数学大题限时集训原卷版docx等2份试卷配套教学资源,其中试卷共30页, 欢迎下载使用。
专题04 立体几何(理科专用)-【大题小卷】冲刺2022年高考数学大题限时集训(全国通用): 这是一份专题04 立体几何(理科专用)-【大题小卷】冲刺2022年高考数学大题限时集训(全国通用),文件包含专题04立体几何理科-大题小卷冲刺2022年高考数学大题限时集训解析版docx、专题04立体几何理科-大题小卷冲刺2022年高考数学大题限时集训原卷版docx等2份试卷配套教学资源,其中试卷共55页, 欢迎下载使用。