所属成套资源:【查漏补缺】2022年高考数学(文)三轮冲刺过关
回归教材重难点06 概率与统计-【查漏补缺】2022年高考数学(文)三轮冲刺过关
展开
这是一份回归教材重难点06 概率与统计-【查漏补缺】2022年高考数学(文)三轮冲刺过关,文件包含回归教材重难点06概率与统计解析版docx、回归教材重难点06概率与统计原卷版docx等2份试卷配套教学资源,其中试卷共50页, 欢迎下载使用。
回归教材重难点06 概率与统计
概率与统计解答题是高考数学必考内容,该考点命题相对稳定,难度中等,是考生必须突破的核心内容之一.
高考概率与统计主要考查统计分析、变量的相关关系,独立性检验、用样本估计总体及其特征的思想,考查对概率事件的判断识别及其概率的计算。试题考查特点是以实际应用问题为载体,解答题部分主要考查独立性检验、统计以及概率的计算。概率的应用立意高,情境新,赋予时代气息,贴近学生的实际生活。取代了传统意义上的应用题,成为高考中的亮点。
回顾近几年的高考试题,可以看出概率统计解答题,大多紧密结合社会实际,以现实生活为背景设置试题,注重知识的综合应用与实际应用,作为考查实践能力的重要载体,命题者要求考生会收集,整理、分析数据,能从大量数据中抽取对研究问题有用的信息,建立数学模型,再应用数学原理和数学工具解决实际问题.
1.统计图表
(1)制作频率分布直方图的步骤.
第一步:求极差,决定组数和组距,组距
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表;
第四步:画频率分布直方图.
(2)解决频率分布直方图问题时要抓住3个要点.
①直方图中各小矩形的面积之和为1;
②直方图中纵轴表示,故每组样本的频率为组距
③直方图中每组样本的频数为频率总体个数.
(3)用频率分布直方图估计众数、中位数、平均数的方法.
①众数为频率分布直方图中最高矩形底边中点的横坐标;
②中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;
③平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和.
2.回归分析
线性回归分析的原理、方法和步骤:
(1)利用图表和数字特征可以对数据做简单的分析,但是用回归直线方程可以对数据的未来值进行预测.在选取数据观察的时候,要注意大量相对稳定的数据比不稳定的数据更有价值,近期的数据比过去久远的数据更有价值.
(2)判断两组数据是否具有线性相关关系的方法:散点图,相关系数.
(3)相关指数与相关系数在含有一个解释变量的线性回归模型中是等价的量,都是用来判断线性回归模型拟合效果好不好的量.
(4)利用换元法,可以将一元非线性回归转化为线性回归.
3.独立性检验
解独立性检验应用问题的注意事项。
(1)两个明确:①明确两类主体;②明确研究的两个问题.
(2)在列联表中注意事件的对应及相关值的确定,不可混淆.
(3)在实际问题中,独立性检验的结论仅是一种数学关系表述,得到的结论有一定的概率出错.
(4)对判断结果进行描述时,注意对象的选取要准确无误,应是对假设结论进行的含概率的判断,而非其他.
【真题演练】
1.(2020·全国·高考真题(文))某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次
空气质量等级
[0,200]
(200,400]
(400,600]
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤400
人次>400
空气质量好
空气质量不好
附:,
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)该市一天的空气质量等级分别为、、、的概率分别为、、、;(2);(3)有,理由见解析.
【解析】
【分析】
(1)根据频数分布表可计算出该市一天的空气质量等级分别为、、、的概率;
(2)利用每组的中点值乘以频数,相加后除以可得结果;
(3)根据表格中的数据完善列联表,计算出的观测值,再结合临界值表可得结论.
【详解】
(1)由频数分布表可知,该市一天的空气质量等级为的概率为,等级为的概率为,等级为的概率为,等级为的概率为;
(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为
(3)列联表如下:
人次
人次
空气质量不好
空气质量好
,
因此,有的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
【点睛】
本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据处理能力,属于基础题.
2.(2020·全国·高考真题(文))某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:
甲分厂产品等级的频数分布表
等级
A
B
C
D
频数
40
20
20
20
乙分厂产品等级的频数分布表
等级
A
B
C
D
频数
28
17
34
21
(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;
(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?
【答案】(1)甲分厂加工出来的级品的概率为,乙分厂加工出来的级品的概率为;(2)选甲分厂,理由见解析.
【解析】
【分析】
(1)根据两个频数分布表即可求出;
(2)根据题意分别求出甲乙两厂加工件产品的总利润,即可求出平均利润,由此作出选择.
【详解】
(1)由表可知,甲厂加工出来的一件产品为级品的概率为,乙厂加工出来的一件产品为级品的概率为;
(2)甲分厂加工件产品的总利润为元,
所以甲分厂加工件产品的平均利润为元每件;
乙分厂加工件产品的总利润为
元,
所以乙分厂加工件产品的平均利润为元每件.
故厂家选择甲分厂承接加工任务.
【点睛】
本题主要考查古典概型的概率公式的应用,以及平均数的求法,并根据平均值作出决策,属于基础题.
3.(2021·全国·高考真题(文))甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品
二级品
合计
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
附:
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)75%;60%;
(2)能.
【解析】
【分析】
根据给出公式计算即可
【详解】
(1)甲机床生产的产品中的一级品的频率为,
乙机床生产的产品中的一级品的频率为.
(2),
故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.
4.(2019·全国·高考真题(文))某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
的分组
企业数
2
24
53
14
7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:.
【答案】(1) 增长率超过的企业比例为,产值负增长的企业比例为;(2)平均数;标准差.
【解析】
【分析】
(1)本题首先可以通过题意确定个企业中增长率超过的企业以及产值负增长的企业的个数,然后通过增长率超过的企业以及产值负增长的企业的个数除随机调查的企业总数即可得出结果;
(2)可通过平均值以及标准差的计算公式得出结果.
【详解】
(1)由题意可知,随机调查的个企业中增长率超过的企业有个,
产值负增长的企业有个,
所以增长率超过的企业比例为,产值负增长的企业比例为.
(2)由题意可知,平均值,
标准差的平方:
,
所以标准差.
【点睛】
本题考查平均值以及标准差的计算,主要考查平均值以及标准差的计算公式,考查学生从信息题中获取所需信息的能力,考查学生的计算能力,是简单题.
5.(2019·全国·高考真题(文))某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意
不满意
男顾客
40
10
女顾客
30
20
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?
附:.
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1);
(2)能有的把握认为男、女顾客对该商场服务的评价有差异.
【解析】
【分析】
(1)从题中所给的列联表中读出相关的数据,利用满意的人数除以总的人数,分别算出相应的频率,即估计得出的概率值;
(2)利用公式求得观测值与临界值比较,得到能有的把握认为男、女顾客对该商场服务的评价有差异.
【详解】
(1)由题中表格可知,50名男顾客对商场服务满意的有40人,
所以男顾客对商场服务满意率估计为,
50名女顾客对商场满意的有30人,
所以女顾客对商场服务满意率估计为,
(2)由列联表可知,
所以能有的把握认为男、女顾客对该商场服务的评价有差异.
【点睛】
该题考查的是有关概率与统计的知识,涉及到的知识点有利用频率来估计概率,利用列联表计算的值,独立性检验,属于简单题目.
【好题演练】
1.(2022·安徽·安庆一中模拟预测(文))2022年北京冬奥会防寒服中的“神奇内芯”—仿鹅绒高保暖絮片,是国家运动员教练员比赛服装的保暖材料.该“内芯”具有超轻超薄、湿态保暖、高蓬松度等特点,其研发是国家重点研发计划“科技冬奥”重点专项之一,填补了国内空白.为了保证其质量,厂方技术员从生产的一批保暖絮片中随机抽取了100处,分别测量了其纤维长度(单位:)的均值,并制成如下频率分布直方图:
(1)估计该批保暖絮片纤维长度的平均数和样本方差(同一组数据用该区间的中点值作代表);
(2)该批保暖絮片进人成品库之前需进行二次检验,从中随机抽取15处测量其纤维长度均值,数据如下:31.8,32.7,28.2,34.3,29.1,34.8,37.2,30.8,30.6,25.2,32.9,28.9,33.9,29.5,34.5.请问该批保暖絮片是否合格?(若二次抽检纤维长度均值满足,则认为保暖絮片合格,否则认为不合格).
【答案】(1)31,12.28;
(2)合格﹒
【解析】
【分析】
(1)根据频率分布直方图,求出每一组的频率和频数,根据方差计算公式即可计算方差;
(2)求出,比较的大小关系即可判断.
(1)
由频率分布直方图可得,纤维长度区间是、、、、、、、的频率分别为:0.04、0.09、0.16、0.24、0.18、0.14、0.10、0.05,
对应的频数分别为:4、9、16、24、18、14、10、5,
故样本均值为:
;
样本方差为:
﹒
∴估计该保暖絮片的纤维长度的平均数为,方差为;
(2)
二次抽检纤维长度均值:
,
∵,
∴该批保暖絮片合格﹒
2.(2022·陕西汉中·二模(文))学习强国”APP是由中宣部主管以习近平新时代中国特色社会主义思想和党的十九大精神为主要内容的“PC端+手机客户端”两大终端二合一模式的学习平台,2019年1月1日上线后便成了党员干部群众学习的“新助手”,为了调研某地党员在“学习强国”APP的学习情况,研究人员随机抽取了200名该地党员进行调查,将他们某两天在“学习强国”APP上所得的分数统计如下表所示:
分数
人数
50
100
20
30
(1)现用分层抽样的方法从80分及以上的党员中随机抽取5人,再从抽取的5人中随机选取2人作为学习小组长,求所选取的两位小组长的分数都在上的概率;
(2)为了调查“学习强国”APP得分情况是否受到学习时长的影响,研究人员随机抽取了部分党员作出调查,得到的数据如下表所示:
日均学习两小时以上
日均学习不足两小时
分数超过80
220
150
分数不超过80
80
50
判断是否有99%的把握认为“学习强国”APP得分情况与学习时长有关.
附:,.
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
【答案】(1);
(2)没有的把握认为“学习强国”得分情况与学习时长有关.
【解析】
【分析】
(1)根据分层抽样求出分数在、应抽人数,由古典概率公式即可求解;
(2)补全列联表计算的值与临界值比较即可判断.
(1)
由题意得,分数在的应抽人,记作,,
分数在的应抽人,记作,,,
选取人作为学习小组长的基本事件有,,,,,,,,,,共个,
其中两位小组长的分数都在上的有,,,共个基本事件,
所以所求概率.
(2)
补全列联表如下:
日均学习两小时以上
日均学习不足两小时
总计
分数超过80
220
150
370
分数不超过80
80
50
130
总计
300
200
500
所以,
所以没有的把握认为“学习强国”得分情况与学习时长有关.
3.(2022·河南平顶山·模拟预测(文))家用自来水水龙头由于使用频繁,很容易损坏,受水龙头在保修期内维修费等因素的影响,企业生产每件水龙头的利润与该水龙头首次出现损坏的时间有关,某阀门厂生产尺寸都为4分(指的是英制尺寸)的甲(不锈钢阀芯),乙(黄铜阀芯)两种品牌的家用水龙头,保修期均为1年(4个季度),现从该厂已售出的这两种水龙头中各随机抽取200件,统计数据如下表,
品牌
甲
乙
首次出现损坏时间x(季度)
水龙头数量(件)
20
180
8
16
176
每件的利润(元)
3.6
5.8
2
4
6
将频率视为概率,解答下列问题:
(1)从该厂生产的甲、乙两种品牌水龙头中各随机抽取一件,试比较首次出现损坏发生在保修期内的概率的大小;
(2)由于资金限制,只能生产其中一种品牌的水龙头,若从水龙头的利润的平均值考虑,你认为应选择生产哪种品牌的水龙头比较合理?
【答案】(1)乙品牌水龙头首次出现损坏发生在保修期内的概率大于甲品牌水龙头首次出现损坏发生在保修期内的概率.
(2)应生产乙品牌的水龙头.
【解析】
【分析】
(1)利用古典概型概率计算公式分别求出甲、乙两种品牌水龙头首次出现损坏发生在保修期内的概率,比较它们的大小,即可得出结果.
(2)分别求出甲、乙两种品牌水龙头的数学期望,比较它们的大小即可得出结果.
(1)
设“甲、乙两种品牌水龙头首次出现损坏发生在保修期内”为事件,
,,.
即乙品牌水龙头首次出现损坏发生在保修期内的概率大于甲品牌水龙头首次出现损坏发生在保修期内的概率.
(2)
设生产一件甲品牌水龙头的利润为,生产一件乙品牌水龙头的利润为,
,则,
所以的分布列为:
3.6
5.8
(元)
,则,
所以的分布列为:
2
4
6
(元)
,所以应生产乙品牌的水龙头.
4.(2022·黑龙江·哈尔滨三中二模(文))某公司对项目A进行生产投资,所获得的利润有如下统计数据表:
项目A投资金额x(百万元)
2
3
4
5
6
所获利润y(百万元)
0.2
0.2
0.4
0.8
0.9
(1)请用线性回归模型拟合y与x的关系,求出回归方程,并用样本相关系数加以说明y与x相关性的强弱(一般地,样本相关系数,则认为线性相关性较强;否则,线性相关性较弱);
(2)该公司计划用7百万元对A,B两个项目进行投资,若公司利用(1)中线性回归模型对项目A投资所获得的利润进行预测,对项目B投资百万元所获得的利润y近似满足:,求A,B两个项目投资金额分别为多少时,获得的总利润最大.
参考公式:,.样本相关系数.
参考数据:统计数据表中,,.
【答案】(1),线性相关性较强
(2)A,B两个项目投资金额分别为5百万元,2百万元时,获得的总利润最大
【解析】
【分析】
(1)根据表中数据及参看数据,求出,,进而求得回归直线方程和相关系数,利用相关系数可以说明变形的相关强弱即可求解;
(2)根据已知条件列出总利润的表达式,再利用基本不等式即可求解.
(1)
由已知,
,,,
所以线性回归直线方程为.
y与x线性相关性较强
(2)
设B项目投资百万元,则A项目投资百万元
总利润
当且仅当即时取等号,此时
所以A,B两个项目投资金额分别为5百万元,2百万元时,获得的总利润最大.
5.(2022·宁夏石嘴山·一模(文))某校为检测高一年级学生疫情期间网课的听课效果,从年级随机抽取名学生期初考试数学成绩(单位:分),画出频率分布直方图如图所示,其中成绩分组区间是、、、、.
(1)求图中的值,并根据频率分布直方图估计这名学生数学成绩的平均分;
(2)从和分数段内采用分层抽样的方法抽取名学生,再从这名学生中随机抽取名学生进行座谈,求这名学生中有两名成绩在的概率;
(3)已知(2)问中抽取的名同学中含有甲、乙两人,甲已经被抽出座谈,求乙也参与座谈的概率.
【答案】(1),平均分为(分)
(2)
(3)
【解析】
【分析】
(1)利用频率分布直方图中所有矩形面积之和为可求得的值,将每个矩形底边的中点值乘以对应矩形的面积,将所得乘积全部相加可得出这名学生数学成绩的平均分;
(2)设成绩在中的三人为、、,成绩在中的二人为、,列举出所有的基本事件,并确定所求事件所包含的基本事件,利用古典概型的概率公式可求得所求事件的概率;
(3)列举出甲被抽出的情况以及在甲参加的条件下乙也参加的情况,利用条件概率公式可求得所求事件的概率.
(1)
解:依题意得,解得,
这名学生的数学平均分为(分).
(2)
解:由(1)可知,成绩在和中的学生人数比为,
所以用分层抽样方法抽取成绩在和中的学生人数分别为人和人,
设成绩在中的三人为、、,成绩在中的二人为、,
从这人中任取三人的所有可能情况为:、、、、、、
、、、,共种,
而有两名成绩在中的有、、、、、,共种,
故所求概率为.
(3)
解:由题可知,乙也参加座谈属于条件概率,
设(2)中人分别为:甲、乙、、、,
甲被抽出的情况为:甲乙、甲乙、甲乙、甲、甲、甲,共6种,
在甲参加的条件下乙也参加的情况有:甲乙、甲乙、甲乙,共种,
故甲已经被抽出座谈,乙也参与座谈的概率为.
6.(2022·甘肃·二模(文))人工智能教育是将人工智能与传统教育相结合,借助人工智能和大数据技术打造的智能化教育生态.为了解我国人工智能教育发展状况,通过中国互联网数据平台得到我国2015年-2020年人工智能教育市场规模统计图.如图所示,若用x表示年份代码(2015年用1表示,2016年用2表示,依次类推),用y表示市场规模(单位:亿元),试回答:
(1)根据条形统计图中数据,计算变量y与x的相关系数r,并用r判断两个变量y与x相关关系的强弱(精确到小数点后2位);
(2)若y与x的相关关系拟用线性回归模型表示,试求y关于x的线性回归方程,并据此预测2022年中国人工智能教育市场规模(精确到1亿元).
附:线性回归方程,其中;
相关系数;
参考数据:.
【答案】(1),正相关很强.
(2),2677亿元.
【解析】
【分析】
(1)根据统计图中数据计算,代入相关系数公式求出相关系数,判断相关系数的绝对值与0.75的关系即可;
(2)根据统计图中数据结合公式即可求出线性回归方程,将x=8代入线性回归方程即可预测2022年中国人工智能教育市场规模.
(1)
∵,,,,
∴相关系数.
∵相关系数,∴y与x具有线性相关关系,且正相关很强.
(2)
设y关于x的线性回归方程为,
其中;
,
∴y关于x的线性回归方程为,
把代入得(亿元),
故据此预测2022年中国人工智能教育市场规模将达到约2677亿元.
7.(2022·河南·汝州市第一高级中学模拟预测(文))2021年10月1日是中华人民共和国成立72周年.某校举行了爱国知识竞赛,为了解本次竞赛成绩情况,随机抽取了100名学生的成绩(满分100分,最低分不低于50分)进行统计,得出频率分布直方图如图所示:
(1)求实数m的值,并估计这100名学生的成绩的平均数(同一组数据用该区间的中点值作代表);
(2)若用分层抽样的方法在,,这三组中抽取6人担任爱国知识宣传员,再从这6人中随机选出2人负责整理爱国知识相关材料,求这2人中至少有1人来自组的概率.
【答案】(1),平均数是84.2分;
(2).
【解析】
【分析】
(1)利用直方图的性质及平均数的求法即得;
(2)利用分层抽样的概念及古典概型的概率公式即得.
(1)
由题意知,,
解得,
∴(分).
估计这100名学生的成绩的平均数是84.2分.
(2)
由题知组有人,组有人,组有人,
利用分层抽样抽取6名学生,则在,,组中抽取的人数分别为:人,人,人,
即在,,组中抽取的人数分别为1人、2人、3人,
记组的1位同学为A,组的2位同学为、,组的3位同学为、、,
则从6位同学中抽2位同学有,,,,,,,,,,,,,,,共15种可能,
其中组中至少有1人入选的有,,,,,,,,,共9种,
所以这2人中至少有1人来自组的概率为.
8.(2022·江西·上饶市第一中学二模(文))在迎接年北京冬季奥运会期间,某校开展了“冰雪答题王”冬奥知识竞赛活动.现从参加冬奥知识竞赛活动的学生中随机抽取了名学生,将他们的比赛成绩(满分为分)分为组:,得到如图所示的频率分布直方图.
(1)求的值;
(2)从比赛成绩在和两个分数段内按照分层抽样随机抽取名学生,再从这名学生中随机抽取两名学生,求这两名学生恰好来自不同分数段的概率.
【答案】(1)
(2)
【解析】
【分析】
(1)利用频率和为可直接求得结果;
(2)根据分层抽样原则可确定中应抽取人,中应抽取人;列举出名学生中随机抽取两名学生所有的基本事件和两名学生恰好来自不同分数段的基本事件,由古典概型概率公式可得结果.
(1)
,.
(2)
比赛成绩在和的频率之比为,
中应抽取人,记为;中应抽取人,记为;
从名学生中随机抽取两名学生有:,,,,,,,,,,,,,,,,,,,,,共个基本事件;
其中两名学生恰好来自不同分数段的情况有,,,,,,,,,,共个基本事件;
两名学生恰好来自不同分数段的概率.
9.(2022·黑龙江·齐齐哈尔市第一中学校一模(文))某家庭记录了未使用节水龙头50天的日用水量数据(单位:)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用水量
频数
1
3
2
4
9
26
5
日用水量
频数
1
5
13
10
16
5
使用了节水龙头50天的日用水量频数分布表
(1)在图中作出使用了节水龙头50天的日用水量数据的频率分布直方图:
(2)估计该家庭使用节水龙头后,日用水量小于的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)
【答案】(1)作图见解析
(2)0.38
(3)
【解析】
【分析】
(1)根据频率分布表中的数据直接作即可,
(2)根据频率分布表求出日用水量小于的频率即可,
(3)先求出未使用节水龙头50天的日用水量的平均值和使用节水龙头50天的日用水量的平均值,然后作差,再乘以365即可
(1)
(2)
日用水量小于的概率为;
(3)
该家庭未使用节水龙头50天的日用水量的平均值为:
该家庭使用节水龙头50天的日用水量的平均值为:
估计使用节水龙头后,一年可节省水.
10.(2022·安徽合肥·二模(文))《中国统计年鉴2021》数据显示,截止到2020年底,我国私人汽车拥有量超过24千万辆.下图是2011年至2020年十年间我国私人汽车拥有量(单位:千万辆)折线图.
(注:年份代码1-10分别对应年份2011-2020)
(1)由折线图能够看出,可以用线性回归模型拟合与的关系,请用相关系数加以说明;
(2)建立关于的线性回归方程(系数精确到0.01),并预测2022年我国私人汽车拥有量.
参考数据:,,,,,.
参考公式:相关系数,线性回归方程中,斜率和截距的最小二乘估计公式分别为,.
【答案】(1)说明见解析
(2),28.11千万辆
【解析】
【分析】
(1)根据相关系数公式及相关数据计算可求解;
(2)根据题中的数据及公式先求得,再令代入可求解.
(1)
由题意得,,
相关系数,说明与的线性相关性很高,
所以,可以用线性回归模型拟合与的关系.
(2)
由,,
所以,因此,
所以.当时,.
所以2022年我国私人汽车拥有量约为千万辆.
据此可以预测,2022年我国私人汽车拥有量将达到28.11千万辆.
11.(2022·安徽黄山·二模(文))为了解高一年级学生的选科意愿,某学校随机抽取该校名高一学生进行调查,其中女生与男生人数比是2:3,已知从人中随机抽取人,抽到报考物理的学生的概率为.
学科
物理
历史
合计
女生
20
男生
合计
(1)请补全列联表,并判断是否有的把握认为选科与性别有关;
(2)为了解选择物理学科意愿的同学的选择原因,从选物理的同学中抽取了人,其中有名女生,并从这名同学选出人进行“当面交流”,问该组有女生的概率?
附表及公式:
3.841
6.635
10.828
【答案】(1)列联表见解析,有的把握认为选科与性别有关
(2)
【解析】
【分析】
(1)直接填出列联表,按照公式计算即可;
(2)直接列举出所有情况,找出包含女生的情况,按照古典概型计算即可.
(1)
由比例可知男生有60人,女生40人,报考物理的有人,故有:
学科
物理
历史
合计
女生
20
20
40
男生
55
5
60
合计
75
25
100
,故有的把握认为选科与性别有关.
(2)
由题意可知:把这个人中女生记为、,男生记为、、、.
从人中选出个人,所有的基本事件为:、、、、、、
、、、、、、、、、、、、、共20种.
有女生的有、、、、、、、、、、、、、、、共16种.
故有女生的概率是.
12.(2022·陕西榆林·三模(文))某商场为提高服务质量,随机调查了20名男顾客和20名女顾客,根据每位顾客对该商场服务质量的评分(满分100分)绘制了如图所示的茎叶图.
(1)根据茎叶图判断男、女顾客中,哪类顾客对该商场的服务质量更认可?并说明理由;
(2)将这40名顾客的评分的中位数记为,并将评分超过和不超过的顾客数填入下面的列联表;
超过
不超过
男顾客
女顾客
(3)根据(2)中的列联表,能否有90%的把握认为顾客对该商场服务质量的评分与性别有关?
附:.
0.10
0.05
0.010
0.001
2.706
3.841
6.635
10.828
【答案】(1)男顾客,理由见解析
(2)列联表见解析
(3)没有
【解析】
【分析】
(1)直接观察茎叶图即可求解;
(2)先计算中位数,再填表格即可;
(3)直接计算出即可判断.
(1)
男顾客对该商场的服务质量更认可.
理由如下:由茎叶图可知,男顾客的评分更多集中在,女顾客的评分更多集中在,
故男顾客对该商场的服务质量更认可.(考生如果给出其他合理理由也可得分)
(2)
由茎叶图可知,.
列联表如下:
超过
不超过
男顾客
11
9
女顾客
7
13
(3)
故没有90%的把握认为对该商场服务质量的评分与性别有关.
13.(2022·江西·模拟预测(文))2022年2月4日北京冬奥运会正式开幕,“冰墩墩”作为冬奥会的吉样物之一,受到各国运动员的“追捧”,成为新晋“网红”,尤其在我国,广大网友纷纷倡导“一户一墩”,为了了解人们对“冰墩墩”需求量,某电商平台采用预售的方式,预售时间段为2022年2月5日至2022年2月20日,该电商平台统计了2月5日至2月9日的相关数据,这5天的第x天到该电商平台参与预售的人数y(单位:万人)的数据如下表:
日期
2月5日
2月6日
2月7日
2月8日
2月9日
第天
1
2
3
4
5
人数(单位:万人)
45
56
64
68
72
(1)依据表中的统计数据,请判断该电商平台的第天与到该电商平台参与预售的人数(单位:万人)是否具有较高的线性相关程度?(参考:若,则线性相关程度一般,若,则线性相关程度较高,计算时精确度为)
(2)求参与预售人数与预售的第天的线性回归方程;用样本估计总体,请预测2022年2月20日该电商平台的预售人数(单位:万人).
参考数据:,附:相关系数
【答案】(1)具有较高的线性相关程度
(2),万人
【解析】
【分析】
(1)根据已知数据计算出相关系数可得;
(2)由已知数据求出回归方程的系数得回归方程,然后在回归方程中令代入计算可得估计值.
(1)
由表中数据可得,
所以
又
所以
所以该电商平台的第天与到该电商平台参与预售的人数(单位:万人)具有较高的线性相关程度即可用线性回归模型拟合人数与天数之间的关系.
(2)
由表中数据可得
则
所以
令,可得(万人)
故预测2022年2月20日该电商平台的预售人数万人
14.(2022·陕西·西安中学模拟预测(文))随着2022年北京冬奥会的成功举办,吉祥物“冰墩墩”成为现象级“顶流”,憨态可掬的大熊猫套着冰晶外壳,“萌杀”万千网友.奥林匹克官方旗舰店“冰墩墩”一再售罄,各冬奥官方特许商店外排起长队,“一墩难求”,成了冬奥赛场外的另一场冰雪浪漫和全民狂欢.某商家将6款基础款的冰墩墩,随机选取3个放在一起组成一个盲盒进行售卖.该店2021年1月到11月盲盒的月销售量如下表所示:
月份数x
1
2
3
4
5
6
7
8
9
10
11
月销售量y/万个
2.6
3.9
5.7
7.3
7.7
9.9
11
13.8
15
16.1
17
(1)求出月销售量y(万个)与月份数x的回归方程,并顶测12月份的销量;
(2)小明同学想通过购买盲盒集齐6款基础款冰墩墩,为此他购买了2个盲盒,求小明至少集齐5款基础款冰墩墩的概率.
参考公式及数据:回归直线的方程是,则..
【答案】(1)万个
(2)
【解析】
【分析】
(1)根据公式求出和可得月销售量y(万个)与月份数x的回归方程,根据此方程可求出12月份的销量;
(2)利用古典概型的概率公式可求出结果.
(1)
(1),
,
,,
所以,
所以月销售量y(万个)与月份数x的回归方程为.
当时,万个.
故12月份的销量为万个.
(2)
第一个盲盒中有种,第二个盲盒中有种,所以两个盲盒中共有种,
两个盲盒中恰好集齐5款的有种,恰好集齐6款的有种,所以两个盲盒中至少集齐5款的有种,
所以小明至少集齐5款基础款冰墩墩的概率为.
15.(2022·江西宜春·模拟预测(文))某企业从领导干部、员工中按比例随机抽取50人组成一个评审团,对A、B两个员工作为后备干部的竞聘演讲及个人技术能力展示进行评分,满分均为100分,整理评分数据,将分数以10为组距分为5组:,,,,,得到A员工的频率分布直方图和B员工的频数分布表:
(1)在评审团的50人中,求对A员工的评分不低于80分的人数;
(2)从对B员工的评分在范围内的人中随机选出2人,求2人评分均在范围内的概率;
(3)该企业决定:若评审团给员工评分的中位数大于82分,则推荐这名员工作为后备干部人选,请问评审团将推荐哪一位员工作为后备干部人选?
【答案】(1)27人;
(2);
(3)B员工.
【解析】
【分析】
(1)根据频率分布直方图求出a即可列式计算作答.
(2)由频率分布表得评分在、内的人数,再利用列举法结合古典概率公式计算作答.
(3)根据频率分布直方图及频率分布表求出二位员工评分的中位数即可判断作答.
(1)
由A员工评分的频率分布直方图得:,
所以对A员工的评分不低于80分的人数为:(人).
(2)
对B员工的评分在内有5人,将评分在内的2人记为C,D,评分在内的3人记为E,F,G,
从5 人中任选2人的情况有:CD,CE,CF,CG,DE,DF,DG,EF,EG,FG,共10种,它们等可能,
2人评分均在范围内的有:EF,EG,FG,共3种,
所以2人评分均在范围内的概率.
(3)
由A员工评分的频率分布直方图得:,,
则A员工评分的中位数,有,解得,
由B员工的频数分布表得:,,
则B员工评分的中位数,有,解得,
所以评审团将推荐B员工作为后备干部人选.
16.(2022·贵州·模拟预测(文))北京冬奥会期间,志愿者团队“Field Cast”从所有参加冬奥会的运动健儿中分别抽取男女运动员各100人的年龄进行统计分析(抽取的运动员年龄均在区间[16,40]内),经统计得出女运动员的年龄频率分布直方图(图1)和男运动员的年龄扇形分布图(图2).回答下列问题:
(1)求图1中的a值;
(2)利用图2,估计参赛男运动员的平均年龄(同一组中的数据用该组区间的中点值为代表);
(3)用分层抽样方法在年龄区间为[16,24)周岁的女运动员中抽取5人,男运动员中抽取4人;记这9人中年龄区间在[20,24)周岁的运动员有m人,再从这m人中抽取2人,求这2人是异性的概率.
【答案】(1)
(2)26.8周岁
(3)
【解析】
【分析】
(1)由各组的频率和为1,列方程可求出a的值,
(2)直接利用平均数公式求解即可,
(3)先由题意结合分层抽样的定义求出,然后利用列举法求解概率
(1)
依题意,,
解得
(2)
用每个年龄区间的中点值作为本区间的年龄值,由图2可知:年龄区间为[16,20),[20,24),[24,28),[28,32),[32,36),[36,40]的频率分别为:0.1,0.3,0.2,0.2,0.1,0.1
所以参赛男运动员的平均年龄估值为:
即男运动员的平均年龄估值为26.8周岁.
(3)
由图1可知;年龄区间为[16,20)周岁的女运动员有人,年龄区间为[20,24)周岁的女运动员有人,
由图2可知:年龄区间为[16,20)和[20,24)周岁的男运动员分别有10人和30人,
故用分层抽样女运动员年龄在区间[16,20)和[20,24)应分别抽取2人和3人,男运动员年龄在区间[16,20)和[20,24)应分别抽取1人和3人.
所以抽取的9人中年龄在[20,24)的有6人,故
记这6人中年龄在[20,24)周岁的3名女运动员分别为a,b,c,3名男运动员分别为1,2,3,从6人中抽取2人的基本事件如下:
(a,b),(),(a,1),(a,2),(a,3),(b,c),(b,1),(b,2),(b,3),(c,1),(c,2),(c,3),(1,2),(1,3),(2,3),共15种.
记抽取2人是异性的事件为A,事件A包含基本事件有:
(a,1),(a,2),(a,3),(b,1),(b,2),(b,3),(c,1),(c,2),(c,3)共9种
所以.
相关试卷
这是一份回归教材重难点05 函数与导数-【查漏补缺】2022年高考数学(文)三轮冲刺过关,文件包含回归教材重难点05函数与导数解析版docx、回归教材重难点05函数与导数原卷版docx等2份试卷配套教学资源,其中试卷共40页, 欢迎下载使用。
这是一份回归教材重难点04 圆锥曲线-【查漏补缺】2022年高考数学(文)三轮冲刺过关,文件包含回归教材重难点04圆锥曲线解析版docx、回归教材重难点04圆锥曲线原卷版docx等2份试卷配套教学资源,其中试卷共50页, 欢迎下载使用。
这是一份回归教材重难点03 立体几何-【查漏补缺】2022年高考数学(文)三轮冲刺过关,文件包含回归教材重难点03立体几何解析版docx、回归教材重难点03立体几何原卷版docx等2份试卷配套教学资源,其中试卷共43页, 欢迎下载使用。