所属成套资源:(新高考)高考数学一轮 数学单元复习 过关检测卷+真题模拟卷(解析版)
(新高考)高考数学一轮 数学单元复习 过关检测卷第09章《统计与统计案例》(解析版)
展开
这是一份(新高考)高考数学一轮 数学单元复习 过关检测卷第09章《统计与统计案例》(解析版),共38页。试卷主要包含了单选题,多选题,填空题,双空题,解答题等内容,欢迎下载使用。
01卷 第九章 统计与统计案例《过关检测卷》
-2022年高考一轮数学单元复习(新高考专用)
第I卷(选择题)
一、单选题
1.(2021·重庆巴蜀中学高三月考)城市道路由于通勤造成道路交通的早晚高峰.一般地,工作日早高峰时段通常在7:00-9:00,晚高峰时段通常在17:00-19:00.为了衡量某路段在某一段时间内的拥堵程度,通常采用的指标之一是路段的汽车平均行程速度,即在该时间段通过该路段的汽车的平均速度.路段通常可分为快速路、主干路、次干路、支路,根据不同路段与汽车平均行程速度,可将拥堵程度分为1到5级.等级划分如表(单位:km/h):
等级
1
2
3
4
5
快速路
>65
≤20
主干路
>45
≤15
次干路
>35
≤10
支路
>35
≤10
重庆市的黄花园大桥横跨嘉陵江之上,是连接渝中区和江北区的主干路.今在某高峰时段监测黄花园大桥的汽车平均行程速度,将得到的数据绘制成频率分布直方图如图,根据统计学知识估计该时段黄花园大桥拥堵程度的等级为( )
A.2级 B.3级 C.4级 D.5级
【答案】B
【分析】
结合频率分布直方图求出平均速度,然后根据表格中的信息即可得出结论.
【详解】
解:由题意可知,组距为10,共6组,
由六个矩形面积之和为1,可得速度在[50,60]内的频率为0.05,
因此平均速度为5×0.1+15×0.15+25×0.2+35×0.3+45×0.2+55×0.05=30(km/h),
根据表格中的信息可知,其拥堵等级为3.
故选:B.
2.(2021·江苏泰州市·泰州中学高一期末)在一组样本数据中,1,3,5,7出现的频率分别为p1,p2,p3,p4且,若这组数据的中位数为6,则p4=( )
A.0.5 B.0.4 C.0.2 D.0.1
【答案】A
【分析】
由样本数据中只有1,3,5,7,没有6知样本数据一共有偶数个数,且从小到大排序后中间两个数为5,7,从而求得.
【详解】
∵样本数据中只有1,3,5,7,没有6,
∴样本数据一共有偶数个数,且从小到大排序后中间两个数为5,7,
∴样本数据中有一半是7,∴p4=0.5,
故选:A.
3.(2021·湖南长沙市·长郡中学高二期末)已知数据 的方差为 4 , 若 , 则新数据 的方差为( )
A.2 B.4 C.8 D.16
【答案】D
【分析】
利用方差的定义求解即可
【详解】
解:由题意可得,
因为,所以,
所以新数据 的方差为
,
故选:D
4.(2021·上海市大同中学高二期末)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生规模群体感染的标志为“连续天,每天新增疑似病例不超过人”,根据过去天甲、乙、丙、丁四地新增病例数据,一定符合该标志的是( )
A.甲地:总体均值为,总体方差为 B.乙地:总体均值为,中位数为
C.丙地:总体均值为,总体方差大于 D.中位数为,总体方差为
【答案】A
【分析】
利用平均数、中位数、方差的计算公式以及含义,对四个选项逐一分析判断即可;
【详解】
解:对于A:假设至少有一天的疑似病例超过人,此时方差,这与题设矛盾,所以假设不成立,故正确.
对于B:平均数和中位数不能限制某一天的病例不超过7人,故不正确,
对于C:当总体方差大于0,不知道总体方差的具体数值,因此不能确定数据的波动大小,故不正确,
对于D:中位数为,总体方差为,如,平均数为,方差,满足题意,但是存在大于7的数,故D错误;
故选:A
5.(2021·宁夏长庆高级中学高二期末(理))通过随机询问110名不同的我校学生是否爱好某项运动,得到如下的列联表:经计算的观测值.参照附表,得到的正确结论是( )
附表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
0.050
0.010
0.001
3.841
6.635
10.828
A.有99%以上的把握认为“爱好该项运动与性别有关”
B.有99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
【答案】A
【分析】
根据表格中的数据,求得的值,结合附表,即可得到结论.
【详解】
由表格中的数据,可得,
因为,所以有99%以上的把握认为“爱好体育运动与性别有关”.
故选:A.
6.(2021·福建泉州市·泉州五中高二期末)第24届冬季奥林匹克运动会将于2022年在北京举办,为了解某城市居民对冰雪运动的关注情况,随机抽取了该市100人进行调查统计得到如下2×2列联表
男
女
合计
关注冰雪运动
35
25
60
不关注冰雪运动
15
25
40
合计
50
50
100
根据列联表可知( )
参考公式:,其中.
附表:
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
A.该市女性居民中大约有5%的人关注冰雪运动
B.该市男性届民中大约有95%的人关注冰雪运动
C.有95%的把握认为该市居民是否关注冰雪运动与性别有关
D.有99%的把握认为该市居民是否关注冰雪运动与性别无关
【答案】C
【分析】
根据列联表中数据计算,对照临界值得出结论.
【详解】
解:根据列联表中数据,计算,
经查对临界值表知.
所以有的把握认为该市居民是否关注冰雪运动与性别有关,选项正确.
故选:.
7.(2020·黑龙江省哈尔滨市双城区兆麟中学高二期末(文))下列说法错误的是( )
A.回归直线过样本点的中心
B.在残差图中,残差点分布的带状区域的宽度越窄,其模型拟合的精度越高
C.线性回归方程对应的直线至少经过其样本数据点,,…,中的一个点
D.在回归分析中,的模型比的模型拟合的效果好
【答案】C
【分析】
利用线性回归的相关定义即可得出答案
【详解】
样本中心点一定在线性回归方程上,则A正确;
残差点分布越窄越均匀,拟合程度越高,则B正确;
样本点不一定在线性回归直线上,则C错误;
越接近于1,模拟程度越好,则D正确.
故选:C.
二、多选题
8.(2021·江苏省锡山高级中学高二期末)在发生公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”过去10日,甲、乙、丙、丁四地新增疑似病例数据信息如下:
甲地:中位数为2,极差为5;
乙地:总体平均数为2,众数为2;
丙地:总体平均数为1,总体方差大于0;
丁地:总体平均数为2,总体方差为3.
则甲、乙、丙、丁四地中,一定没有发生大规模群体感染的有( )
A.甲地 B.乙地 C.丙地 D.丁地
【答案】AD
【分析】
假设最多一天疑似病例超过7人,根据极差可判断;
根据平均数可算出10天疑似病例总人数,可判断.
【详解】
解:假设甲地最多一天疑似病例超过7人,甲地中位数为2,说明有一天疑似病例小于2,极差会超过5,甲地每天疑似病例不会超过7,选A.
根据乙、丙两地疑似病例平均数可算出10天疑似病例总人数,可推断最多一天疑似病例可能超过7人,由此不能断定一定没有发生大规模群体感染,不选BC;
假设丁地最多一天疑似病例超过7人,丁地总体平均数为2,说明极差会超过3,丁地每天疑似病例不会超过7,选D.
故选:AD.
9.(2021·湖南长沙一中高一月考)从某小学随机抽取100名学生,将他们的身高(单位:厘米)按照区间,进行分组,得到频率分布直方图(如图),下列说法正确的有()
A.若要从身高在三组内的学生中.用等比例分层抽样的方法选取18人参加一项活动.则从身高在内的学生中应选取3人;
B.估计这100名学生的平均身高是厘米)
C.估计这100名学生的第80百分位数为厘米)
D.估计这100名学生的众数是厘米)
【答案】ACD
【分析】
首先求得的值,然后利用比例关系可求得身高在内的学生中应选取的人数,由平均数公式可求得平均身高,由直方图可求得第80百分位数和众数.
【详解】
由题意可得:,解得:,
则身高在三组内的学生的比例关系为:,
故从身高在内的学生中应选取人,选项A正确;
估计这100名学生的平均身高是:厘米),选项B错误;
由于,
故设这100名学生的第80百分位数为厘米,则:
,解得:,
即这100名学生的第80百分位数为厘米),选项C正确;
由频率分布直方图可估计这100名学生的众数是厘米),选项D正确.
故选:ACD.
10.(2021·海南华侨中学高一期末)若一组数据:的平均值为2,方差为3,则关于数据说法正确的是( )
A.平均值为-2 B.方差为6 C.平均值为4 D.方差为12
【答案】AD
【分析】
利用平均数、方差的概念进行求解即可.
【详解】
的平均值为2,方差为3,
即,
则
,故A正确;
故D正确,
故选:AD.
11.(2021·重庆西南大学附中高一期末)在一次测验中共有500名同学参赛,经过评判,这500名考生的得分都在之间,其得分的频率分布直方图如图,则下列结论正确的是( )
A.可求得
B.这500名参赛者得分的平均数为65
C.得分在之间的频率为
D.得分在之间的共有200人
【答案】ACD
【分析】
首先根据频率和为可求得的值,进而可求其它量,逐项分析即可得解.
【详解】
根据评率分布直方图可得,A正确;
平均数,B错误;
得分在之间的频率为,C正确;
得分在之间的共有,D正确;
故选:ACD
12.(2021·广东高二期中)下列说法正确的是( )
A.对于独立性检验,随机变量的观测值值越小,判定“两变量有关系”犯错误的概率越小
B.在回归分析中,相关指数越大,说明回归模型拟合的效果越好
C.随机变量,若,,则
D.甲、乙、丙、丁个人到个景点旅游,每人只去一个景点且每个景点都有人去,设事件为“个人去的景点各不相同”,事件为“甲不去其中的景点”,则
【答案】BD
【分析】
利用独立性检验可判断A选项;利用相关指数与回归模型的拟合效果可判断B选项;利用二项分布的期望和方差公式可判断C选项;利用分步计数原理结合古典概型的概率公式可判断D选项.
【详解】
对于A选项,对于独立性检验,随机变量的观测值值越小,判定“两变量有关系”犯错误的概率越大,A选项错误;
对于B选项,在回归分析中,相关指数越大,说明回归模型拟合的效果越好,B选项正确;
对于C选项,随机变量,则,解得,C选项错误;
对于D选项,利用分步计数原理结合古典概型的概率公式可得,D选项正确.
故选:BD.
13.(2021·辽宁大连二十四中高二期中)针对当下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”做了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有的把握认为是否喜欢抖音和性别有关,则调查人数中男生有可能( )
附:
A. B. C. D.
【答案】BC
【分析】
先设男生人数为,,列出列联表,利用独立性检验计算观测值,再结合观测值列关系即得答案.
【详解】
解:由题意被调查的男女生人数相同,设男生的人数为:,,由题意可列出列联表:
男生
女生
合计
喜欢锻炼
不喜欢锻炼
合计
.
由于有的把握认为是否喜欢抖音和性别有关,
所以;
解得:,因为,
故的可能取值为:9、10、11、12、13,即男生的人数可以是45,50,55,60,65.
则选项中被调查学生中男生的人数可能45或60.
故选:BC.
14.(2021·镇江崇实女子中学高二期中)关于变量x,y的n个样本点及其线性回归方程,下列说法正确的有( )
A.相关系数r的绝对值越接近0,表示x,y的线性相关程度越强
B.相关系数r的绝对值越接近1,表示x,y的线性相关程度越强
C.残差平方和越大,表示线性回归方程拟合效果越好
D.若,则点一定在线性回归方程上
【答案】BD
【分析】
根据相关系数绝对值大小,判断向量相关性强弱,可判定选项A,B;根据残差分析,判断线性回归方程的拟合效果,可判定选项C;根据样本中心点与线性回归直线的关系,即可判定选项D.
【详解】
当相关系数r的绝对值越接近1,表示x,y的线性相关程度越强,
选项A错误,选项B正确;
残差平方和越小,表示线性回归方程拟合效果越好,选项C错误;
样本中心点一定在线性回归直线上,选项D正确.
故选:BD.
15.(2021·河南高二期中(文))某校为了解学生对餐厅食品质量的态度(满意或不满意),对在餐厅就餐的学生随机做了一次调查,其中被调查的男、女生人数相同,有的男生态度是“不满意”,有的女生态度是“不满意”,若有99%的把握认为男生和女生对餐厅食品质量的态度有差异,则调查的总人数可能为( )
,其中.
临界值表:
()
0.100
0.050
0.010
0.001
2.706
3.841
6.635
10.828
A.120 B.160 C.240 D.360
【答案】C
【分析】
设总人数为,写出列联表,利用公式计算的值,由题意应当在0.01和0.001的临界值之间,解不等式得到的取值范围,从而做出选择.
【详解】
设总人数为,则列联表为:
男
女
合计
满意
不满意
合计
由题意得,
解得,为整数,所以调查的总人数至少为180人,至多为292人,
故选:C.
第II卷(非选择题)
三、填空题
16.(2021·重庆高二期末)某同学对变量进行回归分析时收集了几组观测数据如表所示,
1
2
3
4
但他不小心丟失了一个数据(用代替),在数据丢失之前该同学根据散点图判断出与线性相关,并计算出线性回归方程为,则的值为___________.
【答案】
【分析】
求出,利用样本点中心的性质得出的值.
【详解】
因为,所以
故答案为:
17.(2021·焦作市第一中学高一期末)某单位年龄(单位:岁)在的员工有40人,年龄在的员工有60人,年龄在的员工有20人.现准备用分层抽样的方法从这些员工中选拔18人代表单位参加技术比武活动,则选拔出的员工中,年龄小于50岁的员工人数为______.
【答案】15
【分析】
利用分层抽样的性质直接求解.
【详解】
解:总人数为:人,
年龄小于50岁的员工人数为:人,
则用分层抽样的方法从这些员工中选拔18人代表单位参加技术比武活动,则选拔出的员工中,年龄小于50岁的员工人数为人.
故答案为:15.
18.(2021·哈尔滨工业大学附属中学校高一期末)某学校为了调查高一年级学生的体育锻炼情况,从甲、乙、丙3个班中,按分层随机抽样的方法获得了部分学生一周的锻炼时间(单位:),数据如下,
甲
6
6.5
7
7.5
8
乙
6
7
8
9
10
11
12
丙
3
4.5
6
7.5
9
10.5
12
13.5
估计这个学校高一年级学生一周的平均锻炼时间___________
【答案】
【分析】
利用甲,乙,丙的平均数计算总体平均数.
【详解】
样本中甲、乙、丙三个班级的平均锻炼时间分别为
,
则样本平均数为.
估计该校高一年级学生一周的平均锻炼时间为8.2h.
故答案为:
19.(2021·重庆江北区·字水中学高二期末)某工厂为研究某种产品的产量(吨)与所需某种原材料的质量(吨)的相关性,在生产过程中收集4组对应数据,如下表所示.(残差=观测值-预测值)
3
4
5
6
2.5
3
4
根据表中数据,得出关于的经验回归方程为.据此计算出在样本处的残差为,则表中的值为______.
【答案】
【分析】
首先由已知条件求出的值,再由回归直线过样本中心点即可求解.
【详解】
因为样本处的残差为,即,
所以,
所以回归方程为:,
因为,,
因为样本中心点在回归直线上,所以,
解得:,
故答案为:.
20.(2021·河南高二期中(文))某企业计划通过广告宣传来提高销售额,经统计,产品的广告费(单位:百万元)与销售额(单位:百万元)之间有如下对应数据:
0
1
2
3
4
14.8
30.4
36.2
39.6
51
由表中的数据得线性回归方程为.投入的广告费时,销售额的预报值为______百万元.
【答案】66.4
【分析】
先求平均值,再代入线性回归方程得,最后利用线性回归方程估计结果.
【详解】
因为;
所以,∴
因此时,
故答案为:66.4
21.(2021·天津西青区·高二期末)对两个变量x,y进行回归分析.
①残差的平方和越小,模型的拟合效果越好;
②相关系数的绝对值接近于0,两个随机变量的线性相关性越强;
③在经验回归方程中,当解释变量x每增加1个单位时,相应变量平均增加个单位;
④某人研究儿子身高与父亲身高的关系,得到经验回归方程,当时,,即:如果一个父亲的身高为,则儿子的升高一定为.
则以上结论中正确的序号为__________.
【答案】①③
【分析】
根据残差和相关系数的意义判定①②;根据线性回归方程的意义判定③④.
【详解】
根据残差的定义,可知①正确;相关系数绝对值越接近于1,线性相关性越强,故②错误;
由回归方程的意义,根据回归方程的解释变量的系数为0.3, 变量平均增加个单位,
故③正确;
回归方程是表示一种统计规律,具有随机的不确定性,不能说一定是,故④错误;
故答案为:①③.
22.(【新教材精创】8.2一元线性回归模型及其应用-A基础练)某公交公司推出扫码支付乘车优惠活动,活动为期两周,活动的前五天数据如下表:
第天
1
2
3
4
5
使用人数()
15
173
457
842
1333
由表中数据可得y关于x的回归方程为,则据此回归模型相应于点(2,173)的残差为________.
【答案】
【分析】
先计算样本中心点坐标,可得回归方程,计算出的值,然后求出估计值,最后计算残差即可.
【详解】
令,则,
由题意可得,,
,
则样本中心为,
故经过点,
所以,解得,
则,
当时,,
所以残差为.
故答案为:.
四、双空题
23.(2021·上海市实验学校高二期末)如果数据、、、的平均值为10,方差为3,则、、、的平均值为______,方差为______.
【答案】35 27
【分析】
根据平均数的计算公式与方差的计算公式即可求解.
【详解】
解:因为,,,的平均值为10,
所以、、、的平均值,
其方差为.
故答案为:35;27.
24.(2021·绥化市第二中学高一期末)数据的平均数为2,方差为3,则数据的平均数为__________;方差为__________.
【答案】5 12
【分析】
根据两类数据的线性关系可得它们的均值关系和方差关系.
【详解】
因为数据的平均数为2,方差为3,
故数据的平均数为,方差为,
故答案为:.
25.(2021·湖北高二学业考试)某校足球俱乐部有男运动员60人,女运动员40人,为了了解运动员的身体素质,用分层抽样的方法从全体运动员中抽取一个容量为30的样本,则应抽取的(1)男运动员人数为_______;(2)女运动员人数为_______.
【答案】
【分析】
先由已知计算出抽样比,进而可得答案.
【详解】
解:足球俱乐部有男运动员60人,女运动员40人,用分层抽样的方法从全体运动员中抽取一个容量为30的样本,则抽样比为,
故抽取的男运动员人数人,抽取的女运动员人数人,
故答案为:;
26.(9.2.1总体取值规律的估计(分层练习)-2020-2021学年高一数学新教材配套练习(人教A版2019必修第二册))一个容量为n的样本,分成若干组,已知甲组的频数和频率分别为36和,则容量n=____,频率为的乙组的频数x=____.
【答案】144 24
【分析】
利用频率公式求解.
【详解】
由题意得,
所以,
同理,
解得.
故答案为:144,24
27.(2021·天津高二期末)生活经验告诉我们,儿子的身高与父亲的身高具有较强的正相关性,某体育老师调查了大学三年级某班所有男生的身高和父亲的身高(单位:),利用最小二乘法计算出,,则儿子的身高y与父亲的身高的线性回归方程是___________,据此估计其它班级,如果父亲的身高增加10,儿子的身高平均增加___________.
【答案】
【分析】
(1)根据即可得出答案;
(2)即为增加量,将x=10代入即可解得.
【详解】
(1)由题意;
(2)若父亲身高增加10厘米时,孩子身高增加厘米.
故答案为:①,②8.4.
28.(2021·天津高一期末)某市供电部门为了解节能减排以来本市居民的用电量情况,通过抽样,获得了1000户居民月平均用电量(单位:度),将数据按照[50,100),[100,150),…,[300,350]分成六组,制成了如图所示的频率分布直方图.则频率分布直方图中的值为___________;根据频率分布直方图近似估计抽取的这1000户居民月用电量的中位数为___________.(精确到0.1)
【答案】0.0044 183.3
【分析】
由频率和为1可求出图中的值,由于前2组的频率和为,前3组的频率和为,所以可判断中位数在第3 组,设中位数为,则,从而可求出中位数
【详解】
解:由频率分布直方图可得
,
解得,
由于前2组的频率和为,前3 组的频率和为,所以可知中位数在第3组,设中位数为,则,解得,
故答案为:,
29.(2021·北京高二期末)判断对错,并在相应横线处划“√”或“×”.①样本相关系数时,称成对数据正相关,时,称成对数据负相关___________.②样本相关系数的绝对值越接近于1,线性相关程度越弱,越接近于0,线性相关程度越强___________.
【答案】√ ×
【分析】
根据样本相关系数的意义及性质即可判断作答.
【详解】
由成对数据正负相关与相关系数的对应关系知,①正确,在横线处划“√”;
因样本相关系数的绝对值越接近于1,线性相关程度越强,越接近于0,线性相关程度越弱,则②不正确,在横线处划“×”.
故答案为:√;×
30.(2021·江苏高三专题练习)我国探月工程嫦娥五号探测器于2020年12月1日23时11分降落在月球表面预选着陆区,在顺利完成月面自动采样之后,成功将携带样品的上升器送入到预定环月轨道,这是我国首次实现月球无人采样和地外天体起飞,对我国航天事业具有重大而深远的影响,为进一步培养中学生对航空航天的兴趣爱好,某学校航空航天社团在本校高一年级进行了纳新工作,前五天的报名情况为:第1天3人,第2天6人,第3天10人,第4天13人,第5天18人,通过数据分析已知,报名人数与报名时间具有线性相关关系.已知第天的报名人数为,则关于的线性回归方程为___________,该社团为了解中学生对航空航天的兴趣爱好和性别是否有关系,随机调查了100名学生,并得到如下列联表:
有兴趣
无兴趣
合计
男生
45
5
50
女生
30
20
50
合计
75
25
100
请根据上面的列联表,在概率不超过0.001的条件下认为“中学生对航空航天的兴趣爱好和性别_______(填“有”或”无”)关系
参考公式及数据:回归方程中斜率的最小二乘估计公式为:,;
,其中.
0.10
0.05
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】 有
【分析】
由题意计算、,求出回归系数,写出线性回归方程,利用回归方程求出时的值即可,再由列联表求出,与观测值比较即可;.
【详解】
解:由题意,计算,
,
所以,
,
所以关于的线性回归方程为,
由列联表数据可得
因为,
所以,在犯错误的概率不超过0.001的条件下认为“中学生对航空航天的兴趣爱好和性别有关系”.
故答案为:(1);(2)有
31.(2021·浙江高二课时练习)某学生对其30名亲属的饮食习惯进行了一次调查,依据统计所得数据可得到如下的列联表:
喜欢吃蔬菜
喜欢吃肉类
总计
50岁以下
8
50岁以上
16
2
18
总计
30
根据以上列联表中的数据,可得的观测值__________,__________(填“有”或“没有”)的把握认为其亲属的饮食习惯与年龄有关.
参考公式:,其中.
参考数据:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】10 有
【分析】
根据列联表,求得的值,利用公式,求得的值,结合附表,即可得到结论.
【详解】
由列联表可得,,,,
可得,
所以有的把握认为其亲属的饮食习惯与年龄有关.
故答案为:;有.
32.(2018·北京全国·高二单元测试(理))关于与,有如下数据有如下的两个模型:(1);(2).通过残差分析发现第(1)个线性模型比第(2)个拟合效果好,则________,______(用大于,小于号填空,是相关指数和残差平方和)
2
4
5
6
8
30
40
60
50
70
【答案】
【分析】
直接利用残差的性质以及相关指数的性质求解即可.
【详解】
由相关指数的的性质可得,
越大模型的拟合效果越好,所以,
由残差的性质可得,
残差平方和越小模型的拟合效果越好,
所以,故答案为.
【点睛】
本题主要考查残差的性质以及相关指数的性质,属于中档题. 残差平方和越小越好,带状区域的宽度越窄,说明模型的拟合精度越高,相关指数越大,模型的拟合效果越好.
五、解答题
33.(2021·北京市第十二中学高一期末)某公司为了解用户对其产品的满意程度,采用分层抽样的方法从A,B两个地区共抽取了500名用户,请用户根据满意程度对该公司品评分,该公司将收集到的数据按照,,,分组,绘制成评分频率分布直方图如下:
已知A地区用户约为40000人,B地区用户约为10000人.
(1)求该公司采用分层抽样的方法从A,B两个地区分别抽取的用户人数;
(2)根据频率分布直分图,估计B地区所有用户中,对该产品评分不低于80分的用户的人数;
(3)根据频率分布直方图,估计A地区抽取的400名用户对该公司产品的评分的平均值为,B地区抽取的100名用户对该公司产品的评分的平均值为,以及A,B两个地区抽取的500名用户对该公司产品的评分的平均值为,试比较和的大小.(结论不要求证明)
【答案】(1)地区抽取400户,地区抽取100户;(2)10;(3)当时,,时,,时,.
【分析】
(1)根据分层抽样,样本比等于总体比求得抽取的用户人数;
(2)由频率分布图得出频率后可得所求人数;
(3)根据均值的定义求出,作差比较.
【详解】
(1)设A,B两个地区抽取的用户人数分别为,则,所以,;
(2)由频率分布图知,B地区所有用户中,对该产品评分不低于80分的用户频率为,人数;
(3)由题意,
,
所以当时,,时,,时,.
34.(2021·绥化市第二中学高一期末)某部门计划对某路段进行限速,为调查限速是否合理,对通过该路段的500辆汽车的车速进行检测,将所得数据按分组,绘制成如图所示的频率分布直方图.
(1)求直方图中的值及车速落在的汽车数;
(2)求这500辆汽车车速的平均数、中位数和众数.
【答案】(1),辆; (2)平均数为,中位数为,众数为.
【分析】
(1)由频率分布直方图的性质,列出方程,求得的值,求得车速落在的频率,进而求得汽车数.
(2)根据频率分布直方图的平均数,中位数和众数的定义,即可求解.
【详解】
(1)由频率分布直方图的性质,可得,
解得,
其中车速落在的频率为,
所以该路段500辆汽车中车速落在的汽车数为辆.
(2)根据频率分布直方图的平均数的计算公式,可得这500辆汽车车速的平均数为:
,
由中位数的计算方法,可得中位数为:,
根据众数的定义,可得众数为.
35.(云南省部分名校2020-2021学年高二下学期期末联考数学(文)试题)某重点中学调查了100位学生在市统考中的理科综合分数,以,,,,,,分组的频率分布直方图如图.
将理科综合分数不低于240分的学生称为成绩“优秀”
(1)估计某学生的成绩为“优秀”的概率;
(2)根据已知条件完成下面的2×2列联表,并据此资料判断是否有95%的把握认为成绩“优秀”与性别有关.
成绩“非优秀”
成绩“优秀”
合计
男
女
15
45
合计
附:,.
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1);(2)列联表答案见解析,没有的把握认为成绩“优秀”与性别有关.
【分析】
(1)根据频率分布直方图求出“非优秀”的概率,再利用概率和为1求出“优秀”的概率;(2)先求出优秀的人数,再逐一填其他量,代入公式计算得出结论.
【详解】
解:(1)根据频率分布直方图可得某学生的成绩为“优秀”的概率为.
(2)由频率分布直方图可知,在抽取的100人中,成绩“优秀”的有30人,从而2×2列联表如下:
成绩“非优秀”
成绩“优秀”
合计
男
40
15
55
女
30
15
45
合计
70
30
100
将2×2列联表中的数据代入公式计算,得
因为,
所以没有的把握认为成绩“优秀”与性别有关.
36.(2021·黎川县第一中学高二期末(文))某网站的调查显示,健身操类、跑步类、拉伸运动类等健身项目在大众健康项目中比较火热,但是大多数人对健身科学类的知识相对缺乏,尤其是健身指导方面.现从某健身房随机抽取名会员,其中男生有人,对其平均每天健身的时间进行调查,并根据日均健身时间分为,,,,五组,得到如图所示的男生日均健身时间频数表与女生日均健身时间频率分布直方图.规定日均健身时间不少于分钟的人为“喜欢健身”.
男生日均健身时间频数表:
日均健身时间(分钟)
人数
女生日均健身时间频率分布直方图:
(1)请完成下面的列联表.
喜欢健身
不喜欢健身
总计
男生
女生
总计
根据以上的列联表,能否有的把握认为喜欢健身与性别有关?
(2)现从日均健身时间在的学员中选取人进行表彰,求选取的人中至少有名男生的概率.
附:,其中.
0.05
0.025
0.01
0.005
3.841
5.024
6.635
7.829
【答案】(1)列联表见解析,没有的把握认为喜欢健身与性别有关;(2).
【分析】
(1)根据已知条件可直接得到列联表,由列联表计算得到,由此可得结论;
(2)采用列举法可得基本事件总数和满足题意的基本事件个数,由古典概型概率公式可计算得到结果.
【详解】
(1)由题意可得列联表如下:
喜欢健身
不喜欢健身
总计
男生
女生
总计
,
没有的把握认为喜欢健身与性别有关.
(2)记名女生为,名男生为,
则从人中抽取人的所有可能情况为,,,,,,,,,,共种,
其中人中至少有名男生的情况有种,所求概率.
37.(2021·河南新乡县一中高二期末(文))华为系统是一款面向未来、面向全场景的分布式操作系统,预计该系统将会成为继、系统之后的全球第三大手机操作系统.为了了解手机用户对系统的期待程度,某公司随机在20000人中抽取了100名被调查者,记录他们的期待值,将数据分成,,…,6组,其中期待值不低于60的称为非常期待系统,现整理数据得到如下频率分布直方图.
(1)已知样本中期待值小于15的有4人,试估计总体中期待值在区间[15,30)内的人数;
(2)已知样本中的男生有一半非常期待系统,且样本中非常期待系统的男、女生人数相等.请根据所提供的数据,完成下面的列联表,并判断是否有99%的把握认为是否非常期待系统与性别有关.
非常期待
不非常期待
合计
男
女
合计
100
附:,其中.
【答案】(1);(2)列联表答案见解析,没有99%的把握认为是否非常期待系统与性别有关.
【分析】
(1)利用频率分布直方图的性质直接计算即可;
(2)根据频率分布直方图列联表,计算,并对照临界值表确定是否有关.
【详解】
解:(1)因为样本中期待值不小于30的频率为,
所以样本中期待值小于30的频率为0.1,
所以样本中期待值在区间内的人数为,
故总体中期待值在区间内的人数约为.
(2)因为样本中非常期待系统的人数为,
所以样本中非常期待系统的男生人数为,
所以样本中的男生人数为,女生人数为.
非常期待
不非常期待
合计
男
30
30
60
女
30
10
40
合计
60
40
100
所以没有99%的把握认为是否非常期待系统与性别有关.
38.(2021·安徽黄山市·屯溪一中高二期末(文))黄山市一直践行“节能环保、绿色出行”的基本理念,现越来越多的市民购置新能源电动车替代传统的燃油汽车.如表是近五年我市新能源电动车的年销量与年份的统计表(其中第1年表示2016年,第2年表示2017年,依此类推).
第x年
1
2
3
4
5
年销售量y(万台)
5
8
14
22
31
高二(1)班家委会组织了一次本班家庭购车调查,调查对象与内容近五年购车的20个家庭及购车的类型,得到的部分数据如表列联表.
购置传统燃油汽车
购置新能源电动车
总计
车主为父亲
3
车主为母亲
2
6
总计
20
(1)求新能源电动车的年销售量y关于x的线性相关系数r,并判断y与x是否线性相关?若是,预测2021年新能源电动车的年销售量;若不是,请说明理由;
(2)完成列联表,并判断是否有的把握认为购车车主是否购置新能源电动车与性别有关?
参考公式:,若,可判断y与x线性相关.
,,,其中.
临界值表供参考:
参考数据:
66
450
2.236
2.449
【答案】(1),y与x线性相关;万台;(2)列联表见解析,有的把握认为购车车主是否购置新能源电动车与性别有关.
【分析】
(1)由公式计算出线性相关系数,即可判断是否线性相关;求出线性回归方程后代入即可预测2021年新能源电动车的年销售量;
(2)由题意完成列联表,代入公式求出,与2.706比较即可得解.
【详解】
(1),,
∵,
∴y与x线性相关,
又,.
∴.
∴y关于x的线性回归方程为,
取,可得.
即预测2021年新能源电动车的年销售量是万台;
(2)列联表如下:
购置传统燃油汽车
购置新能源电动车
总计
车主为父亲
11
3
14
车主为母亲
2
4
6
总计
13
7
20
则,∵,
∴有的把握认为购车车主是否购置新能源电动车与性别有关.
39.(2021·江西景德镇一中高二期末(文))为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
性别
是否需要志愿者
男
女
需要
30
50
不需要
270
150
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关.
附:
()
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1);(2)有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关
【分析】
(1)利用表中的数据直接求解即可;
(2)直接用公式求解,然后与临界值表比较可得结论
【详解】
解:(1)被调查的500位老年人中有80位需要志愿者提供帮助,
因此该地区老年人中,需要帮助的老年人的比例的估计值为,
所以该地区老年人中,需要志愿者提供帮助的老年人的比例为.
(2)由题知
所以有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关
40.(2021·四川省成都市玉林中学高二(文))某企业在开展“质量安全周”活动中,某种产品被检测出其中一项质量指标存在问题,该企业对甲、乙两条流水线生产该产品情况进行统计,表1是甲流水线样本的频数分布表,如图是乙流水线样本的频率分布直方图.表1
质量指标数
频数
10
9
18
7
6
(1)某个月内甲、乙两条流水线各生产了3500件和1500件产品,现按照分层抽样的方法,从中抽出100件产品进行检测,问甲、乙两条生产线各抽出多少件产品?
(2)随机从这两条流水线上生产的大量产品中各抽取50件产品作为样本,测出它们的这一项质量指标值.若该项质量指标值落在内,则为合格品,否则为不合格品.根据已知条件完成表2的列联表,并回答能否有85%的把握认为“该企业生产的这种产品的该项质量指标值与甲、乙两条流水线的选择有关”?
表2
甲流水线
乙流水线
合计
合格品
不合格品
合计
附:(其中).
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)70,30;(2)表见解析,没有85%的把握.
【分析】
(1)由分层抽样的性质运算即可得解;
(2)由题干数据分别求出甲、乙合格及不合格的数量,完成列联表,代入公式计算,与2.072比较即可得解.
【详解】
(1)按照分层抽样抽出100件产品中,
甲有件,乙有件;
(2)甲、乙两条生产线各抽出50件产品,
甲流水线生产的不合格产品有16件,合格产品有34件,
∵乙流水线生产的不合格产品的概率为,
∴乙流水线生产的不合格产品有10件,合格产品有40件,
则列联表如下,
甲流水线
乙流水线
合计
合格品
34
40
74
不合格品
16
10
26
合计
50
50
100
,
∴没有85%的把握认为“该企业生产的这种产品的该项质量指标值与甲、乙两条流水线的选择有关”.
41.(2021·重庆一中高二期中)垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化减量化处理.某市为调查产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据,其中和分别表示第个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得.
(1)请用相关系数说明该组数据中与之间的关系可用线性回归模型进行拟合;(当时,认为两变量的线性相关性很强)
(2)求关于的线性回归方程,并用所求回归方程预测该市100万人口的县城年垃圾产生总量约为多少吨?
参考公式:相关系数,对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘法估计分别为.
【答案】(1)因为与的相关系数大于0.75,所以与之间具有较强的线性相关关系,可用线性回归模型进行拟合;(2),1040吨.
【分析】
(1)将所给数据代入相关系数公式计算并与0.75比较即得解;
(2)由最小二乘法计算斜率,进而求出截距可得回归直线方程并进行估计作答.
【详解】
(1)由题意知,相关系数.
因为与的相关系数大于0.75,所以与之间具有较强的线性相关关系,可用线性回归模型进行拟合;
(2)由题意可得,,
,所以,
当时,,
所以该市100万人口的县城年垃圾产生总量约为1040吨.
相关试卷
这是一份(理科)高考数学第一轮复习考点过关检测43__统计与统计案例,共6页。试卷主要包含了单项选择题,多项选择题,填空题,解答题等内容,欢迎下载使用。
这是一份高中数学高考01卷 第九章 统计与统计案例《过关检测卷》-2022年高考一轮数学单元复习(新高考专用)(原卷版),共19页。试卷主要包含了单选题,多选题,填空题,双空题,解答题等内容,欢迎下载使用。
这是一份高中数学高考01卷 第九章 统计与统计案例《过关检测卷》-2022年高考一轮数学单元复习(新高考专用)(解析版),共38页。试卷主要包含了单选题,多选题,填空题,双空题,解答题等内容,欢迎下载使用。