数学(新教材)高二暑假作业之巩固练习8 成对数据的统计分析含答案解析
展开暑假练习08
成对数据的统计分析
一、单选题.
1.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A.若的观测值为,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病
B.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误
C.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病
D.以上三种说法都不正确
2.对四组数据进行统计,获得以下散点图,关于其线性相关系数比较,正确的是( )
A. B.
C. D.
3.某调查者在调查中获知某公司近年来科研费用支出(万元)与公司所获得利润(万元)的统计资料如下表:
序号
科研费用支出
利润
合计
则利润关于科研费用支出的经验回归方程为( )
参考公式:,.
A. B. C. D.
4.某公司年月至月空调销售完成情况如图所示,其中为月份,为销售量,下面四个回归方程类型中,最适合作为销售量和月份的回归方程类型的是( )
A. B. C. D.
5.有两个分类变量X,Y,其列联表如下所示,
a
其中a,均为大于5的整数,若在犯错误的概率不超过的前提下认为X,Y有关,则a的值为( )
A.8 B.9 C.8或9 D.6或8
6.下列有关线性回归分析的六个命题:
①在回归直线方程中,当解释变量x增加1个单位时,预报变量平均减少个单位
②回归直线就是散点图中经过样本数据点最多的那条直线
③当相关性系数时,两个变量正相关
④如果两个变量的相关性越强,则相关性系数r就越接近于1
⑤残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高
⑥甲、乙两个模型的相关指数分别约为和,则模型乙的拟合效果更好
其中真命题的个数为( )
A.1个 B.2个 C.3个 D.4个
7.已知变量y关于x的非线性经验回归方程为,其一组数据如下表所示:
x
1
2
3
4
y
e
若,则预测y的值可能为( )
A. B. C. D.
二、多选题.
8.下列结论正确的是( )
A.函数关系是一种确定性关系
B.相关关系是一种非确定性关系
C.在研究身高与年龄的关系时,散点图中可用横轴表示年龄,纵轴表示身高
D.散点图能准确反映变量间的关系
9.设某大学的女生体重(单位:kg)与身高(单位:cm)具有线性相关关系,根据一组样本数据,用最小二乘法建立的回归直线方程为,则下列结论中正确的是( )
A.与具有正的线性相关关系
B.若该大学女生的平均身高为,则平均体重约为
C.若该大学某女生身高增加,则其体重约增加
D.若该大学某女生身高为,则可断定其体重必为
10.下列说法,其中正确的是( )
A.对于独立性检验,的值越大,说明两事件相关程度越大
B.以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则c,k的值分别是和
C.某中学有高一学生400人,高二学生300人,高三学生200人,学校团委欲用分层抽样的方法抽取18名学生进行问卷调查,则高一学生被抽到的概率最大
D.通过回归直线及回归系数可以精确反映变量的取值和变化趋势
11.为了增强学生的身体素质,提高适应自然环境、克服困难的能力,某校在课外活动中新增了一项登山活动,并对“学生喜欢登山和性别是否有关”做了一次调查,得到如图所示的等高条形统计图,则下列说法中正确的有( )
A.被调查的学生中喜欢登山的男生人数比不喜欢登山的女生人数多
B.被调查的男生中喜欢登山的人数比不喜欢登山的人数多
C.是否有99%的把握认为喜欢登山和性别有关不会受到被调查的男女生人数影响
D.是否有99%的把握认为喜欢登山和性别有关会受到被调查的男女生人数影响
12.在检验A与B是否有关的过程中,根据所得数据算得的值,则下列说法不正确的是( )
A.若,则认为A与B独立,该推断犯错误的概率不超过
B.若,则认为A与B独立,该推断犯错误的概率不超过
C.若,则认为A与B不独立,该推断犯错误的概率不超过
D.若,则认为A与B不独立,该推断犯错误的概率不超过
三、解答题.
13.某社区对居民参加体育活动进行随机调查,参与调查的60岁以下和60岁以上的(含60岁)人数如下表:
60岁以下
60岁以上(含60岁)
男性居民
30
40
女性居民
50
20
(1)判断能否有的把握认为参加体育活动与性别有关;
(2)用分层抽样方法,在60岁以下的居民中抽取8人,再从这8人中随机抽取3人,记抽到的男性居民数为随机变量X,求X的分布列和数学期望.
附:
k
,其中.
14.近期新冠病毒奥密克戎毒株全球蔓延,传染性更强、潜伏期更短、防控难度更大.为落实动态清零政策下的常态化防疫,某高中学校开展了每周的核酸抽检工作:周一至周五,每天中午13:00开始,当天安排450位师生核酸检测,五天时间全员覆盖.
(1)该校教职工有410人,高二学生有620人,高三学生有610人,
①用分层抽样的方法,求高一学生每天抽检人数;
②高一年级共15个班,该年级每天抽检的学生有两种安排方案,方案一:集中来自部分班级;方案二:分散来自所有班级.你认为哪种方案更合理,并给出理由.
(2)学校开展核酸抽检的第一周,周一至周五核酸抽检用时记录如下:
第天
1
2
3
4
5
用时(小时)
①计算变量和的相关系数(精确到),并说明两变量线性相关的强弱;
②根据①中的计算结果,判定变量和是正相关,还是负相关,并给出可能的原因.
参考数据和公式:,相关系数.
15.A,B是河道分布密集、水患严重的西部两邻县,从2015年开始,沿海C市对A县对口整治河道,C市2015年对A县河道整治投入40亿元,以后河道整治投入逐年减少亿元(a是常数,).B县则由当地市级机关下派第一书记,单位承包到镇(乡)河道,实行河长负责,市民承包到河段的责任制,下表是从2015年到2019年,对B县以年为单位的河道整治投入额:
投入年份
2015
2016
2017
2018
2019
年分代号t
1
2
3
4
5
年河道整治投入额y(亿元)
30
24
22
18
16
(1)用最小二乘法求对B县的河道整治投入额y与投入年份代号t的回归方程;
(2)①A,B两县人口分别为58万和42万,请比较对A,B两县从2015年至2020年这6年人均河道整治投入的大小(对B县2020年的河道整治投入取回归方程的估计值).
②统计得出两县2020年河道整治是否达标与人均河道整治投入额分布列联表(人数单位:万人):
未达标
达标
合计
6年的人均河道整治投入不低于3亿元/万人
20
38
58
6年的人均河道整治投入低于3亿元/万人
24
18
42
合计
44
56
100
结合此表,是否有把握认为河道整治达标与对当地市民的河道整治投入有关?
参考公式及数据:,,,.
,.
检验临界值表:
16.随着科技进步,近年来,我国新能源汽车产业迅速发展.以下是中国汽车工业协会2022年2月公布的近六年我国新能源乘用车的年销售量数据:
年份
2016
2017
2018
2019
2020
2021
年份代码x
1
2
3
4
5
6
新能源乘用车年销售量y(万辆)
50
78
126
121
137
352
(1)根据表中数据,求出y关于x的线性回归方程;(结果保留整数)
(2)若用模型拟合y与x的关系,可得回归方程为,经计算该模型和第(1)问中模型的(为相关指数)分别为和,请分别利用这两个模型,求2022年我国新能源乘用车的年销售量的预测值;
(3)你认为(2)中用哪个模型得到的预测值更可靠?请说明理由.
参考数据:设,其中.
144
841
380
528
参考公式:对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计公式分别为,.
答案与解析
一、单选题.
1.【答案】B
【解析】对于A,的观测值时,有的把握认为吸烟与患肺病有关系,不是指“在100个吸烟的人中必有99人患有肺病”,故A错误;
对于B,根据独立性原理知,从统计量中求出有的把握认为吸烟与患肺病有关系,是指有的可能性使得判断出现错误,B正确;
对于C,从独立性检验可知有的把握认为吸烟与患肺病有关系时,不能说某人吸烟,那么他有的可能性患有肺病,C错误,
故选B.
2.【答案】B
【解析】由题中的散点图可以看出,图1和图3是正相关,相关系数大于0,
则,,
图2和图4是负相关,相关系数小于0,则,,
图3和图4的点相对于图1和图2更加集中,所以相关性较强,所以更接近于1,更接近于,
由此可得,故选B.
3.【答案】A
【解析】由表格数据知:,,
,,
所求经验回归方程为,故选A.
4.【答案】B
【解析】对于A,散点显然不符合一次函数的大致图象,A错误;
对于B,散点的增长幅度符合二次函数的图象特征,B正确;
对于C,以和月份为例,,,无法有一个固定的常数,使得对应的值与散点对应的值相符,即散点图不符合指数函数模型,C错误;
对于D,散点的增长幅度不符合对数函数的大致图象,D错误,
故选B.
5.【答案】C
【解析】因为且,,所以或7或8或9,
根据公式,得,
即,
当时,;
当时,;
当时,;
当时,,
即当或9时满足题意,故选C.
6.【答案】B
【解析】对于①,根据回归系数的含义,可得回归直线方程中,当解释变量x增加1个单位时,预报变量平均减少个单位,故①正确;
对于②,回归直线就是散点图中经过样本数据点最多的那条直线,不正确.回归直线也可能不过任何一个点;故②不正确;
对于③,当相关性系数时,两个变量正相关,故③正确;
对于④,如果两个变量的相关性越强,则相关性系数的绝对值就越接近于,故④不正确;
对于⑤,残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越低,故⑤不正确;
对于⑥,甲、乙两个模型的分别约为和,则模型甲的拟合效果更好,故⑥不正确,
则正确的个数为2,故选B.
7.【答案】C
【解析】由题意,将两边同时取对数,得,
设,则
1
2
3
4
1
3
4
5
,,
由,得,解得,
所以,
所以当时,,故选C.
二、多选题.
8.【答案】ABC
【解析】对于A:因为函数关系是确定关系,所以A正确;
对于B:因为相关关系是非确定性关系,所以B正确;
对于C:两个变量转换成数据后,一个对应点的横坐标,一个对应点的纵坐标,所以C正确;
对于D:散点图只能大致反映变量间的关系,所以D错误,
故选ABC.
9.【答案】ABC
【解析】根据与的线性回归方程为,其中,说明与具有正的线性相关关系,A正确;
回归直线过样本点的中心,由,B正确;
由回归方程知,若该大学某女生身高增加,则其体重约增加,故C正确;
若该大学某女生身高为,则可预测其体重约为,不可断定其体重必为,D错误,
故选ABC.
10.【答案】AB
【解析】由独立性检验得A说法是正确的;
B中模型两边取对数得,
由线性方程得,知c,k的值分别是,,
故B说法正确;
根据简单随机抽样,每个个体被抽到的概率相同,故C错误;
回归直线及回归系数是预测变量的取值和变化趋势,并不是精确反映,故D错误,
故选AB.
11.【答案】BD
【解析】因为不知道被调查的学生中,男生与女生的人数,所以不能确定喜欢登山的男生人数比不喜欢登山的女生人数多,因此选项A不正确;
由统计图中可以确定被调查的男生中喜欢登山的人数的百分比为,所以被调查的男生中喜欢登山的人数比不喜欢登山的人数多,因此选项B正确;
因为不知道被调查的学生中,男生与女生的人数,所以不能由卡方公式进行计算判断,所以选项C不正确,选项D正确,
故选BD.
12.【答案】ABC
【解析】当时,我们认为A与B不独立,该推断犯错误的概率不超过,只有D说法正确,
故选ABC.
三、解答题.
13.【答案】(1)有的把握认为;(2)分布列见解析,期望为.
【解析】(1)由题意可得,
故有把握认为参加体育活动与性别有关.
(2)以下居民共人,其中男性人,女性人,
用分层抽样的方法从中抽人,则男性有人,女性有人,
从这位男性和位女性中随机抽取3人,抽到的男性居民数可能有,,,,
故X的所有可能取值为,,,,
,,
,,
的分布列如下:
.
14.【答案】(1)①人;②方案二,理由见解析;(2)①,线性相关性很强;②负相关,理由见解析.
【解析】(1)解:①高一学生每天抽检人数为(人).
②方案二更合理,因为新冠病毒奥密克戎毒株传染性更强、潜伏期更短,分散抽检可以全面检测年级中每班学生的状况,更有利于防控筛查工作.
(2)解:①,,
所以,
,,
变量和的相关系数为,
因为,可知两变量线性相关性很强.
②由可知变量和是负相关,可能的原因:随着抽检工作的开展,学校相关管理协调工作效率提高,因此用时缩短.
15.【答案】(1);(2)①对A县的人均河道整治投入大于对B县的人均河道整治投入;②有的把握.
【解析】(1)由表可知,,,
∵,,∴,
∴,
所以,所求回归方程为.
(2)①由条件可知,对A县的河道整治总投入(亿元),
∴这6年对A县人均河道整治投入为(亿元/万人).
对B县2020年的河道整治投入为(亿元),
∴对B县的河道整治总投入为(亿元),
∴这6年对B县人均河道整治投入为(亿元/万人).
所以,对A县的人均河道整治投入大于对B县的人均河道整治投入.
②由列联表知,,
所以,有的把握认为河道整治达标与当地市民的河道整治投入有关.
16.【答案】(1);(2)当回归方程为时,2022年我国新能源乘用车的年销售量的预测值是万辆;当回归方程为时,2022年我国新能源乘用车的年销售量的预测值是万辆.(3)由于相关指数越接近于,两个变量之间的关系就强,相应的拟合程度也越好,所以模型得到的预测值更可靠.
【解析】(1)由表中数据得,
,,,
,
,,
y关于x的线性回归方程为.
(2)由(1)知,y关于x的线性回归方程为,
当时,2022年我国新能源乘用车的年销售量的预测值(万辆);
对于回归方程,
当时,2022年我国新能源乘用车的年销售量的预测值:
(万辆).
(3)依题意:模型和第(1)问中模型的(为相关指数)分别为和,
由于相关指数越接近于,两个变量之间的关系就强,相应的拟合程度也越好,
所以模型得到的预测值更可靠.
数学(新教材)高二暑假作业之巩固练习5 计数原理(二)含答案解析: 这是一份数学(新教材)高二暑假作业之巩固练习5 计数原理(二)含答案解析,共10页。试卷主要包含了单选题.,多选题.,填空题.,解答题.等内容,欢迎下载使用。
数学(新教材)高二暑假作业之巩固练习2 导数(二)含答案解析: 这是一份数学(新教材)高二暑假作业之巩固练习2 导数(二)含答案解析,共15页。试卷主要包含了单选题.,多选题.,填空题.,解答题.等内容,欢迎下载使用。
数学(新教材)高二暑假作业之巩固练习3 导数(三)含答案解析: 这是一份数学(新教材)高二暑假作业之巩固练习3 导数(三)含答案解析,共14页。试卷主要包含了单选题.,多选题.,填空题.,解答题.等内容,欢迎下载使用。