所属成套资源:2022高考考点训练(选择题,填空题、大题)
- 考点79 绝对值不等式练习题 试卷 3 次下载
- 考点62 双曲线的标准方程-练习题 试卷 2 次下载
- 考点69 用样本估计总体练习题 试卷 1 次下载
- 模块九坐标系与参数方程练习题 试卷 4 次下载
- 模块一 三角函数与解三角形练习题 试卷 1 次下载
模块六回归分析练习题
展开
这是一份模块六回归分析练习题,共23页。试卷主要包含了解答题等内容,欢迎下载使用。
模块六 回归分析
一、解答题
1.在某市创建全国文明城市的过程中,创文专家组对该市的中小学进行了抽检,其中抽检的一个环节是对学校的教师和学生分别进行问卷测评.如表是被抽检到的5所学校、、、、的教师和学生的测评成绩(单位:分):
学校
教师测评成绩
90
92
93
94
96
学生测评成绩
87
89
89
92
93
(1)建立关于的回归方程;
(2)现从、、、、这5所学校中随机选2所派代表参加座谈,求、两所学校至少有1所被选到的概率.
附:,.
2.某厂的生产原料耗费x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应关系:
x
2
4
6
8
y
30
40
50
70
(1)画出(x,y)的散点图;
(2)计算x与y之间的样本相关系数,并刻画它们的相关程度.
3.发展清洁能源,是改善能源结构、保障能源安全、推进生态文明建设的重要任务.十三五以来,我国加快调整能源结构,减少煤炭消费、稳定油气供应、大幅增加清洁能源比重,风电、光伏等可再生能源发电效率不断提高.据资料整理统计我国从2015年到2019年的年光伏发电量如表:
年份
2015
2016
2017
2018
2019
编号x
1
2
3
4
5
年光伏发电量(亿千瓦时)
395
665
1178
1775
2243
其中.
(1)请用相关系数r说明是否可用线性回归模型拟合年光伏发电量y与x的关系;
(2)建立年光伏发电量y关于x的线性回归方程,并预测2021年年光伏发电量(结果保留整数).
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为, ,
4.当前“停车难”已成为城市通病,因停车问题引发的纠纷屡见不鲜,无论在北京、上海等超大型城市,还是其它城市,甚至人口只有几万、十几万的县城和乡镇,“停车难”都给群众生活和政府管理带来了深深的烦恼,由于“停车难”是事关百姓生活质量和切身利益的问题,也是建设和谐社会不容忽视的问题之一,某小区物业公司决定动手解决小区“停车难”问题,并统计了近六年小区私家车的数量,以编号1对应2015年,编号2对应2016年,编号3对应2017年,以此类推,得到相应数据如下:
年份编号
1
2
3
4
5
6
数量(辆)
41
96
116
190
218
275
(1)若该小区私家车的数量与年份编号的关系可用线性回归模型来拟合,试用相关指数分析其拟合效果(精确到);
(2)由于车辆增加,原有停车位已经不能满足有车业主的需求,因此物业公司欲在小区内对原有停车位进行改造,重新规划停车位.若要求在2021年小区停车位数量仍可满足需要,求至少需要规划多少个停车位.
参考数据:,,,.
附:回归方程中斜率和截距的最小二乘法估计公式分别为:,;
相关指数,残差.
5.如图是某小区2020年1月至2021年1月当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码1~13分别对应2020年1月~2021年1月).根据散点图选择和两个模型进行拟合,经过数据处理得到两个回归方程分别为和,并得到以下一些统计量的值:
残差平方和
总偏差平方和
(1)请利用相关指数判断哪个模型的拟合效果更好;
(2)估计该小区2021年6月份的二手房均价.(精确到万元/平方米)
参考数据:,,,,,,,.
参考公式:相关指数.
6.2021年6月17日9时22分,我国酒泉卫星发射中心用长征遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益y(亿元)的数据统计如下:
序号
1
2
3
4
5
6
7
8
9
10
11
12
x
2
3
4
6
8
10
13
21
22
23
24
25
y
15
22
27
40
48
54
60
68.5
68
67.5
66
65
当时,建立了y与x的两个回归模型:模型①:,模型②:;当时,确定y与x满足的线性回归方程为.
(1)根据下列表格中的数据,比较当时模型①,②的相关指数的大小,并选择拟合精度更高、更可靠的模型,预测对A型材料进行应用改造的投入为17亿元时的直接收益;
回归模型
模型①
模型②
回归方程
79.13
20.2
(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.
附:刻画回归效果的相关指数,且当越大时,回归方程的拟合效果越好..
用最小二乘法求线性回归方程的截距:.
7.某电视厂家准备在“五一”举行促销活动,现在根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(单位:万元)和销售量y(单位:万台)的数据如下:
年份
2014
2015
2016
2017
2018
2019
2020
广告费支出x
1
2
4
6
11
13
19
销售量y
1.9
3.2
4.0
4.4
5.2
5.3
5.4
(1)若用线性回归模型拟合y与x的关系,求出y关于x的回归方程.
(2)若用模型拟合y与x的关系,可得回归方程,经计算线性回归模型和该模型的分别约为0.75和0.88,请用说明选择哪个回归模型更好.
(3)已知利润z(单位:万元)与x,y的关系为.根据(2)的结果回答:当广告费时,销售量及利润的预测值是多少?(精确到0.01)
参考数据:.
参考公式:线性回归方程中的斜率和截距的最小二乘估计公式分别为.
8.某大型现代化农场在种植某种大棚有机无公害的蔬菜时,为创造更大价值,提高亩产量,积极开展技术创新活动.该农场采用了延长光照时间的方案,该农场选取了20间大棚(每间一亩)进行试点,得到各间大棚产量数据绘制成散点图.光照时长为(单位:小时),大棚蔬菜产量为(单位:千斤每亩),记.
(1)根据散点图判断,与,哪一个适宜作为大棚蔬菜产量关于光照时长的回归方程类型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中数据,建立关于的回归方程;(结果保留小数点后两位)
(3)根据实际种植情况,发现上述回归方程在光照时长位于6~14小时内拟合程度良好,利用(2)中所求方程估计当光照时长为小时(自然对数的底),大棚蔬菜亩产约为多少.
参数数据:
290
102.4
52
4870
540.28
137
1578.2
272.1
参考公式:关于的线性回归方程中,,
9.我国在芯片领域的短板有光刻机和光刻胶,某风投公司准备投资芯片领域.若投资光刻机项目,据预期,每年的收益率为的概率为p,收益率为的概率为;若投资光刻胶项目,据预期,每年的收益率为的概率为,收益率为的概率为,收益率为零的概率为0.5.
(1)已知投资以上两个项目,获利的期望是一样的,请你为该风投公司选择一个合理的项目,并说明理由;
(2)若该风投公司准备对以上你认为比较合理的的项目进行投资,4年累计投资数据如下表:
年份x
2016
2017
2018
2019
1
2
3
4
累计投资金额y(单位:亿元)
2
3
5
6
请根据上表提供的数据,用最小二乘法求出y关于的线性回归方程,并预测到哪一年年末,该公司在芯片领域的投资收益预期能达到0.75亿元.
附:收益收入的资金获利期望;线性回归方程中,,.
10.在一次抽样调查中测得个样本点,得到下表及散点图.
(1)根据散点图判断与哪一个适宜作为关于的回归方程;(给出判断即可,不必说明理由)
(2)根据(1)的判断结果试建立与的回归方程;(计算结果保留整数)
(3)在(2)的条件下,设且,试求的最小值.
参考公式:回归方程中,,.
11.某校从高二年级随机抽取了20名学生的数学总评成绩和物理总评成绩,记第i位学生的成绩为() (i=1,2,3...20),其中分别为第i位学生的数学总评成绩和物理总评成绩.抽取的数据列表如下( 按数学成绩降序整理):
序号
1
2
3
4
5
6
7
8
9
10
数学总评成绩x
95
92
91
90
89
88
88
87
86
85
物理总评成绩y
96
90
89
87
92
81
86
88
83
84
序号
11
12
13
14
15
16
17
18
19
20
数学总评成绩x
83
82
81
80
80
79
78
77
75
74
物理总评成绩
81
80
82
85
80
78
79
81
80
78
(1)根据统计学知识,当相关系数|r|≥0.8时,可视为两个变量之间高度相关.根据抽取的数据,能否说明数学总评成绩与物理总评成绩高度相关?请通过计算加以说明.
参考数据:
参考公式:相关系数
(2)规定:总评成绩大于等于85分者为优秀,小于85分者为不优秀,对优秀赋分1,对不优秀赋分0,从这20名学生中随机抽取2名学生,若用X表示这2名学生两科赋分的和,求X的分布列和数学期望.
12.某项科研活动共进行了5次试验,其数据如下表所示:
特征量
第1次
第2次
第3次
第4次
第5次
x
2
5
8
9
11
y
12
10
8
8
7
(1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模型拟合y与x的关系?并指出是正相关还是负相关;
(2)求特征量y关于x的回归方程,并预测当特征量x为12时特征量y的值.
附:参考公式:相关系数,,.参考数据:.
13.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=,≈1.414.
14.下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
(Ⅰ)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(Ⅱ)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
参考数据:,,
,≈2.646.
参考公式:相关系数
回归方程中斜率和截距的最小二乘估计公式分别为:
15.为了监控某种零件的一条生产线的生产过程,检验员每隔从该生产线上随机抽取一个零件,并测量其尺寸(单位:).下面是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序
1
2
3
4
5
6
7
8
零件尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次序
9
10
11
12
13
14
15
16
零件尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得,,
,其中为抽取的第个零件的尺寸,.
(1)求的相关系数,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(ⅱ)在之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到)附:样本的相关系数
,.
参考答案
1.(1)(2)
【分析】
(1)由题求出,,再求得,,代入求得回归方程为;
(2)由题从、、、、这5所学校中随机选2所,共10种,、两所学校至少有1所被选到有7种,求得概率即可.
【详解】
解:(1)依据题意计算得:
,
,
,
,
,
.
∴所求回归方程为.
(2)从、、、、这5所学校中随机选2所,具体情况为:
,,,,,,,,,,一共有10种.
、两所学校至少有1所被选到的为:
,,,,,,,一共有7种.
它们都是等可能发生的,所以、两所学校至少有1所被选到的概率.
【点睛】
本题考查了线性回归方程和概率的综合,计算仔细是解题的关键,属于基础题.
2.(1)图象见解析;(2)样本相关系数r≈0.9827;正线性相关,且相关程度很高.
【分析】
(1)根据表中数据在直角坐标系中描点即可;
(2)根据公式计算出相关系数,即可刻画它们的相关程度.
【详解】
解:(1)画出(x,y)的散点图如图所示.
(2)=5,=47.5,
=120,=9 900,=1080,
故样本相关系数
.
由样本相关系数r≈0.9827,可以推断生产原料耗费与销售额这两个变量正线性相关,且相关程度很高.
3.(1)可用线性回归模型进行拟合;(2)回归方程为,亿千瓦时
【分析】
(1)首先求出,再根据所给数据求出相关系数,即可判断;
(2)利用公式求出,,即可得出结论.
【详解】
解:(1)因为,
所以相关系数
所以与之间具有较强的线性相关关系,可用线性回归模型进行拟合;
(2)
所以
所以回归方程为,
因为2021年所对应的年份编号为,
当时,
故预计2021年年光伏发电量为亿千瓦时;
4.(1)答案见解析;(2)317个.
【分析】
(1)由已知数据求得与,则可求得线性回归方程,再求出残差平方和,代入相关指数公式求得,根据与1的接近程度可分析其拟合效果;
(2)根据(1)中的回归直线方程,取求得的值即可.
【详解】
(1)由题意得,,
∴,
且,
所以关于的线性回归方程为;
又时,;时,;时,;
时,;时,;时,;
故,,
由相关指数近似为,接近1,说明拟合效果较好.
(2)在(1)中求得的线性回归方程中,取,可得.
故若要求在2021年小区停车位数量仍可满足需要,则至少需要规划317个停车位.
5.(1)模型;(2)(万元/平方米).
【分析】
(1)计算出相关指数后可判断哪一个函数拟合效果好.
(2)根据(1)的中的模型可计算二手房的均价.
【详解】
(1)设模型和的相关指数分别为和,
则,.
因为,所以.
所以模型的拟合效果更好.
(2)由(1)知,模型的拟合效果更好,
利用该模型预测可得,这个小区2021年6月份的在售二手房均价为:
(万元/平方米).
6.(1)模型②拟合精度更高、更可靠,亿;(2)投入17亿元比投入20亿元时收益小.
【分析】
(1)根据公式计算相关指数,再根据大小选择合适的模型,根据所得模型可求直接受益.
(2)根据(1)中的公式结合利润计算方法可求公司收益,从而可得两者的大小关系.
【详解】
(1)对于模型①,
对应的,
故对应的,
故对应的相关指数,
对于模型②,同理对应的相关指数,
故模型②拟合精度更高、更可靠.
故对A型材料进行应用改造的投入为17亿元时的直接收益为.
(2)当时,
后五组的,,
由最小二乘法可得,
故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:
,
故投入17亿元比投入20亿元时收益小.
7.(1);(2)答案见解析;(3)销售量的预测值(万台),利润的预测值(万元).
【分析】
(1)根据回归直线方程计算公式,计算出回归直线方程.
(2)通过比较来说更好.
(3)先求得销售量y的预测值,然后求得利润的预测值.
【详解】
(1)由题意得,,,,
,
,
∴y关于x的经验回归方程为.
(2)因为越接近于1,模型的拟合效果越好,所以选用回归模型更好.
(3)当广告费时,销售量y的预测值(万台),
故利润z的预测值(万元).
8.(1)更适宜作为回归方程类型;(2);(3)千斤每亩.
【分析】
(1)根据散点图中点的位置判断;
(2)记.则为,由已知数据计算方程中的系数,即可得;
(3)在(2)的方程中令代入计算可得.
【详解】
(1)根据散点图,开始的点在某条直线旁,但后面的点会越来越偏离这条直线,因此更适宜作为回归方程类型;
(2)记.则为,
,,
,,
所以,即.
(3)时,.
【点睛】
关键点点睛:本题考查线性回归直线方程,解题关键是根据已知数据计算出回归直线方程中系数.考查了运算求解能力.求解时,注意题目提供的数据,公式,特别是计算公式不能把数据弄混,否则会得出错误结果.
9.(1)建议该风投公司投资光刻胶项目,理由见解析;(2),2020年年末.
【分析】
(1)设投资光刻机项目和光刻胶项目的年收益分别为和,分别列出和的分布列,计算出数学期望,使期望值相等求解出的值;
(2)根据题目所给公式先计算回归系数和,写出回归直线方程,列出收益的表达式,使收益大于或等于亿万,求解的取值范围
【详解】
解:(1)若投资光刻机项目,设收益率为,则的分布列
P
所以.
若投资光刻胶项目,设收益率为,则的分布列为
P
所以.
因为投资以上两个项目,获利的期望是一样的,
所以,所以.
因为,
,
所以,,
这说明虽然光刻机项目和光刻胶项目获利相等,但光刻胶项目更稳妥.
综上所述,建议该风投公司投资光刻胶项目.
(2)根据表格中的数据可得:,,
则,,
所以,,
故线性回归方程为.
设该公司在芯片领域的投资收益为Y,则,
解得,故在年年末该投资公司在芯片领域的投资收益可以超过亿元.
【点睛】
本题考查离散型随机变量的分布列及数学期望,考查线性回归直线方程的求解及应用,解答的主要思路如下:
(1)求解离散型随机变量分分布列及数学期望时,要先理解随机变量的含义及所有可能取值,然后计算出的取每一个值时的概率,列出分布列,然后利用求解期望;
(2)计算线性回归直线方程时,只需要按照题目所给公式计算出回归系数和,得出回归方程,然后通过回归直线方程进行后续的估计求值.
10.(1);(2);(3).
【分析】
(1)根据散点图的分布情况可得出结论;
(2)作变换,将数据代入最小二乘法公式,可求得和的值,进而可得出与的回归方程;
(3)求得,利用函数的单调性可求得的最小值.
【详解】
(1)由题中散点图可以判断,适宜作为关于的回归方程;
(2)令,则,原数据变为
由表可知与近似具有线性相关关系,计算得,
,
,
所以,,则.
所以关于的回归方程是.
(3)由(2)得,,
任取、,且,即,
可得,
因为,则,,所以,,
所以,函数在区间上单调递增,则.
【点睛】
关键点点睛:对于非线性回归方程的求解,一般要结合题意作变换,转化为线性回归方程来求解,同时也要注意相应数据的变化.
11.(1)“数学学期综合成绩”与“物理学期综合成绩”高度相关;答案见解析;(2)分布列见解析,.
【分析】
(1)代入公式计算,解得即可得解;
(2)由超几何分布概率公式计算出、、、、,进而可得分布列,再由数学期望的公式即可得数学期望.
【详解】
(1)由题意,
,
所以“数学学期综合成绩”与“物理学期综合成绩”高度相关;
(2) 由题意得:的可能取值为0,1,2,3,4.,
根据赋分规则可知,7人赋分为2,4人赋分为1,9个人赋分为0,
所以,,,,,
所以的分布列为:
0
1
2
3
4
所以.
【点睛】
关键点点睛:解决本题的关键是对的值合理放缩及超几何分布的应用.
12.(1)可以用线性回归方程模型拟合y与x的关系,其关系为负相关;
(2),预测.
【分析】
(1)根据表格中的数据,分别求得,结合公式,求得的值,即可得到结论;
(2)由(1)知,根据公式求得,进而求得,得出回归直线的方程,代入,即可得到预测值.
【详解】
(1)由题意,可得,,
,
,,因而相关系数.
由于很接近1,
说明x,y线性相关性很强,因而可以用线性回归方程模型拟合y与x的关系.
由于,故其关系为负相关.
(2)由(1)知,,
则,
则所求的回归方程是,
当时,可预测特征量.
【点睛】
求解回归直线方程的基本步骤:
(1)依据一般数据画出散点图,确定两个变量具有线性相关关系;
(2)计算的值;
(3)计算回归系数;
(4)写出回归直线方程.
13.(1);(2);(3)详见解析
【分析】
(1)利用野生动物数量的估计值等于样区野生动物平均数乘以地块数,代入数据即可;
(2)利用公式计算即可;
(3)各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样.
【详解】
(1)样区野生动物平均数为,
地块数为200,该地区这种野生动物的估计值为
(2)样本(i=1,2,…,20)的相关系数为
(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,
由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,
采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,
从而可以获得该地区这种野生动物数量更准确的估计.
【点晴】
本题主要考查平均数的估计值、相关系数的计算以及抽样方法的选取,考查学生数学运算能力,是一道容易题.
14.(Ⅰ)答案见解析;(Ⅱ)答案见解析.
【详解】
试题分析:(Ⅰ)根据相关系数的公式求出相关数据后,代入公式即可求得的值,最后根据值的大小回答即可;(Ⅱ)准确求得相关数据,利用最小二乘法建立y关于t的回归方程,然后预测.
试题解析:(Ⅰ)由折线图中数据和附注中参考数据得
,,,
,
.
因为与的相关系数近似为0.99,说明与的线性相关相当高,从而可以用线性回归模型拟合与的关系.
(Ⅱ)由及(Ⅰ)得,
.
所以,关于的回归方程为:.
将2016年对应的代入回归方程得:.
所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.
【考点】线性相关系数与线性回归方程的求法与应用.
【方法点拨】(1)判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;(2)将相关数据代入相关系数公式求出,然后根据的大小进行判断.求线性回归方程时要严格按照公式求解,并一定要注意计算的准确性.
15.(1)可以;(2)(ⅰ)需要;(ⅱ),.
【分析】
(1)依公式求;
(2)(i)由,得抽取的第13个零件的尺寸在以外,因此需对当天的生产过程进行检查;(ii)剔除第13个数据,则均值的估计值为10.02,方差为0.09.
【详解】
(1)由样本数据得的相关系数为
.
由于,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.
(2)(i)由于,
由样本数据可以看出抽取的第13个零件的尺寸在以外,
因此需对当天的生产过程进行检查.
(ii)剔除离群值,即第13个数据,
剩下数据的平均数为,
这条生产线当天生产的零件尺寸的均值的估计值为10.02.
,
剔除第13个数据,剩下数据的样本方差为
,
这条生产线当天生产的零件尺寸的标准差的估计值为.
【点睛】
解答新颖的数学题时,一是通过转化,化“新”为“旧”;二是通过深入分析,多方联想,以“旧”攻“新”;三是创造性地运用数学思想方法,以“新”制“新”,应特别关注创新题型的切入点和生长点.
相关试卷
这是一份统计.板块六.回归分析练习题无答案,共10页。试卷主要包含了随机抽样,简单随机抽样必须具备下列特点,统计假设,统计量,相关系数的性质,转化思想,一些备案等内容,欢迎下载使用。
这是一份模块四空间几何体练习题,共25页。试卷主要包含了解答题等内容,欢迎下载使用。
这是一份模块五平面解析几何-练习题,共21页。试卷主要包含了解答题等内容,欢迎下载使用。