所属成套资源:高考数学大题精做专题特训(原卷版+解析)
高考数学大题精做专题02变量间的相关关系与回归分析(第四篇)(原卷版+解析)
展开
这是一份高考数学大题精做专题02变量间的相关关系与回归分析(第四篇)(原卷版+解析),共39页。
专题02 变量间的相关关系与回归分析
【典例1】【2020届辽宁省实验中学高三上学期期末】足球是世界普及率最高的运动,我国大力发展校园足球.为了解本地区足球特色学校的发展状况,社会调查小组得到如下统计数据:
(1)根据上表数据,计算y与x的相关系数r,并说明y与x的线性相关性强弱.
(已知:,则认为y与x线性相关性很强;,则认为y与x线性相关性一般;,则认为y与x线性相关性较):
(2)求y关于x的线性回归方程,并预测A地区2020年足球特色学校的个数(精确到个).参考公式和数据:,,.
【思路点拨】
(1)根据题意计算出r,再比较即得解;
(2)根据已知求出线性回归方程,再令x=2020即得解.
【典例2】【2018年全国普通高等学校招生统一考试理数(全国卷II)】
下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据2000年至2016年的数据(时间变量的值依次为)建立模型①:;根据2010年至2016年的数据(时间变量的值依次为)建立模型②:.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
【思路引导】
分析:(1)两个回归直线方程中无参数,所以分别求自变量为2018时所对应的函数值,就得结果;(2)根据折线图知2000到2009,与2010到2016是两个有明显区别的直线,且2010到2016的增幅明显高于2000到2009,也高于模型1的增幅,因此所以用模型2更能较好得到2018的预测.
【典例3】【四川省资阳市2019-2020学年高三上学期第二次诊断考试】
已知某地区某种昆虫产卵数和温度有关.现收集了一只该品种昆虫的产卵数(个)和温度()的7组观测数据,其散点图如所示:
根据散点图,结合函数知识,可以发现产卵数和温度可用方程来拟合,令,结合样本数据可知与温度可用线性回归方程来拟合.根据收集到的数据,计算得到如下值:
表中,.
(1)求和温度的回归方程(回归系数结果精确到);
(2)求产卵数关于温度的回归方程;若该地区一段时间内的气温在之间(包括与),估计该品种一只昆虫的产卵数的范围.(参考数据:,,,,.)
附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为.
【思路点拨】
(1)根据公式计算出和,可得;
(2)根据可得,再根据函数为增函数可得答案.
【典例4】【2015年全国普通高等学校招生统一考试理科数学】
某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费和年销售量(=1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
表中,=
(Ⅰ)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程;
(Ⅲ)已知这种产品的年利润z与x、y的关系为z=0.2y-x.根据(Ⅱ)的结果回答下列问题:
(ⅰ)年宣传费x=49时,年销售量及年利润的预报值是多少?
(ⅱ)年宣传费x为何值时,年利率的预报值最大?
附:对于一组数据,,……,,其回归线的斜率和截距的最小二乘估计分别为:
【典例5】【河北省唐山市2019届高三上学期期末考试】
近年来,我国工业经济发展迅速,工业增加值连年攀升,某研究机构统计了近十年(从2008年到2017年)的工业增加值(万亿元),如下表:
依据表格数据,得到下面的散点图及一些统计量的值.
(1)根据散点图和表中数据,此研究机构对工业增加值(万亿元)与年份序号的回归方程类型进行了拟合实验,研究人员甲采用函数,其拟合指数;研究人员乙采用函数,其拟合指数;研究人员丙采用线性函数,请计算其拟合指数,并用数据说明哪位研究人员的函数类型拟合效果最好.(注:相关系数与拟合指数满足关系).
(2)根据(1)的判断结果及统计值,建立关于的回归方程(系数精确到0.01);
(3)预测到哪一年的工业增加值能突破30万亿元大关.
附:样本 的相关系数,
,,.
【典例6】【安徽省江淮十校2019届高三年级5月考前最后一卷】
某公司为了预测下月产品销售情况,找出了近7个月的产品销售量(单位:万件)的统计表:
但其中数据污损不清,经查证,,.
(1)请用相关系数说明销售量与月份代码有很强的线性相关关系;
(2)求关于的回归方程(系数精确到0.01);
(3)公司经营期间的广告宣传费(单位:万元)(),每件产品的销售价为10元,预测第8个月的毛利润能否突破15万元,请说明理由.(毛利润等于销售金额减去广告宣传费)
参考公式及数据:,相关系数,当时认为两个变量有很强的线性相关关系,回归方程中斜率和截距的最小二乘估计公式分别为,.
【思路点拨】(1)根据中条件,计算相关系数的值,即可得出结论;
(2)根据题中数据,计算出,即可得到回归方程;
(3)将代入(2)的结果,结合题中条件,即可求出结果.
【针对训练】
1.【2020届河南省名校联盟高三模拟仿真考试数学】
“绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新能源汽车产业的迅速发展.下表是近几年我国某地区新能源乘用车的年销售量与年份的统计表:
某机构调查了该地区30位购车车主的性别与购车种类情况,得到的部分数据如下表所示:
(1)求新能源乘用车的销量关于年份的线性相关系数,并判断与是否线性相关;
(2)请将上述列联表补充完整,并判断是否有的把握认为购车车主是否购置新能源乘用车与性别有关;
(3)若以这30名购车车主中购置新能源乘用车的车主性别比例作为该地区购置新能源乘用车的车主性别比例,从该地区购置新能源乘用车的车主中随机选取50人,记选到女性车主的人数为,求的数学期望与方差.
参考公式:
,,其中.,若,则可判断与线性相交.
6.【2020届广东省东莞市高三期末调研测试】
某农科所对冬季昼夜温差(最高温度与最低温度的差)大小与某反季节大豆新品种一天内发芽数之间的关系进行了分析研究,他们分别记录了12月1日至12月6日每天昼夜最高、最低的温度(如图甲),以及实验室每天每100颗种子中的发芽数情况(如图乙),得到如下资料:
最高温度最低温度
甲
乙
(1)请画出发芽数y与温差x的散点图;
(2)若建立发芽数y与温差x之间的线性回归模型,请用相关系数说明建立模型的合理性;
(3)①求出发芽数y与温差x之间的回归方程(系数精确到0.01);
②若12月7日的昼夜温差为,通过建立的y关于x的回归方程,估计该实验室12月7日当天100颗种子的发芽数.
参考数据:.参考公式:相关系数:(当时,具有较强的相关关系).回归方程中斜率和截距计算公式:.
3.某学生为了测试煤气灶烧水如何节省煤气的问题设计了一个实验,并获得了煤气开关旋钮旋转的弧度数与烧开一壶水所用时间的一组数据,且作了一定的数据处理(如下表),得到了散点图(如下图).
表中.
(1)根据散点图判断,与哪一个更适宜作烧水时间关于开关旋钮旋转的弧度数的回归方程类型?(不必说明理由)
(2)根据判断结果和表中数据,建立关于的回归方程;
(3)若旋转的弧度数与单位时间内煤气输出量成正比,那么为多少时,烧开一壶水最省煤气?
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为.
4.【新疆维吾尔自治区乌鲁木齐市2019-2020学年高三第一次诊断性测试】
“团购”已经渗透到我们每个人的生活,这离不开快递行业的发展,下表是2013-2017年全国快递业务量(x亿件:精确到0.1)及其增长速度(y%)的数据
(1)试计算2012年的快递业务量;
(2)分别将2013年,2014年,…,2017年记成年的序号t:1,2,3,4,5;现已知y与t具有线性相关关系,试建立y关于t的回归直线方程;
(3)根据(2)问中所建立的回归直线方程,估算2019年的快递业务量
附:回归直线的斜率和截距地最小二乘法估计公式分别为:,
5.【内蒙古乌兰察布市等五市2019-2020学年高三1月调研】
一个调查学生记忆力的研究团队从某中学随机挑选100名学生进行记忆测试,通过讲解100个陌生单词后,相隔十分钟进行听写测试,间隔时间(分钟)和答对人数的统计表格如下:
时间与答对人数的散点图如图:
附:,,,,,对于一组数据,,……,,其回归直线的斜率和截距的最小二乘估计分别为:,.请根据表格数据回答下列问题:
(1)根据散点图判断,与,哪个更适宣作为线性回归类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果,建立与的回归方程;(数据保留3位有效数字)
(3)根据(2)请估算要想记住的内容,至多间隔多少分钟重新记忆一遍.(参考数据:,)
6.【湖南省岳阳市2019-2020学年高三上学期末数学】
某高新企业自2012年成立以来,不断创新技术与产品,积极拓展市场,销售收入(单位万元)与年份代号之间对应关系如下表,且满足回归函数,记。
(1)任取2年对比销售收入的情况,求这2年中销售收入均超过400万元的概率;
(2)求回归函数中的值。
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,
7.【广东省潮州市2019-2020学年高三上学期期末】
某地区2020年清明节前后3天每天下雨的概率为60%,通过模拟实验的方法来计算该地区这3天中恰好有2天下雨的概率:用随机数(,且)表示是否下雨:当时表示该地区下雨,当时,表示该地区不下雨,从随机数表中随机取得20组数如下
332 714 740 945 593 468 491 272 073 445
992 772 951 431 169 332 435 027 898 719
(1)求出的值,并根据上述数表求出该地区清明节前后3天中恰好有2天下雨的概率;
(2)从2011年开始到2019年该地区清明节当天降雨量(单位:)如下表:(其中降雨量为0表示没有下雨).
经研究表明:从2011年开始至2020年, 该地区清明节有降雨的年份的降雨量与年份成线性回归,求回归直线,并计算如果该地区2020年()清明节有降雨的话,降雨量为多少?(精确到0.01)
参考公式:.
参考数据:,,
,.
8.【云南省昆明市2019-2020学年高三下学期1月】
近年来,昆明加大了特色农业建设,其中花卉产业是重要组成部分.昆明斗南毗邻滇池东岸,是著名的花都,有“全国10支鲜花7支产自斗南”之说,享有“金斗南”的美誉。对斗南花卉交易市场某个品种的玫瑰花日销售情况进行调研,得到这种玫瑰花的定价(单位:元/扎,20支/扎)和销售率(销售率是销售量与供应量的比值)的统计数据如下:
(1)设,根据所给参考数据判断,回归模型与哪个更合适,并根据你的判断结果求回归方程(、的结果保留一位小数);
(2)某家花卉公司每天向斗南花卉交易市场提供该品种玫瑰花1200扎,根据(1)中的回归方程,估计定价(单位:元/扎)为多少时,这家公司该品种玫瑰花的日销售额(单位:元)最大,并求的最大值。
参考数据:与的相关系数,与的相关系数,,,,,,,,,,,.
参考公式:,,.
9.【2019年安徽省皖南八校高三8月摸底数学】
影响消费水平的原因很多,其中重要的一项是工资收入.研究这两个变量的关系的一个方法是通过随机抽样的方法,在一定范围内收集被调查者的工资收入和他们的消费状况.下面的数据是某机构收集的某一年内上海、江苏、浙江、安徽、福建五个地区的职工平均工资与城镇居民消费水平(单位:万元).
(1)利用江苏、浙江、安徽三个地区的职工平均工资和他们的消费水平,求出线性回归方程,其中,;
(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过1万,则认为得到的线性回归方程是可靠的,试问所得的线性回归方程是否可靠?(的结果保留两位小数)
(参考数据:,)
10.随着智能手机的普及,使用手机上网成为了人们日常生活的一部分,很多消费者对手机流量的需求越来越大.长沙某通信公司为了更好地满足消费者对流量的需求,准备推出一款流量包.该通信公司选了5个城市(总人数、经济发展情况、消费能力等方面比较接近)采用不同的定价方案作为试点,经过一个月的统计,发现该流量包的定价:(单位:元/月)和购买人数(单位:万人)的关系如表:
(1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模型拟合与的关系?并指出是正相关还是负相关;
(2)①求出关于的回归方程;
②若该通信公司在一个类似于试点的城市中将这款流量包的价格定位25元/ 月,请用所求回归方程预测长沙市一个月内购买该流量包的人数能否超过20 万人.
参考数据:,,.
参考公式:相关系数,回归直线方程,其中,.
11.【山东省济南市2019届高三5月学习质量针对性检测】
某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每件产品的非原料成本(元)与生产该产品的数量(千件)有关,经统计得到如下数据:
根据以上数据,绘制了散点图.
观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型和指数函数模型分别对两个变量的关系进行拟合.已求得用指数函数模型拟合的回归方程为,与的相关系数.参考数据(其中):
(1)用反比例函数模型求关于的回归方程;
(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到0.01),并用其估计产量为10千件时每件产品的非原料成本;
(3)该企业采取订单生产模式(根据订单数量进行生产,即产品全部售出).根据市场调研数据,若该产品单价定为100元,则签订9千件订单的概率为0.8,签订10千件订单的概率为0.2;若单价定为90元,则签订10千件订单的概率为0.3,签订11千件订单的概率为0.7.已知每件产品的原料成本为10元,根据(2)的结果,企业要想获得更高利润,产品单价应选择100元还是90元,请说明理由.
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为:,,相关系数.
类型
对应典例
线性回归方程的求解与预测
典例1
两类线性回归模型的分析与判断
典例2
非线性回归方程的求解与预测
典例3
两类非线性回归方程的分析与判断
典例4
两类回归方程的拟合效果的比较分析
典例5
回归模型中的线性相关的分析与相关系数的求解
典例6
年份x
2014
2015
2016
2017
2018
足球特色学校y(百个)
0.30
0.60
1.00
1.40
1.70
27
74
182
46.6
56.3
6.8
289.8
1.6
1469
108.8
年份
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
年份序号
1
2
3
4
5
6
7
8
9
10
工业增加值
13.2
13.8
16.5
19.5
20.9
22.2
23.4
23.7
24.8
28
5.5
20.6
82.5
211.52
129.6
月份代码
1
2
3
4
5
6
7
销售量(万件)
1.47
20.6
0.78
2.35
0.81
-19.3
16.2
时间(分钟)
10
20
30
40
50
60
70
80
90
100
答对人数
98
70
52
36
30
20
15
11
5
5
1.99
1.85
1.72
1.56
1.48
1.30
1.18
1.04
0.7
0.7
年份
2012
2013
2014
2015
2016
2017
2018
年份代号
1
2
3
4
5
6
7
销售收入
80
199
398
2512
6310
15848
79432
1.9
2.3
2.6
3.4
3.8
4.2
4.9
时间
2011年
2012年
2013年
2014年
2015年
2016年
2017年
2018年
2019年
年份
1
2
3
4
5
6
7
8
9
降雨量
29
28
26
27
25
23
24
22
21
10
20
30
40
50
60
0.9
0.65
0.45
0.3
0.2
0.175
地区
上海
江苏
浙江
安徽
福建
职工平均工资
9.8
6.9
6.4
6.2
5.6
城镇居民消费水平
6.6
4.6
4.4
3.9
3.8
流量包的定价(元/月)
30
35
40
45
50
购买人数(万人)
18
14
10
8
5
1
2
3
4
5
6
7
8
112
61
44.5
35
30.5
28
25
24
183.4
0.34
0.115
1.53
360
22385.5
61.4
0.135
备战2020年高考数学大题精做之解答题题型全覆盖高端精品
第四篇 概率与统计
专题02 变量间的相关关系与回归分析
【典例1】【2020届辽宁省实验中学高三上学期期末】足球是世界普及率最高的运动,我国大力发展校园足球.为了解本地区足球特色学校的发展状况,社会调查小组得到如下统计数据:
(1)根据上表数据,计算y与x的相关系数r,并说明y与x的线性相关性强弱.
(已知:,则认为y与x线性相关性很强;,则认为y与x线性相关性一般;,则认为y与x线性相关性较):
(2)求y关于x的线性回归方程,并预测A地区2020年足球特色学校的个数(精确到个).参考公式和数据:,
,.
【思路点拨】
(1)根据题意计算出r,再比较即得解;
(2)根据已知求出线性回归方程,再令x=2020即得解.
解:(1)由题得
所以,
y与x线性相关性很强.
(2)
,
,
关于的线性回归方程是.
当时,,
即该地区2020年足球特色学校有244个.
【典例2】【2018年全国普通高等学校招生统一考试理数(全国卷II)】
下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据2000年至2016年的数据(时间变量的值依次为)建立模型①:;根据2010年至2016年的数据(时间变量的值依次为)建立模型②:.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
【思路引导】
分析:(1)两个回归直线方程中无参数,所以分别求自变量为2018时所对应的函数值,就得结果;(2)根据折线图知2000到2009,与2010到2016是两个有明显区别的直线,且2010到2016的增幅明显高于2000到2009,也高于模型1的增幅,因此所以用模型2更能较好得到2018的预测.
解:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为
=–30.4+13.5×19=226.1(亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为
=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
【典例3】【四川省资阳市2019-2020学年高三上学期第二次诊断考试】
已知某地区某种昆虫产卵数和温度有关.现收集了一只该品种昆虫的产卵数(个)和温度()的7组观测数据,其散点图如所示:
根据散点图,结合函数知识,可以发现产卵数和温度可用方程来拟合,令,结合样本数据可知与温度可用线性回归方程来拟合.根据收集到的数据,计算得到如下值:
表中,.
(1)求和温度的回归方程(回归系数结果精确到);
(2)求产卵数关于温度的回归方程;若该地区一段时间内的气温在之间(包括与),估计该品种一只昆虫的产卵数的范围.(参考数据:,,,,.)
附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为.
【思路点拨】
(1)根据公式计算出和,可得;
(2)根据可得,再根据函数为增函数可得答案.
解:(1)因为与温度可以用线性回归方程来拟合,设.
,所以,
故关于的线性回归方程为.
(2)由(1)可得,于是产卵数关于温度的回归方程为,
当时,;当时,;
因为函数为增函数,所以,气温在之间时,一只该品种昆虫的产卵数的估计范围是内的正整数.
【典例4】【2015年全国普通高等学校招生统一考试理科数学】
某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费和年销售量(=1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
表中,=
(Ⅰ)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程;
(Ⅲ)已知这种产品的年利润z与x、y的关系为z=0.2y-x.根据(Ⅱ)的结果回答下列问题:
(ⅰ)年宣传费x=49时,年销售量及年利润的预报值是多少?
(ⅱ)年宣传费x为何值时,年利率的预报值最大?
附:对于一组数据,,……,,其回归线的斜率和截距的最小二乘估计分别为:
解:(Ⅰ)由散点图可以判断,适合作为年销售关于年宣传费用的回归方程类型.
(Ⅱ)令,先建立关于的线性回归方程,由于=,∴=563-68×6.8=100.6.∴关于的线性回归方程为,∴关于的回归方程为.
(Ⅲ)(ⅰ)由(Ⅱ)知,当=49时,年销售量的预报值
=576.6,.
(ⅱ)根据(Ⅱ)的结果知,年利润z的预报值
,
∴当=,即时,取得最大值.
故宣传费用为46.24千元时,年利润的预报值最大.
【典例5】【河北省唐山市2019届高三上学期期末考试】
近年来,我国工业经济发展迅速,工业增加值连年攀升,某研究机构统计了近十年(从2008年到2017年)的工业增加值(万亿元),如下表:
依据表格数据,得到下面的散点图及一些统计量的值.
(1)根据散点图和表中数据,此研究机构对工业增加值(万亿元)与年份序号的回归方程类型进行了拟合实验,研究人员甲采用函数,其拟合指数;研究人员乙采用函数,其拟合指数;研究人员丙采用线性函数,请计算其拟合指数,并用数据说明哪位研究人员的函数类型拟合效果最好.(注:相关系数与拟合指数满足关系).
(2)根据(1)的判断结果及统计值,建立关于的回归方程(系数精确到0.01);
(3)预测到哪一年的工业增加值能突破30万亿元大关.
附:样本 的相关系数,
,,.
解:
(1),.
因为越大,拟合效果越好,所以丙的拟合效果最好.
(2),
.
因此关于的线性回归方程为.
(3)从2008年开始计数,
2018年是第11年,其工业增加值的预报值:
.
2019年是第12年,其工业增加值的预报值:
.
故可以预测到2019年的工业增加值能突破30万亿元大关.
【典例6】【安徽省江淮十校2019届高三年级5月考前最后一卷】
某公司为了预测下月产品销售情况,找出了近7个月的产品销售量(单位:万件)的统计表:
但其中数据污损不清,经查证,,.
(1)请用相关系数说明销售量与月份代码有很强的线性相关关系;
(2)求关于的回归方程(系数精确到0.01);
(3)公司经营期间的广告宣传费(单位:万元)(),每件产品的销售价为10元,预测第8个月的毛利润能否突破15万元,请说明理由.(毛利润等于销售金额减去广告宣传费)
参考公式及数据:,相关系数,当时认为两个变量有很强的线性相关关系,回归方程中斜率和截距的最小二乘估计公式分别为,.
【思路点拨】(1)根据中条件,计算相关系数的值,即可得出结论;
(2)根据题中数据,计算出,即可得到回归方程;
(3)将代入(2)的结果,结合题中条件,即可求出结果.
解:(1)由折线图中的数据和附注中的参考数据得
, , ,
∴, 因为
所以销售量与月份代码有很强的线性相关关系.
(2) 由及(Ⅰ)得
所以关于的回归方程为
(3)当时,代入回归方程得(万件)
第8个月的毛利润为
,预测第8个月的毛利润不能突破万元.
【针对训练】
1.【2020届河南省名校联盟高三模拟仿真考试数学】
“绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新能源汽车产业的迅速发展.下表是近几年我国某地区新能源乘用车的年销售量与年份的统计表:
某机构调查了该地区30位购车车主的性别与购车种类情况,得到的部分数据如下表所示:
(1)求新能源乘用车的销量关于年份的线性相关系数,并判断与是否线性相关;
(2)请将上述列联表补充完整,并判断是否有的把握认为购车车主是否购置新能源乘用车与性别有关;
(3)若以这30名购车车主中购置新能源乘用车的车主性别比例作为该地区购置新能源乘用车的车主性别比例,从该地区购置新能源乘用车的车主中随机选取50人,记选到女性车主的人数为,求的数学期望与方差.
参考公式:
,,其中.,若,则可判断与线性相交.
【思路点拨】
(1)根据条件计算出相关系数即可判断两变量的相关关系;
(2)依题意完善列联表,计算出卡方,跟参考数据比较即得;
(3)由样本计算出购置新能源车的车主中女性车主的概率,再根据二项分布求出期望和方差.
解:(1)依题意,
,,
故,
,,
则,
故与线性相关.
(2)依题意,完善表格如下:
,
故有的把握认为购车车主是否购置新能源乘用车与性别有关.
(3)依题意,该地区购置新能源车的车主中女性车主的概率为,
则,所以,.
6.【2020届广东省东莞市高三期末调研测试】
某农科所对冬季昼夜温差(最高温度与最低温度的差)大小与某反季节大豆新品种一天内发芽数之间的关系进行了分析研究,他们分别记录了12月1日至12月6日每天昼夜最高、最低的温度(如图甲),以及实验室每天每100颗种子中的发芽数情况(如图乙),得到如下资料:
最高温度最低温度
甲
乙
(1)请画出发芽数y与温差x的散点图;
(2)若建立发芽数y与温差x之间的线性回归模型,请用相关系数说明建立模型的合理性;
(3)①求出发芽数y与温差x之间的回归方程(系数精确到0.01);
②若12月7日的昼夜温差为,通过建立的y关于x的回归方程,估计该实验室12月7日当天100颗种子的发芽数.
参考数据:.参考公式:相关系数:(当时,具有较强的相关关系).回归方程中斜率和截距计算公式:.
【思路点拨】
(1)结合题设所给数据作出散点图即可;
(2)结合题设所给数据,求出相关系数的值,再作出判断即可;
(3)结合题设所给数据,由最小二乘估计公式求出发芽数y与温差x之间的回归方程,从而运算即可得解.
解:(1)散点图如图所示
(2)
因为y与x的相关系数近似为,说明y与x的线性相关程度较强,
从而建立发芽数y与温差x之间的线性回归模型是合理的;
(3)由最小二乘估计公式,得
,
,所以,
当时,(颗),
所以,估计该实验室12月7日当天种子的发芽数为20颗.
3.某学生为了测试煤气灶烧水如何节省煤气的问题设计了一个实验,并获得了煤气开关旋钮旋转的弧度数与烧开一壶水所用时间的一组数据,且作了一定的数据处理(如下表),得到了散点图(如下图).
表中.
(1)根据散点图判断,与哪一个更适宜作烧水时间关于开关旋钮旋转的弧度数的回归方程类型?(不必说明理由)
(2)根据判断结果和表中数据,建立关于的回归方程;
(3)若旋转的弧度数与单位时间内煤气输出量成正比,那么为多少时,烧开一壶水最省煤气?
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为.
【思路点拨】
(1)根据散点图是否按直线型分布作答;(2)根据回归系数公式得出y关于ω的线性回归方程,再得出y关于x的回归方程;(3)利用基本不等式得出煤气用量的最小值及其成立的条件.
解:(1)更适宜作烧水时间关于开关旋钮旋转的弧度数的回归方程类型.
(2)由公式可得:,
,
所以所求回归方程为.
(3)设,则煤气用量,
当且仅当时取“=”,即时,煤气用量最小.
4.【新疆维吾尔自治区乌鲁木齐市2019-2020学年高三第一次诊断性测试】
“团购”已经渗透到我们每个人的生活,这离不开快递行业的发展,下表是2013-2017年全国快递业务量(x亿件:精确到0.1)及其增长速度(y%)的数据
(1)试计算2012年的快递业务量;
(2)分别将2013年,2014年,…,2017年记成年的序号t:1,2,3,4,5;现已知y与t具有线性相关关系,试建立y关于t的回归直线方程;
(3)根据(2)问中所建立的回归直线方程,估算2019年的快递业务量
附:回归直线的斜率和截距地最小二乘法估计公式分别为:,
【思路点拨】
(1) 设2012年的快递业务量为a,根据题意列出方程求解即可; (2)先求出,,代入即可求出,再代入 即可求出,从而得到回归直线方程;(3)首先利用(2)中求出的回归直线方程求出2018年快递业务增长量,再令,求出2019年快递业务增长量.
解:(1)设2012年的快递业务量为a,则,解得;
(2)
,
(3)令,预测2018年比上半年增长,
2018年快递业务增长量为(亿件)
令,预测2019年比上半年增长,
2019年快递业务增长量为(亿件).
5.【内蒙古乌兰察布市等五市2019-2020学年高三1月调研】
一个调查学生记忆力的研究团队从某中学随机挑选100名学生进行记忆测试,通过讲解100个陌生单词后,相隔十分钟进行听写测试,间隔时间(分钟)和答对人数的统计表格如下:
时间与答对人数的散点图如图:
附:,,,,,对于一组数据,,……,,其回归直线的斜率和截距的最小二乘估计分别为:,.请根据表格数据回答下列问题:
(1)根据散点图判断,与,哪个更适宣作为线性回归类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果,建立与的回归方程;(数据保留3位有效数字)
(3)根据(2)请估算要想记住的内容,至多间隔多少分钟重新记忆一遍.(参考数据:,)
【思路点拨】
(1)根据图象可得答案;
(2)先求得的线性回归方程,再将对数式化为指数式可得与的回归方程;
(3)解不等式 可得答案.
解:(1)由图象可知,更适宜作为线性回归类型;
(2)设,根据最小二乘法得
,,
所以,因此;
(3)由题意知,即,解得
,即至多19.05分钟,就需要重新复习一遍.
6.【湖南省岳阳市2019-2020学年高三上学期末数学】
某高新企业自2012年成立以来,不断创新技术与产品,积极拓展市场,销售收入(单位万元)与年份代号之间对应关系如下表,且满足回归函数,记。
(1)任取2年对比销售收入的情况,求这2年中销售收入均超过400万元的概率;
(2)求回归函数中的值。
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,
【思路点拨】
(1)根据组合的定义求出任取2个数据的方法数,以及两个数据均超过400万的方法数,由概率公式可计算概率.
(2)回归方程两边取常用对数得即这是线性回归直线方程,因此中的系数,为此先求出,再计算出,于是有,从而得到了().得回归方程.
解:(1)从7年销售收入中任取2年的销售收入,共有21种取法,其中2年销售收入均超过400万的有6种, 故
(2)依题意,,所以,
故,回归方程为
7.【广东省潮州市2019-2020学年高三上学期期末】
某地区2020年清明节前后3天每天下雨的概率为60%,通过模拟实验的方法来计算该地区这3天中恰好有2天下雨的概率:用随机数(,且)表示是否下雨:当时表示该地区下雨,当时,表示该地区不下雨,从随机数表中随机取得20组数如下
332 714 740 945 593 468 491 272 073 445
992 772 951 431 169 332 435 027 898 719
(1)求出的值,并根据上述数表求出该地区清明节前后3天中恰好有2天下雨的概率;
(2)从2011年开始到2019年该地区清明节当天降雨量(单位:)如下表:(其中降雨量为0表示没有下雨).
经研究表明:从2011年开始至2020年, 该地区清明节有降雨的年份的降雨量与年份成线性回归,求回归直线,并计算如果该地区2020年()清明节有降雨的话,降雨量为多少?(精确到0.01)
参考公式:.
参考数据:,,
,.
【思路点拨】
(1)根据每天下雨概率可求得,在所给20组数确定表示3天中恰有2天下雨的组数,然后计算概率;
(2)计算,根据所给数据求出回归直线方程中的系数,得回归直线方程,令可得2020年的预估值.
解:(1)由得,即表示下雨,表示不下雨,
所给20组数中有714,740,945,593,491,272,073,951,169,027共10组表示3天中恰有两天下雨,∴所求概率为.
(2)由所给数据得,,
,,
∴回归直线方程为:,
时,,
∴2020年清明节有降雨的话,降雨量约为.
8.【云南省昆明市2019-2020学年高三下学期1月】
近年来,昆明加大了特色农业建设,其中花卉产业是重要组成部分.昆明斗南毗邻滇池东岸,是著名的花都,有“全国10支鲜花7支产自斗南”之说,享有“金斗南”的美誉。对斗南花卉交易市场某个品种的玫瑰花日销售情况进行调研,得到这种玫瑰花的定价(单位:元/扎,20支/扎)和销售率(销售率是销售量与供应量的比值)的统计数据如下:
(1)设,根据所给参考数据判断,回归模型与哪个更合适,并根据你的判断结果求回归方程(、的结果保留一位小数);
(2)某家花卉公司每天向斗南花卉交易市场提供该品种玫瑰花1200扎,根据(1)中的回归方程,估计定价(单位:元/扎)为多少时,这家公司该品种玫瑰花的日销售额(单位:元)最大,并求的最大值。
参考数据:与的相关系数,与的相关系数,,,,,,,,,,,.
参考公式:,,.
【思路点拨】
(1)先由线性相关系数的意义可知,更合适,再根据回归直线方程的系数公式,代入数据计算即可;
(2)先得到,再利用导数求其最值即可.
解:(1)因为,,,
由线性相关系数的意义可知,更合适,
,
,
所以回归直线方程为:.
(2)由题意有:,
,令,得 ,,
当时,,递增;当时,,递减;
所以当售价约为20.1元/扎时,日销售额最大.
(元),
所以,最大日销售额为12060元.
9.【2019年安徽省皖南八校高三8月摸底数学】
影响消费水平的原因很多,其中重要的一项是工资收入.研究这两个变量的关系的一个方法是通过随机抽样的方法,在一定范围内收集被调查者的工资收入和他们的消费状况.下面的数据是某机构收集的某一年内上海、江苏、浙江、安徽、福建五个地区的职工平均工资与城镇居民消费水平(单位:万元).
(1)利用江苏、浙江、安徽三个地区的职工平均工资和他们的消费水平,求出线性回归方程,其中,;
(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过1万,则认为得到的线性回归方程是可靠的,试问所得的线性回归方程是否可靠?(的结果保留两位小数)
(参考数据:,)
【思路点拨】
(1)先计算出,代入公式求出,,再代入即可;
(2)将与代入比较即可。
解:(1),.
,
,
∴所求线性回归方程为.
(2)当时,,,
当时,,,
所以得到的线性回归方程是可靠的.
10.随着智能手机的普及,使用手机上网成为了人们日常生活的一部分,很多消费者对手机流量的需求越来越大.长沙某通信公司为了更好地满足消费者对流量的需求,准备推出一款流量包.该通信公司选了5个城市(总人数、经济发展情况、消费能力等方面比较接近)采用不同的定价方案作为试点,经过一个月的统计,发现该流量包的定价:(单位:元/月)和购买人数(单位:万人)的关系如表:
(1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模型拟合与的关系?并指出是正相关还是负相关;
(2)①求出关于的回归方程;
②若该通信公司在一个类似于试点的城市中将这款流量包的价格定位25元/ 月,请用所求回归方程预测长沙市一个月内购买该流量包的人数能否超过20 万人.
参考数据:,,.
参考公式:相关系数,回归直线方程,其中,.
【思路点拨】
(1) 根据题意,得,计算出相关系数,从而可以作出判断;
(2) ①求出回归直线方程,②由①知,若,则,从而预测长沙市一个月内购买该流量包的人数会超过20万人
解:(1)根据题意,得,.
可列表如下
根据表格和参考数据,得,
.
因而相关系数.
由于很接近1,因而可以用线性回归方程模型拟合与的关系.
由于,故其关系为负相关.
(2)①,,
因而关于的回归方程为.
②由①知,若,则,故若将流量包的价格定为25元/月,可预测长沙市一个月内购买该流量包的人数会超过20万人.
11.【山东省济南市2019届高三5月学习质量针对性检测】
某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每件产品的非原料成本(元)与生产该产品的数量(千件)有关,经统计得到如下数据:
根据以上数据,绘制了散点图.
观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型和指数函数模型分别对两个变量的关系进行拟合.已求得用指数函数模型拟合的回归方程为,与的相关系数.参考数据(其中):
(1)用反比例函数模型求关于的回归方程;
(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到0.01),并用其估计产量为10千件时每件产品的非原料成本;
(3)该企业采取订单生产模式(根据订单数量进行生产,即产品全部售出).根据市场调研数据,若该产品单价定为100元,则签订9千件订单的概率为0.8,签订10千件订单的概率为0.2;若单价定为90元,则签订10千件订单的概率为0.3,签订11千件订单的概率为0.7.已知每件产品的原料成本为10元,根据(2)的结果,企业要想获得更高利润,产品单价应选择100元还是90元,请说明理由.
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为:,,相关系数.
【思路点拨】
(1)首先可令并将转化为,然后根据题目所给数据以及线性回归方程的相关计算出以及,即可得出结果;
(2)计算出反比例函数模型的相关系数并通过对比即可得出结果;
(3)可分别计算出单价为元和元时产品的利润,通过对比即可得出结果。
解:(1)令,则可转化为,
因为,所以,
则,所以,
所以关于的回归方程为;
(2)与的相关系数为:
,
因为,所以用反比例函数模型拟合效果更好,
当时,(元),
所以当产量为10千件时,每件产品的非原料成本为元;
(3)①当产品单价为元,设订单数为千件:
因为签订9千件订单的概率为0.8,签订10千件订单的概率为0.2,
所以,
所以企业利润为(千元),
②当产品单价为元,设订单数为千件:
因为签订10千件订单的概率为0.3,签订11千件订单的概率为0.7,
所以,
所以企业利润为(千元),
故企业要想获得更高利润,产品单价应选择元.
类型
对应典例
线性回归方程的求解与预测
典例1
两类线性回归模型的分析与判断
典例2
非线性回归方程的求解与预测
典例3
两类非线性回归方程的分析与判断
典例4
两类回归方程的拟合效果的比较分析
典例5
回归模型中的线性相关的分析与相关系数的求解
典例6
年份x
2014
2015
2016
2017
2018
足球特色学校y(百个)
0.30
0.60
1.00
1.40
1.70
27
74
182
46.6
56.3
6.8
289.8
1.6
1469
108.8
年份
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
年份序号
1
2
3
4
5
6
7
8
9
10
工业增加值
13.2
13.8
16.5
19.5
20.9
22.2
23.4
23.7
24.8
28
5.5
20.6
82.5
211.52
129.6
月份代码
1
2
3
4
5
6
7
销售量(万件)
购置传统燃油车
购置新能源车
总计
男性车主
18
6
24
女性车主
2
4
6
总计
20
10
30
1.47
20.6
0.78
2.35
0.81
-19.3
16.2
t
1
2
3
4
5
y
61
52
48
51
28
时间(分钟)
10
20
30
40
50
60
70
80
90
100
答对人数
98
70
52
36
30
20
15
11
5
5
1.99
1.85
1.72
1.56
1.48
1.30
1.18
1.04
0.7
0.7
年份
2012
2013
2014
2015
2016
2017
2018
年份代号
1
2
3
4
5
6
7
销售收入
80
199
398
2512
6310
15848
79432
1.9
2.3
2.6
3.4
3.8
4.2
4.9
时间
2011年
2012年
2013年
2014年
2015年
2016年
2017年
2018年
2019年
年份
1
2
3
4
5
6
7
8
9
降雨量
29
28
26
27
25
23
24
22
21
10
20
30
40
50
60
0.9
0.65
0.45
0.3
0.2
0.175
地区
上海
江苏
浙江
安徽
福建
职工平均工资
9.8
6.9
6.4
6.2
5.6
城镇居民消费水平
6.6
4.6
4.4
3.9
3.8
流量包的定价(元/月)
30
35
40
45
50
购买人数(万人)
18
14
10
8
5
1
2
3
4
5
6
7
8
112
61
44.5
35
30.5
28
25
24
183.4
0.34
0.115
1.53
360
22385.5
61.4
0.135
相关试卷
这是一份高考数学大题精做专题01直线与圆相结合问题(第五篇)(原卷版+解析),共11页。
这是一份高考数学大题精做专题01三角函数中的性质问题(原卷版+解析),共25页。
这是一份专题08 与函数相结合的概率综合问题(第四篇)-备战2022年高考数学大题精做之解答题题型全覆盖,文件包含专题08与函数相结合的概率综合问题第四篇解析版docx、专题08与函数相结合的概率综合问题第四篇原卷版docx等2份试卷配套教学资源,其中试卷共28页, 欢迎下载使用。