





人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用学案
展开8.2 一元线性回归模型及其应用(精讲)
8.2.1一元线性回归模型
8.2.2一元线性回归模型参数的最小二乘法估计
一、必备知识
知识点1:一元线性回归模型
(1)一元线性回归模型
我们称
为关于的一元线性回归模型,其中称为因变量或响应变量,称为自变量或解释变量;和为模型的未知参数,称为截距参数,称为斜率参数;是与之间的随机误差.
(2)随机误差
在线性回归模型中,和为模型的未知参数,是与之间的误差,通常为随机变量,称为随机误差.它的均值,方程.
线性回归模型的完整表达式为 , 在此模型中,随机误差的方差越小,用预报真实值的精度越高.
知识点2:一元线性回归模型参数的最小二乘法
(1)经验回归方程的求解法:最小二乘法
回归直线方程过样本点的中心,是回归直线方程最常用的一个特征;
我们将称为关于的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线。这种求经验回归方程的方法叫做最小二乘法,求得的,叫做,的最小二乘估计,其中称为回归系数,它实际上也就是经验回归直线的斜率,为截距.
其中
(2)求经验回归方程的步骤
①作出散点图,判断两变量是否具有线性相关关系,若具有线性相关关系,则可求其经验回归方程;
②列表求出,的值;
③利用公式先计算,再根据经验回归直线过样本点的中心计算;
④写出经验回归方程.
求经验回归方程,关键在于正确求出系数,,由于计算量较大,所以计算时要仔细谨慎、分层进行,避免因计算产生错误要特别注意,只有两个变量呈线性相关关系时,求出的经验回归方程才有意义.
(3)经验回归方程的性质
①经验回归直线一定过点,点通常称为样本点的中心;
②一次函数的单调性由的符号决定,函数递增的充要条件是;函数递减的充要条件是.这说明:与正相关的充要条件是;与负相关的充要条件是.
③在经验回归方程中,是经验回归直线的斜率,是截距.一般地,当回归系数时,说明两个变量呈正相关关系,它的意义是当每增大一个单位时,平均增大个单位;当时,说明两个变量呈负相关关系,它的意义是当每增大一个单位时,平均减小个单位.
知识点3:残差
(1)残差
对于响应变量,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.
(2)残差图
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.
(3)残差分析
残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.其步骤为:计算残差化残差图在残差图中分析残差特性.
知识点4:决定系数
(1)残差平方和
残差平方和,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.
(2)决定系数
决定系数是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预报变量的能力.
,越大,即拟合效果越好,越小,模型拟合效果越差.
(3)决定系数与相关系数的联系与区别
①相关系数反映两个变量的相关关系的强弱及正相关或负相关,决定系数反映回归模型的拟合效果.
②在含有一个解释变量的线性模型中,决定系数的数值是相关系数的平方,其变化范围为,而相关系数的变化范围为.
③当相关系数接近于1时,说明两变量的相关性较强,当接近于0时,说明两变量的相关性较弱;而当接近于1时,说明经验回归方程的拟合效果较好.
二、重点题型
题型1: 线性回归方程
1.(2021·新疆·巴楚县第一中学高二期中(文))某研究机构对某校高二文科学生的记忆力和判断力进行统计分析,得下表数据.
6 | 8 | 10 | 12 | |
2 | 3 | 5 | 6 |
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
(3)试根据(2)中求出的线性回归方程,预测记忆力为14的学生的判断力.
(参考公式:其中)
【答案】(1)见解析;(2)(3)判断力为7.5.
【详解】
(1)
(2),,
,
,所以.
.
故线性回归方程为.
(3)当时,故可预测记忆力为14的学生的判断力为7.5.
2.(2019·福建·高二期末(理))某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如表:
零件的个数(个) | 2 | 3 | 4 | 5 |
加工的时间(小时) | 2.5 | 3 | 4 | 4.5 |
参考公式:,,残差
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出关于的线性回归方程;
(3)求第二个点的残差值,并预测加工10个零件需要多少小时?
【答案】(1)见解析;(2);(3);8.05个小时
(1)作出散点图如下:
(2),
,
,
所求线性回归方程为:
(3)
当代入回归直线方程,得(小时)
加工10个零件大约需要8.05个小时
3.(2020·吉林江城中学高一期末)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到数据如下:
零件的个数(个) | 2 | 3 | 4 | 5 |
加工的时间(小时) | 2.5 | 3 | 4 | 4.5 |
(Ⅰ)在给定的坐标系中画出表中数据的散点图(请在答题卡上作图!);
(Ⅱ)求出关于的线性回归方程;(参考公式:,)
(Ⅲ)试预测加工10个零件需要多少时间?
【答案】(Ⅰ)见解析(Ⅱ)(Ⅲ)小时
解:(Ⅰ)散点图如图所示.
(Ⅱ)由表中数据得52.5,54,,
∴
∴.∴.
(Ⅲ)将代入回归直线方程,得(小时).
4.(2022·陕西榆林·高二期末(文))某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,得到的数据如表:
零件的个数(个) | 2 | 3 | 4 | 5 |
加工的时间小时) | 2.5 | 3 | 4 | 4.5 |
(1)在给定的坐标系中画出表中数据的散点图.
(2)求出关于的线性回归方程,试预测加工10个零件需要多少小时?
(注:,)
【答案】(1)见解析;(2),预测加工10个零件大约需要8.05小时
(1)散点图
(2),,,
∴,,
∴回归直线方程:,
令,得,
∴预测加工10个零件大约需要8.05小时.
题型2:残差分析
1.(2022·陕西·高新一中高三阶段练习(理))2021年6月17日9时22分,我国酒泉卫星发射中心用长征遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将型材料更好地投入商用,拟对型材料进行应用改造.根据市场调研与模拟,得到应用改造投入(亿元)与产品的直接收益(亿元)的数据统计如下:
序号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
2 | 3 | 4 | 6 | 8 | 10 | 13 | |
15 | 22 | 27 | 40 | 48 | 54 | 60 |
当时,建立了y与x的两个回归模型:模型①:,模型②:;当时,确定与满足的线性回归方程为.
回归模型 | 模型① | 模型② |
79.13 | 20.2 |
(1)根据表格中的数据,比较当时模型①,②的相关指数的大小,并选择拟合精度更高、更可靠的模型,预测对型材料进行应用改造的投入为17亿元时的直接收益;
(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.
附:刻画回归效果的相关指数,且当越大时,回归方程的拟合效果越好..用最小二乘法求线性回归方程的截距:.
【答案】
(1),模型②拟合精度更高、更可靠,收益为;
(2)投入17亿元比投入20亿元时收益小.
(1)对于模型①,对应的,
故对应的,
故对应的相关指数,
对于模型②,同理对应的相关指数,
故模型②拟合精度更高、更可靠.
故对型材料进行应用改造的投入为17亿元时的直接收益为
.
(2)当时,
后五组的,
由最小二乘法可得,
故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:
,
故投入17亿元比投入20亿元时收益小.
2.(2021·河北·武安市第一中学高二阶段练习)为了防止脱贫后返贫,我市扶贫工作小组指导原一贫困村通过种植山药来提高经济收,山药对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2019年种植的一批试验山药在温度升高时死亡的株数的6组数据:
温度(单位:) | 21 | 23 | 24 | 27 | 29 | 32 |
死亡数(单位:株) | 6 | 11 | 20 | 27 | 57 | 77 |
经计算:,,,,,,,其中,分别为实验数据中的温度和死亡株数,,2,3,4,5,6.
(1)若用线性回归模型来拟合数据的变化关系,求关于的回归方程(结果精确到0.1);
(2)若用非线性回归模型来拟合数据的变化关系,求得关于的回归方程,且相关系数为.
①试与(1)中得回归模型相比,用说明哪种模型的拟合效果更好;
②用拟合效果好的模型预测温度为时该山药死亡株数(结果取整数).
附:对于一组具有线性相关关系的数据,,……,,其回归直线的截距和斜率的最小二乘法估计公式分别为:,
相关系数:
【答案】(1);(2)①用比拟合效果更好;②190株.
【详解】
(1)由题意可知,
;
∴关于的线性回归方程是;
(2)①用指数回归模型拟合与的关系,相关指数,
线性回归模型拟合与的关系,相关指数,且,∴用比拟合效果更好.
②中,令,则,故预测温度为时该山药死亡株数约为190株.
3.(2021·甘肃·张掖市第二中学高二期中(文))我校数学建模小组为了解高中男生的体重(单位:kg)与身高(单位:cm)是否存在较好的线性关系,该小组搜集了7位男生的数据,得到的数据经过计算后得到的有效数据为:,,,根据所给数据计算得到关于的线性回归方程为.
(1)求;
(2)已知且当时,回归方程的拟合效果非常好;当时,回归方程的拟合效果良好.试问该线性回归方程的拟合效果是非常好还是良好?说明你的理由.
【答案】(1);(2)良好,理由见解析.
【详解】
(1)∵将(172,62)代入回归方程得:
∴
(2),
∴
故该线性回归方程的拟合效果是良好.
题型3:非线性回归分析
1.(2022·四川·成都七中高三阶段练习(文))千百年来,人们一直在通过不同的方式传递信息.在古代,烽火狼烟、飞鸽传书、快马驿站等通信方式被人们广泛应用;第二次工业革命后,科技的进步带动了电讯事业的发展,电报电话的发明让通信领域发生了翻天覆地的变化;之后,计算机和互联网的出现则使得“千里眼”“顺风耳”变为现实.现在,5G的到来给人们的生活带来颠覆性的变革,某科技创新公司基于领先技术的支持,5G经济收入在短期内逐月攀升,该创新公司在第1月份至6月份的5G经济收入y(单位:百万元)关于月份的数据如表:
时间(月份) | 1 | 2 | 3 | 4 | 5 | 6 |
收入(百万元) | 6.6 | 8.6 | 16.1 | 21.6 | 33.0 | 41.0 |
根据以上数据绘制散点图,如图.
(1)根据散点图判断,与(a,b,c,d均为常数)哪一个适宜作为5G经济收入y关于月份x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的结果及表中的数据,求出y关于x的回归方程,并预测该公司8月份的5G经济收入;
参考数据:其中设,
参考公式和数据:对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计公式分别为:,,,.
3.50 | 21.15 | 2.85 | 17.50 | 125.35 | 6.73 |
【答案】(1);(2),百万元;
(1)根据散点图判断,适宜作为经济收入关于月份的回归方程类型.
(2)因为,所以两边同时取常用对数﹐得,
设,所以,又因为,
所以,,
所以,即,
令,得,故预测该公司月份的经济收入为百万元.
2.(2022·全国·模拟预测)千百年来,人们一直在通过不同的方式传递信息.在古代,烽火狼烟、飞鸽传书、快马驿站等通信方式被人们广泛应用;第二次工业革命后,科技的进步带动了电讯事业的发展,电报电话的发明让通信领域发生了翻天覆地的变化;之后,计算机和互联网的出现则使得“千里眼”“顺风耳”变为现实.现在,的到来给人们的生活带来颠覆性的变革,某科技创新公司基于领先技术的支持,经济收入在短期内逐月攀升,该创新公司在第月份至6月份的经济收入(单位:百万元)关于月份的数据如表:
时间(月份) | 1 | 2 | 3 | 4 | 5 | 6 |
收入(百万元) |
根据以上数据绘制散点图,如图.
(1)根据散点图判断,与均为常数)哪一个适宜作为经济收入关于月份的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的结果及表中的数据,求出关于的回归方程,并预测该公司8月份的经济收入;
参考数据:
其中设
参考公式和数据:对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计公式分别为:,
【答案】(1);(2),百万元;
(1)根据散点图判断,适宜作为经济收入关于月份的回归方程类型.
(2)因为,所以两边同时取常用对数﹐得,
设,所以,又因为,
所以,,
所以,即,
令,得,故预测该公司月份的经济收入为百万元.
3.(2021·河南·温县第一高级中学高三阶段练习(文))为了研究某种害虫和温度变化之间的关系,某科研院经过大量的试验得出该害虫的数量(只)与温度(摄氏度)之间可以用回归方程来拟合,其中,是大于0的常数,经计算得,,,.
(1)求关于的回归方程(结果保留小数点后两位有效数字);
(2)根据现有资料发现,这种害虫大致上可分为三类,类与类之间在机能方面存在着较大差异,为了更加精确的对不同类别之间的害虫进行研究,请给出一种你认为合理的抽样方法抽取一部分害虫进行科学研究,并说明理由.
附:对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计公式分别为:,.
参考数据:;,.
【答案】(1).(2)采用分层抽样的方法能够较好地对不同类别的昆虫进行研究,理由见解析.
(1)解:对两边取自然对数得,令,,即,且,
.
.由,得,
所以关于的回归方程为.
(2)由于这种昆虫大致上可分为三类,且类与类之间在机能方面存在着较大差异,故采用分层抽样的方法能够较好地对不同类别的昆虫进行研究.
4.(2021·云南师大附中高三阶段练习(理))近年来,由于耕地面积的紧张,化肥的施用量呈增加趋势.一方面,化肥的施用对粮食增产增收起到了关键作用,另一方面,也成为环境污染、空气污染、土壤污染的重要来源之一如何合理地施用化肥,使其最大程度地促进粮食增产,减少对周围环境的污染成为需要解决的重要问题研究粮食产量与化肥施用量的关系,成为解决上述问题的前提某研究团队收集了10组化肥施用量和粮食亩产量的数据并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值化肥施用量为x(单位:公斤),粮食亩产量为y(单位:百公斤).
参考数据:
650 | 91.5 | 52.5 | 1478.6 | 30.5 | 15 | 15 | 46.5 |
表中.
(1)根据散点图判断,与,哪一个适宜作为粮食亩产量y关于化肥施用量x的回归方程类型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;并预测化肥施用量为27公斤时,粮食亩产量y的值;
附:①对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为;
【答案】(1);(2),当化肥施用量为27公斤时,粮食亩产量约为810公斤;
(1)根据散点图,呈现非线性的变化趋势,故更适合作为关于的回归方程类型.
(2)对两边取对数,得,即,
由表中数据得:,,
,则,
∴关于的回归方程为,当时,,
∴当化肥施用量为27公斤时,粮食亩产量约为810公斤.
人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.2 一元线性回归模型及其应用学案设计: 这是一份人教A版 (2019)选择性必修 第三册<a href="/sx/tb_c4000364_t4/?tag_id=42" target="_blank">第八章 成对数据的统计分析8.2 一元线性回归模型及其应用学案设计</a>,文件包含第02讲一元线性回归模型及其应用教师版-高二数学同步精品讲义人教A版选择性必修第三册docx、第02讲一元线性回归模型及其应用学生版-高二数学同步精品讲义人教A版选择性必修第三册docx等2份学案配套教学资源,其中学案共89页, 欢迎下载使用。
人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用学案设计: 这是一份人教A版 (2019)选择性必修 第三册<a href="/sx/tb_c4000364_t4/?tag_id=42" target="_blank">8.2 一元线性回归模型及其应用学案设计</a>,共25页。学案主要包含了典例解析等内容,欢迎下载使用。
高中数学8.2 一元线性回归模型及其应用优秀导学案: 这是一份高中数学8.2 一元线性回归模型及其应用优秀导学案,文件包含人教A版高中数学选择性必修第三册同步讲义第27讲82一元线性回归模型及其应用原卷版doc、人教A版高中数学选择性必修第三册同步讲义第27讲82一元线性回归模型及其应用含解析doc等2份学案配套教学资源,其中学案共0页, 欢迎下载使用。