2024年高考数学第一轮复习专题训练第九章 §9.3 一元线性回归模型及其应用
展开§9.3 一元线性回归模型及其应用
考试要求 1.了解样本相关系数的统计含义.2.了解最小二乘法原理,掌握一元线性回归模型参数的最小二乘估计方法.3.针对实际问题,会用一元线性回归模型进行预测.
知识梳理
1.变量的相关关系
(1)相关关系:两个变量 ,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)相关关系的分类: 和 .
(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在 附近,我们就称这两个变量线性相关.
2.样本相关系数
(1)r=.
(2)当r>0时,称成对样本数据 ;当r<0时,称成对样本数据 .
(3)|r|≤1;当|r|越接近1时,成对样本数据的线性相关程度越 ;当|r|越接近0时,成对样本数据的线性相关程度越 .
3.一元线性回归模型
(1)我们将=x+称为Y关于x的经验回归方程,
其中
(2)残差:观测值减去 称为残差.
常用结论
1.经验回归直线过点(,).
2.求时,常用公式=.
3.回归分析和独立性检验都是基于成对样本观测数据进行估计或推断,得出的结论都可能犯错误.
思考辨析
判断下列结论是否正确(请在括号中打“√”或“×”)
(1)相关关系是一种非确定性关系.( )
(2)散点图是判断两个变量相关关系的一种重要方法和手段.( )
(3)经验回归直线=x+至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.( )
(4)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强.( )
教材改编题
1.在对两个变量x,y进行回归分析时有下列步骤:
①对所求出的经验回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求经验回归方程;④根据所收集的数据绘制散点图.
则下列操作顺序正确的是( )
A.①②④③ B.③②④①
C.②③①④ D.②④③①
2.对于x,y两变量,有四组成对样本数据,分别算出它们的样本相关系数r如下,则线性相关性最强的是( )
A.-0.82 B.0.78 C.-0.69 D.0.87
3.某单位为了了解办公楼用电量y(度)与气温x(℃)之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表:
气温(℃) | 18 | 13 | 10 | -1 |
用电量(度) | 24 | 34 | 38 | 64 |
由表中数据得到经验回归方程=-2x+,当气温为-4 ℃时,预测用电量约为( )
A.68度 B.52度
C.12度 D.28度
题型一 成对数据的相关性
例1 (1)(2023·保定模拟)已知两个变量x和y之间有线性相关关系,经调查得到如下样本数据:
x | 3 | 4 | 5 | 6 | 7 |
y | 3.5 | 2.4 | 1.1 | -0.2 | -1.3 |
根据表格中的数据求得经验回归方程为=x+,则下列说法中正确的是( )
A.>0,>0 B.>0,<0
C.<0,>0 D.<0,<0
(2)(2022·大同模拟)如图是相关变量x,y的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到经验回归方程=1x+1,样本相关系数为r1;方案二:剔除点(10,21),根据剩下的数据得到经验回归方程=2x+2,样本相关系数为r2.则( )
A.0<r1<r2<1 B.0<r2<r1<1
C.-1<r1<r2<0 D.-1<r2<r1<0
听课记录:______________________________________________________________
________________________________________________________________________
思维升华 判定两个变量相关性的方法
(1)画散点图:若点的分布从左下角到右上角,则两个变量正相关;若点的分布从左上角到右下角,则两个变量负相关.
(2)样本相关系数:当r>0时,正相关;当r<0时,负相关;|r|越接近1,相关性越强.
(3)经验回归方程:当>0时,正相关;当<0时,负相关.
跟踪训练1 (1)某公司2017~2022年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如表所示:
年份 | 2017 | 2018 | 2019 | 2020 | 2021 | 2022 |
利润x | 12.2 | 14.6 | 16 | 18 | 20.4 | 22.3 |
支出y | 0.62 | 0.74 | 0.81 | 0.89 | 1 | 1.11 |
根据统计资料,则利润中位数( )
A.是16,x与y有正相关关系
B.是17,x与y有正相关关系
C.是17,x与y有负相关关系
D.是18,x与y有负相关关系
(2)已知相关变量x和y的散点图如图所示,若用y=b1·ln(k1x)与y=k2x+b2拟合时的样本相关系数分别为r1,r2则比较r1,r2的大小结果为( )
A.r1>r2 B.r1=r2
C.r1<r2 D.不确定
题型二 回归模型
命题点1 一元线性回归模型
例2 (2023·蚌埠模拟)某商业银行对存款利率与日存款总量的关系进行调研,发现存款利率每上升一定的百分点,日均存款总额就会发生一定的变化,经过统计得到下表:
利率上升百分点x | 0.1 | 0.2 | 0.3 | 0.4 | 0.5 |
日均存款总额y(亿元) | 0.2 | 0.35 | 0.5 | 0.65 | 0.8 |
(1)在给出的坐标系中画出上表数据的散点图;
(2)根据上表提供的数据,用最小二乘法求出y关于x的经验回归方程=x+;
(3)已知现行利率下的日均存款总额为0.625亿元,试根据(2)中的经验回归方程,预测日均存款总额为现行利率下的2倍时,利率需上升多少个百分点?
参考公式及数据:①=,=-,②iyi=0.9,=0.55.
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
命题点2 非线性回归模型
例3 (2023·保山模拟)某印刷企业为了研究某种图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的关系,收集了一些数据并进行了初步整理,得到了如图所示的散点图及一些统计量的值.
(xi-)2 | (xi-)·(yi-) | (ui-)2 | (ui-)·(yi-) | |||
5 | 3.5 | 0.2 | 2 | 30 | 0.7 | 7 |
表中ui=,=i.
(1)根据散点图判断y=a+bx与y=c+哪一个模型更适合作为该图书每册的成本费y与印刷数量x的经验回归方程?(只要求给出判断,不必说明理由)
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
(2)根据(1)的判断结果及表中数据求出y关于x的经验回归方程;
(3)若该图书每册的售价为9元,则预测至少应该印刷多少册,才能使销售利润不低于80 000元(假设能够全部售出).
附:对于一组数据(ω1,v1),(ω2,v2),…,(ωn,vn),其经验回归方程=ω+的斜率和截距的最小二乘估计分别为=,=-.
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
思维升华 求经验回归方程的步骤
跟踪训练2 (2022·南充模拟)某特色餐馆开通了某APP的外卖服务,在一周内的某特色菜外卖份数x(单位:份)与收入y(单位:元)之间有如下的对应数据:
外卖份数x(份) | 2 | 4 | 5 | 6 | 8 |
收入y(元) | 30 | 40 | 60 | 50 | 70 |
(1)在给出的坐标系中画出数据散点图;
(2)请根据以上数据用最小二乘法求出收入y关于份数x的经验回归方程;
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
(3)据此估计外卖份数为12时,收入为多少元.
参考数据公式:=145,iyi=1 380,
==,
=-.
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
题型三 残差分析
例4 (1)(多选)下列说法正确的是( )
A.在经验回归方程=-0.85x+2.3中,当解释变量x每增加1个单位时,响应变量平均减少2.3个单位
B.在经验回归方程=-0.85x+2.3中,相对于样本点(1,1.2)的残差为-0.25
C.在残差图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好
D.若两个变量的决定系数R2越大,表示残差平方和越小,即模型的拟合效果越好
(2)新能源汽车的核心部件是动力电池,电池占了新能源整车成本的很大一部分,而其中的原材料碳酸锂又是电池的主要成分.从2020年底开始,碳酸锂的价格不断升高,如表是2022年某企业的前5个月碳酸锂的价格与月份的统计数据:
月份代码x | 1 | 2 | 3 | 4 | 5 |
碳酸锂价格y(万元/kg) | 0.5 | 0.6 | 1 | m | 1.5 |
根据表中数据,得出y关于x的经验回归方程为=0.28x+,根据数据计算出在样本点(5,1.5)处的残差为-0.06,则表中m=________.
听课记录:______________________________________________________________
________________________________________________________________________
思维升华 检验回归模型的拟合效果的两种方法
(1)残差分析:通过残差分析发现原始数据中的可疑数据,判断所建立模型的拟合效果.
(2)R2分析:通过公式计算R2,R2越大,残差平方和越小,模型的拟合效果越好;R2越小,残差平方和越大,模型的拟合效果越差.
跟踪训练3 (1)下列命题是真命题的为( )
A.经验回归方程=x+一定不过样本点
B.可以用样本相关系数r来刻画两个变量x和y线性相关程度的强弱,r的值越小,说明两个变量线性相关程度越弱
C.在回归分析中,决定系数R2=0.80的模型比决定系数R2=0.98的模型拟合的效果要好
D.残差平方和越小的模型,拟合的效果越好
(2)两个线性相关变量x与y的统计数据如表:
x | 9 | 9.5 | 10 | 10.5 | 11 |
y | 11 | 10 | 8 | 6 | 5 |
其经验回归方程是=x+40,则相应于点(9,11)的残差为________.
高中数学人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用第2课时同步训练题: 这是一份高中数学人教A版 (2019)选择性必修 第三册<a href="/sx/tb_c4000364_t7/?tag_id=28" target="_blank">8.2 一元线性回归模型及其应用第2课时同步训练题</a>,共7页。试卷主要包含了下列说法错误的有等内容,欢迎下载使用。
2024年高考数学第一轮复习专题训练81练第九章 §9.3 一元线性回归模型及其应用: 这是一份2024年高考数学第一轮复习专题训练81练第九章 §9.3 一元线性回归模型及其应用,共5页。
(新高考)高考数学一轮复习讲练测第9章§9.3一元线性回归模型及其应用(含解析): 这是一份(新高考)高考数学一轮复习讲练测第9章§9.3一元线性回归模型及其应用(含解析),共17页。试卷主要包含了了解样本相关系数的统计含义,82 B.0,5,,5元.,5+10+10,2,等内容,欢迎下载使用。