所属成套资源:全套人教A版普通高中数学一轮复习课时学案
人教A版普通高中数学一轮复习第九章第三节一元线性回归模型及其应用学案
展开
这是一份人教A版普通高中数学一轮复习第九章第三节一元线性回归模型及其应用学案,共5页。
3.针对实际问题,会用一元线性回归模型进行预测.
自查自测
知识点一 变量的相关关系
1.判断下列说法的正误,正确的打”√”,错误的打”×”.
(1)相关关系是一种非确定性关系.( √ )
(2)散点图是判断两个变量相关关系的一种重要方法和手段.( √ )
(3)经验回归直线y
=bx+a至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.( × )
2.(教材改编题)下列变量间的关系,不是相关关系的是( )
A.一块农田的水稻产量与施肥之间的关系
B.正方形的面积与边长之间的关系
C.商品销售收入与其广告费支出之间的关系
D.人体内的脂肪含量与年龄之间的关系
B 解析:对于A,水稻产量与施肥之间没有明确的等量关系,是相关关系,故A错误;
对于B,正方形的面积与边长之间有着明确的等量关系,不是相关关系,故B正确;
对于C,商品销售收入与其广告费支出之间没有明确的等量关系,故C错误;
对于D,人体内的脂肪含量与年龄之间没有明确的等量关系,故D错误.
3.以下两个变量成负相关的是 ② .(填序号)
①学生的学籍号与学生的数学成绩;
②坚持每天吃早餐的人数与患胃病的人数;
③气温与冷饮销售量;
④电瓶车的质量和行驶每千米的耗电量.
核心回扣
(1)相关关系的定义:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)相关关系的分类
①按变量间的增减性分为正相关和负相关.
正相关:当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势.
负相关:当一个变量的值增加时,另一个变量的相应值呈现减少的趋势.
②按变量间是否有线性特征分为线性相关和非线性相关(曲线相关).
线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
非线性相关或曲线相关:如果两个变量具有相关性,但不是线性相关,我们就称这两个变量非线性相关或曲线相关.
自查自测
知识点二 相关关系的刻画
1.调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数r=0.824 5,下列说法正确的是( )
A.花瓣长度和花萼长度没有相关性
B.花瓣长度和花萼长度呈现负相关
C.花瓣长度和花萼长度呈现正相关
D.若从样本中抽取一部分,则这部分的相关系数一定是0.824 5
C 解析:因为相关系数r=0.824 5>0.75,且散点图呈左下角到右上角的带状分布,所以花瓣长度和花萼长度呈正相关.若从样本中抽取一部分,则这部分的相关系数不一定是0.824 5.
2.对于x,y两变量,有四组成对样本数据,分别算出它们的样本相关系数r如下,则表示两个变量间线性相关程度最强的是( )
A.-0.82B.0.78
C.-0.69D.0.87
D 解析:由样本相关系数的绝对值|r|越大,变量间的线性相关性越强,知各选项中r=0.87的绝对值最大,故其线性相关程度最强.
3.(教材改编题)在对两个变量x,y进行回归分析时有下列步骤:
①对所求出的经验回归方程作出解释;
②收集数据(xi,yi),i=1,2,…,n;
③求经验回归方程;
④根据所收集的数据绘制散点图.
则下列操作顺序正确的是( )
A.①②④③B.③②④①
C.②③①④D.②④③①
D 解析:根据回归分析的思想,可知对两个变量x,y进行回归分析时,应先收集数据(xi,yi),i=1,2,…,n,然后绘制散点图,再求经验回归方程,最后对所求的经验回归方程作出解释.
4.下列关于y与x的经验回归方程中,变量x,y成正相关关系的是( )
A.y=-2.1x+1.8B.y=1.5x+1.5
C.y=-0.5x+2.1D.y=-1.2x+3.2
B 解析:对于A,由方程y=-2.1x+1.8,可得b=-2.10,所以变量x,y成正相关关系;
对于C,由方程y=-0.5x+2.1,可得b=-0.50时,表明两个变量正相关,故D正确.
2.(多选题)对两组数据进行统计后得到的散点图如图,对应样本相关系数分别为r1,r2,则下列结论正确的是( )
图1 图2
A.r11
C.r1+r2>0D.|r1|>|r2|
AC 解析:由散点图可知,题图1中y与x成负相关,故-10,故B错误;
题图2中的散点较题图1中的散点更密集,更集中于一条直线附近,故|r2|>|r1|,r1+r2>0,故C正确,D错误.
忽视散点图的结构特点导致错误
(1)两个变量具有正线性相关关系时,其散点是在从左下方到右上方的直线附近.
(2)两个变量具有负线性相关关系时,其散点是在从左上方到右下方的直线附近.
一元线性回归模型及其应用
考向1 相关系数的计算及应用
【例1】(2024·济南模拟)某食品加工厂新研制出一种袋装食品(规格:500 克/袋),下面是近六个月每袋出厂价格xi(单位:元)与销售量yi(单位:万袋)的对应关系表:
计算得=782.56,=19.9,=122.
(1)计算该食品加工厂这六个月内这种袋装食品的平均每袋出厂价格、平均月销售量和平均月销售收入.
(2)求每袋出厂价格与月销售量的样本相关系数(精确到0.01).
(3)若样本相关系数|r|≥0.75,则认为相关性很强,否则没有较强的相关性.你认为该食品加工厂制订的每袋食品的出厂价格与月销售量是否有较强的相关性.
附:样本相关系数
, eq \r(0.322)≈0.57.
解:(1)该食品加工厂这六个月内这种袋装食品的平均每袋出厂价格为x=16×(10.5+10.9+11+11.5+12+12.5)=11.4(元),
平均月销售量为y=16×(2.2+2+1.9+1.8+1.5+1.4)=1.8(万袋),
平均月销售收入为16= eq \f(1,6)×122= eq \f(61,3)(万元).
(2)由已知,每袋出厂价格与月销售量的样本相关系数为
r=
=
=122−6×11.4×−6×11.4219.9−6×1.82
=−1.122.8×0.46=-
≈-1.122×0.57≈-0.98.
(3)由于每袋出厂价格与月销售量的样本相关系数|r|≈0.98>0.75,
所以该食品加工厂制定的每袋食品的出厂价格与月销售量有较强的相关性.
判断相关关系的两种方法
(1)散点图法:如果所有的样本点都落在某条曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一条直线附近,变量之间就有线性相关关系.
(2)样本相关系数法:利用样本相关系数判断,|r|越接近1,相关性越强.
考向2 线性回归模型
【例2】一般机械设备中约有80%的零件因磨损而失效报废.零件磨损是由多方面因素造成的,某机械设备的零件随着使用时间的增加,”磨损指数”也在增加.现根据相关统计,得到一组数据如表所示.
(1)求r关于t的经验回归方程.
(2)在每使用完一整年后,工人会对该零件进行检测分析,若该零件在下一年使用过程中的”磨损指数”超过10%,则该零件需要在本次检测后立即进行报废处理.根据(1)中的经验回归方程,估计该零件使用多少年后需要进行报废处理.
附:=30.5,=98.1,
经验回归直线的斜率和截距的最小二乘估计公式分别为
, eq \(a,\s\up6(^))= eq \x\t(y)- eq \(b,\s\up6(^)) eq \x\t(x).
解:(1)因为=30.5,所以 eq \x\t(r)= eq \f(30.5,5)=6.1.
又 eq \x\t(t)= eq \f(1+2+3+4+5,5)=3,=98.1,=55,
所以 eq \(b,\s\up6(^))== eq \f(98.1-5×3×6.1,55-5×32)=0.66,
所以a=r-K000bt=6.1-0.66×3=4.12.
故r关于t的经验回归方程为r=0.66t+4.12.
(2)由(1)可知,当t=8时,r=0.66×8+4.12=9.410.
故估计该零件使用8年后需要进行报废处理.
求经验回归方程的步骤
考向3 非线性回归模型及拟合效果判断
【例3】(2024·青岛模拟)某高科技公司对其产品研发年投资额x(单位:亿元)与其年销售量y(单位:万件)的数据进行统计,整理后得到如下统计表1和散点图.通过初步分析,求得年销售量y关于年投资额x的经验回归方程为y=1.2x-1.3.
表1
表2
(1)该公司科研团队通过进一步分析散点图的特征后,计划用y=ebx+a作为年销售量y关于年投资额x的非线性经验回归方程,请根据参考数据及表2的数据,求出此方程;
(2)若求得一元线性回归模型的决定系数R12=0.88,请根据参考数据,求出(1)中非线性回归模型的决定系数R22,并比较两种经验回归方程的拟合效果哪个更好.
附:=55,=13.4;e-0.68≈0.51,e-0.09≈0.91,e0.50≈1.65,e1.09≈2.97,e1.68≈5.37.
经验回归直线的斜率和截距的最小二乘估计公式分别为
, eq \(a,\s\up6(^))= eq \x\t(y)- eq \(b,\s\up6(^)) eq \x\t(x),
决定系数R2=1-=1-.
解:(1)由y=ebx+a,可得ln y=bx+a,
即z=bx+a,
则z=−0.7+0+0.4+1.1+1.75=0.5,
y=0.5+1+1.5+3+5.55=2.3,
x=1+2+3+4+55=3,
b=13.4−5×3×0.555−5×32=0.59,
a=0.5-0.59×3=-1.27,
所以z=ln y=0.59x-1.27,
即非线性经验回归方程为y=e0.59x-1.27.
(2)由(1)可知y=e0.59x-1.27,
则可得数据如下表:
所以R22≈1-−0.012+0.092+−0.152+0.032++12+1.52+32+5.52−5×2.32
≈0.997,
显然R22>R12=0.88,故非线性经验回归方程的拟合效果更好.
1.非线性回归分析的解题步骤
2.拟合效果判断
不同模型的拟合效果由决定系数R2进行判断,R2越大,模型的拟合效果越好.
某企业为改进生产,决定对某产品的生产数量及成本相关数据进行统计,收集了该产品的成本费y(单位:万元/吨)及同批次产品生产数量x(单位:吨)的20组数据.现分别用两种模型①y=bx+a,②y=dx+c进行拟合,根据收集到的数据,计算得到如下值:
eq \x\t(x)=14.5, eq \x\t(y)=10, eq \x\t(t)=0.08,(xi- eq \x\t(x))2=665,(ti- eq \x\t(t))2=0.04,(xi- eq \x\t(x))(yi- eq \x\t(y))=-450,(ti- eq \x\t(t))·(yi- eq \x\t(y))=4,其中ti= eq \f(1,xi), eq \x\t(t)= eq \f(1,20).
若用R2=1-刻画拟合效果,得到模型①,②的R2值分别为R12=0.789 1,R22=0.948 5.
(1)利用R12和R22比较模型①,②的拟合效果,应选择哪个模型?说明理由.
(2)根据(1)中所选择的模型,求y关于x的经验回归方程及同批次产品生产数量为25吨时y的预测值.
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归直线y=bx+a的斜率和截距的最小二乘估计分别为
eq \(b,\s\up6(^))=, eq \(a,\s\up6(^))= eq \x\t(y)- eq \(b,\s\up6(^)) eq \x\t(x).
解:(1)应该选择模型②.理由如下:
由题意可知,R22>R12,则模型②中样本数据的残差平方和比模型①中样本数据的残差平方和小,即模型②的拟合效果更好.
(2)令t=1x,则成本费y与t可用一元线性回归模型来拟合,有y=dt+c.
由已知可得 eq \(d,\s\up6(^))== eq \f(4,0.04)=100,
所以 eq \(c,\s\up6(^))= eq \x\t(y)- eq \(d,\s\up6(^)) eq \x\t(t)=10-100×0.08=2,
则y关于t的经验回归方程为y=100t+2,
即成本费y与同批次产品生产数量x的非线性经验回归方程为y=100x+2.
当x=25时,y=10025+2=6,
所以同批次产品生产数量为25吨时,y的预测值为6万元/吨.
残差分析
【例4】(2024·衡水模拟)某新能源汽车生产公司,为了研究某生产环节中两个变量x,y之间的相关关系,统计样本数据得到如下表格:
由表格中的数据可以得到y关于x的经验回归方程为y=0.25x+a,据此计算,下列选项中残差的绝对值最小的样本数据是( )
A.(30,4.6)B.(27,3)
C.(25,3)D.(23,2.4)
C 解析:由表中数据可得
x=15×(20+23+25+27+30)=25,y=15×(2+2.4+3+3+4.6)=3.
由y关于x的经验回归方程为y=0.25x+a,过样本点中心(x,y),
可得3=0.25×25+a,解得a=-3.25,
故y关于x的经验回归方程为y=0.25x-3.25.
对于A,当x=30时,y=0.25×30-3.25=4.25,
残差的绝对值为|4.6-4.25|=0.35;
对于B,当x=27时,y=0.25×27-3.25=3.5,
残差的绝对值为|3-3.5|=0.5;
对于C,当x=25时,y=0.25×25-3.25=3,
残差的绝对值为|3-3|=0;
对于D,当x=23时,y=0.25×23-3.25=2.5,
残差的绝对值为|2.4-2.5|=0.1.
关于残差分析
(1)通过残差分析发现原始数据中的可疑数据.
(2)判断所建立模型的拟合效果.残差平方和越小,拟合效果越好;反之拟合效果越差.
小王经营了一家酒店,去年经营状况逐步向好,该店各个月的营业收入y(单位:万元)随月份x的变化统计如下:
其中第4个月和第6个月的数据由于某种原因造成模糊,但知道7天的营业收入平均值是23.已知营业收入y与月份x可以用经验回归方程y=bx+a拟合,且第7个月的残差是-0.6,则a+b的值是( )
A.10.4B.6.2
C.4.2D.2
A 解析:由残差ei=yi-yi,得-0.6=35-y7,
即y7=35.6,
所以35.6=7b+a①.
又x=17×(1+2+3+4+5+6+7)=4,y=23,
由经验回归直线y=bx+a经过样本点中心(x,y),
得23=4b+a②.
联立①②,解得a=6.2,b=4.2,
所以a+b=10.4.
课时质量评价(五十九)
1.下列有关线性回归的说法,不正确的是( )
A.具有相关关系的两个变量不是因果关系
B.散点图能直观地反映数据的相关程度
C.经验回归直线最能代表线性相关的两个变量之间的关系
D.任何一组数据都有经验回归方程
D 解析:根据两个变量具有相关关系的概念,可知A正确;
散点图能直观地描述呈相关关系的两个变量的相关程度,且经验回归直线最能代表它们之间的线性相关关系,所以B,C正确;
具有相关关系的成对样本数据才有经验回归方程,所以D不正确.
2.对两个变量x,y进行线性回归分析,计算得到样本相关系数r=-0.996 2,则下列说法中正确的是( )
A.x与y正相关
B.x与y具有较强的线性相关关系
C.x与y几乎不具有线性相关关系
D.x与y的线性相关关系还需进一步确定
B 解析:因为样本相关系数r=-0.996 2,所以x与y负相关.因为|r|=0.996 2,非常接近1,所以线性相关性很强.故选B.
3.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10 °C至40 °C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A.y=a+bxB.y=a+bx2
C.y=a+bexD.y=a+b ln x
4.某供电公司为了分析本地某小区的用电量y(单位:kW·h)与气温x(单位:°C)之间的关系,随机统计了4天的用电量与当天的气温,这两者之间的对应关系如下表:
若上表中的数据可用经验回归方程y=-2x+b(b∈R)来预测,则当气温为-4 °C时,该小区相应的用电量约为 kW·h.
68 解析:由表中数据可得x=18+13+10−14=10,y=24+34+38+644=40,
则将(10,40)代入经验回归方程可得,40=-20+b,得b=60,
则经验回归方程为y=-2x+60.
当x=-4时,y=-2×(-4)+60=68.故当气温为-4 ℃时,该小区相应的用电量约为68 kW·h.
5.新能源汽车的核心部件是动力电池,电池占了整车成本的很大一部分,而其中的原材料碳酸锂又是电池的主要成分.从2020年底开始,碳酸锂的价格不断升高,下表是2022年某企业的前5个月碳酸锂的价格y(单位:万元/千克)与月份x的统计数据.
根据表中数据,得出y关于x的经验回归方程为y=0.28x+a,根据数据计算出在样本点(5,1.5)处的残差为-0.06,则表中m= .
1.4 解析:由题可知,当x=5时,有1.5-y=1.5-(0.28×5+a)=-0.06,解得a=0.16.
又x=1+2+3+4+55=3,
y=0.5+0.6+1+m+1.55=3.6+m5,
且经验回归直线过样本点的中心(x,y),所以0.28×3+0.16=3.6+m5,解得m=1.4.
6.(多选题)某工厂为了研究某种产品的产量x(单位:吨)与所需某种材料的用量y(单位:吨)之间的相关关系,在生产过程中收集了4组数据如表所示.根据表中数据可得经验回归方程为y=0.78x+a,则下列四个说法中正确的为( )
A.变量x与y正相关
B.y与x的样本相关系数r0,故A正确,B错误;
由表格数据可得x=3+4+6+74=5,y=2.5+3+4+5.94=3.85,
则0.78×5+a=3.85,解得a=-0.05,故C正确;
经验回归方程为y=0.78x-0.05,
当x=8时,y=0.78×8-0.05=6.19,
即产量为8吨时,预测所需材料约为6.19吨,故D正确.
7.(能力创新)某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月的广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:
他们用两种模型①y=bx+a,②y=aebx分别进行拟合,得到相应的经验回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值.
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由.
(2)残差绝对值大于2的数据被认为是异常数据,需要剔除.
①剔除异常数据后,求出(1)中所选模型的经验回归方程;
②当广告投入量x=18时,(1)中所选模型收益的预测值是多少?
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归方程y=bx+a的斜率和截距的最小二乘估计分别为 eq \(b,\s\up6(^))==, eq \(a,\s\up6(^))= eq \x\t(y)- eq \(b,\s\up6(^)) eq \x\t(x).
解:(1)应该选择模型①,因为模型①的残差点比较均匀地落在以横轴为对称轴的水平带状区域中,且模型①的带状区域比模型②的带状区域窄,所以模型①的拟合精度更高,经验回归方程的预测精度高.
(2)①剔除异常数据,即3月份的数据后,得
x'=15×(7×6-6)=7.2,
y'=15×(30×6-31.8)=29.64,
=1 464.24-6×31.8=1 273.44,
=364-62=328,
所以 eq \(b,\s\up6(^))=
=1 273.44−5×7.2×29.64328−5×7.22
=206.468.8=3,
a=y'-K000bx'=29.64-3×7.2=8.04.
所以y关于x的经验回归方程为y=3x+8.04.
②把x=18代入①中所求经验回归方程得
y=3×18+8.04=62.04.
故收益的预测值为62.04万元.
x
1
3
4
5
y
30
40
60
50
气温/℃
18
13
10
-1
用电量/(kW·h)
24
34
38
64
月份序号
1
2
3
4
5
6
xi
10.5
10.9
11
11.5
12
12.5
yi
2.2
2
1.9
1.8
1.5
1.4
使用时间t/年
1
2
3
4
5
磨损指数r/%
4.5
5.6
6.4
6.8
7.2
x
1
2
3
4
5
y
0.5
1
1.5
3
5.5
x
1
2
3
4
5
z=ln y
-0.7
0
0.4
1.1
1.7
x
1
2
3
4
5
y
0.5
1
1.5
3
5.5
y
0.51
0.91
1.65
2.97
5.37
xi
20
23
25
27
30
yi
2
2.4
3
3
4.6
x
1
2
3
4
5
6
7
y
11
13
18
※
28
※
35
气温x/°C
18
13
10
-1
用电量y/(kW·h)
24
34
38
64
月份代码x
1
2
3
4
5
碳酸锂价格y/(万元/千克)
0.5
0.6
1
m
1.5
x/吨
3
4
6
7
y/吨
2.5
3
4
5.9
月份
1
2
3
4
5
6
x/万元
2
4
6
8
10
12
y/万元
14.21
20.31
31.8
31.18
37.83
44.67
x
y
7
30
1 464.24
364
相关学案
这是一份人教A版普通高中数学一轮复习第二章第九节函数模型及其应用学案,共15页。
这是一份人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用学案设计,共25页。学案主要包含了典例解析等内容,欢迎下载使用。
这是一份高中数学人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用优秀导学案,共12页。学案主要包含了学习目标,自主学习,小试牛刀,经典例题,跟踪训练,当堂达标,参考答案等内容,欢迎下载使用。