还剩12页未读,
继续阅读
所属成套资源:2025届高考数学一轮复习教师用书多份(Word附解析)
成套系列资料,整套一键下载
2025届高考数学一轮复习教师用书第十章第三节变量的相关性与一元线性回归模型讲义(Word附解析)
展开
第三节 变量的相关性与一元线性回归模型【必备知识·逐点夯实】【知识梳理·归纳】1.变量的相关关系(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.(2)相关关系的分类:正相关和负相关.(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.【微点拨】散点图是描述成对数据之间关系的一种直观方法,观察散点图可以大致看出两个变量的相关关系.2.样本相关系数(1)样本相关系数(2)样本相关系数r的取值范围为[-1,1],是一个描述成对样本数据的数字特征,它的正负性可以反映成对样本数据的变化特征,它的绝对值大小可以反映成对样本数据之间线性相关的程度:①当r>0时,成对样本数据正相关;②当r<0时,成对样本数据负相关.③当|r|越接近1时,成对样本数据的线性相关程度越强;④当|r|越接近0时,成对样本数据的线性相关程度越弱.3.经验回归模型我们将=x+称为Y关于x的经验回归方程,其中=y-x.4.对模型刻画数据效果的分析(1)残差图法在残差图中,如果残差比较均匀地集中在以横轴为对称轴的水平带状区域内,则说明经验回归方程较好地刻画了两个变量的关系.(2)残差平方和法残差平方和越小,模型的拟合效果越好.(3)决定系数R2法可以用决定系数来比较两个模型的拟合效果,R2越大,模型的拟合效果越好,R2越小,模型的拟合效果越差.【基础小题·自测】1.(多维辨析)(多选题)下列结论正确的有 ( )A.相关关系是一种非确定性关系B.散点图是判断两个变量相关关系的一种重要方法和手段C.经验回归直线=x+至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点D.样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强【解析】选ABD.由相关关系的定义可知:相关关系是一种非确定性关系,所以选项A正确;因为散点图是描述成对数据之间关系的一种直观方法,观察散点图可以大致看出两个变量的相关关系,所以选项B正确;由经验回归方程=x+过点(x,y)知,不一定过样本数据,所以选项C错误;由相关系数的大小与样本相关关系可知,选项D正确.2.(选修第三册P101例1改编)对于x,y两个变量,有四组成对样本数据,分别算出它们的样本相关系数r如下,则线性相关性最强的是 ( )A.-0.82 B.0.78 C.-0.69 D.0.87【解析】选D.由样本相关系数的绝对值|r|越接近1,变量间的线性相关性越强知,各选项中r=0.87的绝对值最接近1.3.(选修第三册P103习题1改编)根据所示的散点图,下列说法正确的是 ( )A.身高越高,体重越大B.身高越高,体重越小C.身高和体重呈正相关D.身高和体重呈负相关【解析】选C.根据散点图的分布可得:身高和体重呈正相关.4.(误认为经验回归直线过样本点)某互联网公司借助某平台推广自己的产品,对今年前5个月的月平台推广费用x(单位:百万元)与月利润额y(单位:百万元)进行了初步统计,得到下列表格中的数据:经计算,月平台推广费用x与月利润额y满足经验回归方程=6.5x+17.5,则p的值为 ( )A.50 B.56.5 C.60 D.70【解析】选A.由于经验回归直线过样本点的中心,x=5,y=200+p5,代入经验回归方程得200+p5=6.5×5+17.5,解得p=50.【核心考点·分类突破】考点一 成对数据的相关性[例1](1)(2023·天津高考)调查某种花萼长度和花瓣长度,所得数据如图所示,其中相关系数r=0.824 5,下列说法正确的是 ( )A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈现负相关C.花瓣长度和花萼长度呈现正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.824 5【解析】选C.因为相关系数r=0.824 5>0.75,且题中散点图呈左下角到右上角的带状分布,所以花瓣长度和花萼长度呈现正相关.若从样本中抽取一部分,则这部分的相关系数不一定是0.824 5.(2)(多选题)对于样本相关系数,下列说法正确的有 ( )A.样本相关系数可以用来判断成对样本数据相关的正负性B.样本相关系数可以是正的,也可以是负的C.样本相关系数r∈[-1,1]D.样本相关系数越大,成对样本数据的线性相关程度也越强【解析】选ABC.因为样本相关系数大于0,说明成对样本数据正相关,样本相关系数小于0,说明成对样本数据负相关,所以选项A正确;由样本相关系数公式可知:样本相关系数r∈[-1,1],所以选项B,C正确;样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强,故D错误.【解题技法】判断相关关系的两种方法(1)散点图法:如果所有的样本点都落在某条曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.(2)相关系数法:利用相关系数判定,|r|越趋近于1,相关性越强.【对点训练】1.对四组不同的数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,下列正确的是 ( )A.r20,r3>0,图②与图④中的两个变量是负相关,故r2<0,r4<0,又图①与图②中的样本点集中在一条直线附近,所以r20,>0 B.>0,<0C.<0,>0 D.<0,<0【解析】选B.由已知数据可知y随着x的增大而减小,则变量x和y之间存在负相关关系,所以<0.又x=15×(3+4+5+6+7)=5,y=15×(3.5+2.4+1.1-0.2-1.3)=1.1,即1.1=5+,所以=1.1-5>0.2.某智能机器人的广告费用x(万元)与销售额y(万元)的统计数据如表所示:根据此表可得经验回归方程为=5x+,据此模型预测广告费用为8万元时,销售额为________万元. 【解析】由题中表格,得x=2+3+5+64=4,y=28+31+41+484=37,所以37=5×4+,即=17,所以预测当广告费用为8万元时,销售额为5×8+17=57(万元).答案:57角度2 非线性回归模型及其应用[例3]某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成,每件产品的非原料成本y(元)与生产该产品的数量x(千件)有关,经统计得到如下数据:根据以上数据,绘制了散点图.参考数据:(其中ui=1xi)参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归方程=+u的斜率和截距的最小二乘估计分别为(1)观察散点图判断,y=a+bx与y=c+dx哪一个适宜作为非原料成本y与生产该产品的数量x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y与x的回归方程.(3)试预测生产该产品10 000件时每件产品的非原料成本.【解析】(1)由散点图可知,y=a+bx适宜作为非原料成本y与生产该产品的数量x的回归方程类型;(2)令u=1x,则y=a+bu,=y-u=3608-100×0.34=11,所以=11+100u=11+100x;(3)当x=10(千件)时,=11+10010=21(元).故预测生产该产品10 000件时每件产品的非原料成本为21元.【解题技法】非线性回归分析的步骤【对点训练】1.(2023·郑州模拟)用模型y=aebx+1(a>0)拟合一组数据时,令z=ln y,将其变换后得到经验回归方程=2x+,则ba= ( )A.e B.1e C.12 D.2【解析】选D.对y=aebx+1(a>0)两边同时取对数,则ln y=ln (aebx+1)=ln a+bx+1,令z=ln y,则z=bx+ln a+1,所以b=2,a=lna+1⇒b=2,a=1,所以ba=2.2.已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y=2e2x+1的图象附近,设z=ln y,将其变换后得到经验回归方程为=x+,则mn=________. 【解析】由z=ln y,则ln y=ln 2e2x+1 ,即z=ln 2+ln e2x+1 =ln 2+2x+1,则z=2x+ln 2+1,故m=2,n=ln 2+1,所以mn=2ln 2+2.答案:2ln 2+2考点三 残差分析[例4](1)(多选题)下列说法正确的是 ( )A.在经验回归方程=-0.85x+2.3中,当解释变量x每增加1个单位时,响应变量平均减少2.3个单位B.在经验回归方程=-0.85x+2.3中,相对于样本点(1,1.2)的残差为-0.25C.在残差图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好D.若两个变量的决定系数R2越大,表示残差平方和越小,即模型的拟合效果越好【解析】选BCD.对于A,根据经验回归方程,当解释变量x每增加1个单位时,响应变量平均减少0.85个单位,故A错误;对于B,当解释变量x=1时,响应变量=1.45,则样本点(1,1.2)的残差为-0.25,故B正确;对于C,在残差图中,残差分布的水平带状区域的宽度越窄,说明拟合精度越高,即拟合效果越好,故C正确;对于D,由决定系数R2的意义可知,R2越大,表示残差平方和越小,即模型的拟合效果越好,故D正确.(2)新能源汽车的核心部件是动力电池,电池占了新能源整车成本的很大一部分,而其中的原材料碳酸锂又是电池的主要成分.从2020年底开始,碳酸锂的价格不断升高,下表是2022年某企业的前5个月碳酸锂的价格与月份的统计数据:根据表中数据,得出y关于x的经验回归方程为=0.28x+,根据数据计算出在样本点(5,1.5)处的残差为-0.06,则表中m=________. 【解析】由题设,1.5-=1.5-(0.28×5+)=-0.06,可得=0.16.又x=1+2+3+4+55=3,y=0.5+0.6+1+m+1.55=3.6+m5,所以0.28×3+0.16=3.6+m5,可得m=1.4.答案:1.4【解题技法】检验回归模型的拟合效果的两种方法(1)残差分析:通过残差分析发现原始数据中的可疑数据,判断所建立模型的拟合效果.(2)R2分析:通过公式计算R2,R2越大,残差平方和越小,模型的拟合效果越好;R2越小,残差平方和越大,模型的拟合效果越差.【对点训练】色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得数据列于表中,已知该产品的色度y和色差x之间满足线性相关关系,且=0.8x+,现有一对测量数据为(30,23.6),则该数据的残差为 ( )A.-0.96 B.-0.8 C.0.8 D.0.96【解析】选C.由题意可知,x=21+23+25+274=24,y=15+18+19+204=18,将(24,18)代入=0.8x+,即18=0.8×24+,解得=-1.2,所以=0.8x-1.2,当x=30时,=0.8×30-1.2=22.8,所以该数据的残差为23.6-22.8=0.8.【课程标准】1.结合实例,了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系.2.结合实例,会通过相关系数比较多组成对数据的相关性.3.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.4.针对实际问题,会用一元线性回归模型进行预测.【考情分析】考点考法:高考命题常以现实生活为载体,考查样本相关系数、一元线性回归方程、非线性回归方程;一元线性回归方程是高考热点,三种题型都会出现.核心素养:数学抽象、数据分析、数学运算类型辨析改编易错题号12,34x24568y304060p70月份123456人均销售额658347利润率(%)12.610.418.53.08.116.3年份编号x12345年份20182019202020212022数量y/个37104147196226x34567y3.52.41.1-0.2-1.3广告费用x(万元)2356销售额y(万元)28314148x12345678y1126144.53530.5282524月份代码x12345碳酸锂价格y(万元/kg)0.50.61m1.5色差x21232527色度y15181920
相关资料
更多