搜索
    上传资料 赚现金
    英语朗读宝

    新教材同步备课2024春高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用8.2.1一元线性回归模型8.2.2第2课时回归分析及非线性回归模型教师用书新人教A版选择性必修第三册

    新教材同步备课2024春高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用8.2.1一元线性回归模型8.2.2第2课时回归分析及非线性回归模型教师用书新人教A版选择性必修第三册第1页
    新教材同步备课2024春高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用8.2.1一元线性回归模型8.2.2第2课时回归分析及非线性回归模型教师用书新人教A版选择性必修第三册第2页
    新教材同步备课2024春高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用8.2.1一元线性回归模型8.2.2第2课时回归分析及非线性回归模型教师用书新人教A版选择性必修第三册第3页
    还剩14页未读, 继续阅读
    下载需要10学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    新教材同步备课2024春高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用8.2.1一元线性回归模型8.2.2第2课时回归分析及非线性回归模型教师用书新人教A版选择性必修第三册

    展开

    第2课时 回归分析及非线性回归模型设某幼苗从观察之日起,第x天的高度为y cm,测得的一些数据如表所示:作出这组数的散点图近似描述y与x的关系,很显然,这些散点不在一条直线附近.你能求出这个函数模型吗?知识点1 残差及残差图(1)对于响应变量Y,通过观测得到的数据称为观测值.通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.残差是随机误差的估计结果.通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等.(2)作图时纵坐标为残差,横坐标可以选为样本编号,或解释变量的观测值等,这样作出的图形称为残差图.在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高.(3)残差分析:残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.知识点2 对模型刻画数据效果的分析(1)残差图法:在残差图中,如果残差比较均匀地集中在以横轴为对称轴的水平带状区域内,则说明经验回归方程较好地刻画了两个变量的关系.(3)决定系数R2法:可以用R2=来比较两个模型的拟合效果,R2越小,模型拟合效果越差,R2越大,模型拟合效果越好.决定系数R2的取值范围是什么?[提示] 0≤R2≤1.知识点3 非线性回归方程(1)非线性回归分析的思想研究两个变量的关系时,依据样本点画出散点图,从整体上看,如果样本点没有分布在某个带状区域内,就称这两个变量之间不具有线性相关关系,此时不能直接利用经验回归方程来建立两个变量之间的关系.(2)非线性经验回归方程当回归方程不是形如=x+(,∈R)时,称之为非线性经验回归方程.当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程来拟合数据,可通过变量代换,利用线性回归模型建立两个变量间的非线性经验回归方程.1.思考辨析(正确的画“√”,错误的画“×”)(1)残差平方和越接近0,线性回归模型的拟合效果越好. (  )(2)在画两个变量的散点图时,响应变量在x轴上,解释变量在y轴上. (  )(3)R2越小,线性回归模型的拟合效果越好. (  )(4)在残差图中,纵坐标为残差,横坐标可以选为样本编号. (  )[答案] (1)√ (2)× (3)× (4)√2.在两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的决定系数R2如下,其中拟合效果最好的模型是(  )A.模型1的决定系数R2为0.98B.模型2的决定系数R2为0.80C.模型3的决定系数R2为0.50D.模型4的决定系数R2为0.25A [R2越大拟合效果越好.]3.从某省“双一流”大学中随机选出8名女大学生,得到其身高x(单位:cm)与体重y(单位:kg)的数据如下表:若已知y与x的经验回归方程为=0.85x-85.71,则选取的女大学生身高为175 cm时,相应的残差为________kg.0.96 [当x=175 cm时,=0.85×175-85.71=63.04(kg),∴相应的残差=64-63.04=0.96(kg).] 类型1 残差与残差分析【例1】 (1)对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是(  )A        BC        D(2)已知一系列样本点(xi,yi)(i=1,2,3,…,n)的经验回归方程为=2x+,若样本点(r,1)与(1,s)的残差相同,则有(  )A.r=s        B.s=2rC.s=-2r+3 D.s=2r+1(1)A (2)C [(1)用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高.(2)样本点(r,1)的残差为1-2r-,样本点(1,s)的残差为s--2.依题意得1-2r--2,故s=-2r+3.] (1)残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,经验回归方程的预报精度越高.(2)残差是随机误差的估计值,i=yi-i.[跟进训练]1.两个线性相关变量x与y的统计数据如表所示:其经验回归方程是=x+40,则相对应于点(11,5)的残差为(  )A.0.1   B.0.2   C.0.3   D.0.4B [由于x+40过样本中心点(10,8),所以8=10=-3.2,因此=-3.2x+40.当x=11时,=-3.2×11+40=4.8,所以残差=5-4.8=0.2.]2.已知某成对样本数据的残差图如图,则样本点数据中可能不准确的是从左到右第________个.6 [原始数据中的可疑数据往往是残差绝对值过大的那个数据,即偏离平衡位置过大.] 类型2 残差平方和与决定系数R2【例2】 已知某种商品的价格x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:(1)求y关于x的经验回归方程;(2)借助残差平方和与R2说明回归模型拟合效果的好坏.[解] (1)=×(14+16+18+20+22)=18=×(12+10+7+5+3)=7.4,所以===-1.15,=7.4+1.15×18=28.1,所以所求经验回归方程是=-1.15x+28.1.(2)列出残差表为所以回归模型的拟合效果很好. 刻画回归效果的三种方法(1)残差图法:残差点比较均匀地落在水平带状区域内说明选用的模型比较合适.(3)决定系数R2法:R2=1-越接近1,表明模型的拟合效果越好.[跟进训练]3.为研究质量x(单位:g)对弹簧长度y(单位:cm)的影响,对不同质量的6个物体进行测量,数据如表所示:(1)作出散点图并求经验回归方程;(2)求出R2并说明回归模型拟合的程度;(3)进行残差分析.[解] (1)散点图如图所示.样本点分布在一条直线附近,y与x具有线性相关关系.由表中数据,得=×(5+10+15+20+25+30)=17.5,=×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487计算得≈6.285.故所求经验回归方程为=6.285+0.183x.(2)列表如下:所以R2=1-≈0.999 1,回归模型的拟合效果较好.(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在宽度不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与所挂物体的质量成线性关系. 类型3 非线性回归分析【例3】 为了研究某种细菌随时间x变化,繁殖的个数y的变化,收集数据如表所示:(1)用天数作解释变量,繁殖个数作响应变量,作出这些数据的散点图,根据散点图判断:=+x与y=c1哪一个作为繁殖的个数y关于时间x变化的回归方程类型为最佳?(给出判断即可,不必说明理由)(2)根据(1)的判断最佳结果及表中的数据,建立y关于x的回归方程.[解] (1)作出散点图,如图1所示.由散点图看出样本点分布在一条指数函数y=c1.(2)令z=ln y,则x+.相应的散点图如图2.从图2可以看出,变换后的样本点分布在一条直线附近,因此可以用经验回归方程来拟合.a==0.69x+1.115,则有y=e0.69x+1.115.[母题探究](变设问)在本例条件不变的情况下,试估计第7天细菌繁殖个数.[解] ∵=e0.69x+1.115,∴当x=7时,≈382(个),即第7天细菌繁殖个数约为382个. 解决非线性回归问题的方法及步骤(1)确定变量:确定解释变量为x,响应变量为y.(2)画散点图:通过观察散点图并与学过的函数(幂、指数、对数函数、二次函数)作比较,选取拟合效果好的函数模型.(3)变量置换:通过变量置换把非线性回归问题转化为线性回归问题.(4)分析拟合效果:通过计算决定系数等来判断拟合效果.(5)写出非线性回归方程.提醒:当数据量较大时,可采用计算器或者数学软件来求回归方程.[跟进训练]4.(源自湘教版教材)实验中获得了某化学品的化学反应时间和转化率的数据如表,试建立转化率y关于反应时间x的回归方程(结果保留三位小数).[解] 根据收集的数据作散点图(图1).观察散点图可知,样本点并没有分布在某条直线附近,因而变量y与x之间没有明显的线性相关关系,所以不能直接利用线性回归模型来刻画这两个变量之间的关系.根据已有的数学知识,可以认为样本点分布在指数曲线y=c1的附近,其中c1和c2是待定参数. 为估计参数c1和c2,在y=c1的两端取对数,得到ln y=ln c1+c2x.再令z=ln y,a=ln c1,b=c2,则得到直线方程z=bx+a.将题表中的数据进行代换,得到的数据见下表.图2是根据上表中数据作出的散点图.从图2中可以看出,变换后的样本点分布在一条直线的附近,说明z和x之间具有线性相关关系,因此可以用线性回归方程来拟合.对上表中的数据,用最小二乘法可得线性回归方程为=0.019x+0.686.再利用y=ez可得到转化率y关于反应时间x的非线性回归方程为=e0.686·e0.019x≈1.986e0.019x.1.下面四个残差图中,可以满足一元线性回归模型中对随机误差的假定的是(  )A        BC        DA [由残差图显示的分布情况即可看出,图A显示的残差分布比较集中,且成带状分布,满足一元线性回归模型中对随机误差的假定.]2.下列说法错误的是(  )A.残差点分布的带状区域越窄,回归方程的拟合效果越好B.残差平方和越小,决定系数R2越大C.决定系数R2可以大于1D.通过经验回归方程得到的预报值是响应变量的可能取值的平均值,不一定是响应变量的精确值C [由R2的计算公式,知B正确,C错误;A,D均正确.]3.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性作试验,并用回归分析的方法分别求得相关系数r与残差平方和m如表:则________同学的试验结果体现了A,B两变量更强的线性相关性.丁 [由题表可知,丁同学的相关系数r最大且残差平方和m最小,故丁同学的试验结果体现了A,B两变量更强的线性相关性.]4.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条曲线y=ebx+a的周围,令z=ln y,求得经验回归方程为=0.25x-2.58,则该模型的经验回归方程为________.=e0.25x-2.58 [由=e0.25x-2.58.]回顾本节知识,自主完成以下问题:1.对模型刻画数据效果的分析有哪些常见方法?[提示] 残差图法,残差平方和法和R2法.2.决定系数R2与相关系数r一样吗?[提示] 在含有一个解释变量的线性回归模型中,决定系数R2恰好等于相关系数r的平方.在线性回归模型中有0≤R2≤1,因此R2和两个变量的相关系数r都能刻画用线性回归模型拟合数据的效果.|r|越大,R2就越大,线性回归模型拟合数据的效果就越好.课时分层作业(二十一) 回归分析及非线性回归模型一、选择题1.下列四个残差图中回归模型的拟合效果最好的是(  )A        BC        DB [B选项显示的残差分布比较集中,且成窄带状分布,满足一元线性回归模型中对随机误差的假定.]2.甲、乙、丙、丁四位同学各自对A,B两变量做回归分析,分别得到散点图与试验结果体现拟合A,B两变量关系的模型拟合精度高的同学是(  )A.甲   B.乙   C.丙   D.丁D [残差平方和越小,拟合效果越好.]3.若对于变量x,y的10组统计数据的回归模型中,计算得R2=0.95,又知残A.241.1 B.245.1C.2 411 D.2 451C [由题意知残差平方和又R2=1-4.若一函数模型为y=sin2α+2sin α+1,为将y转化为t的线性经验回归方程,则需作变换t等于(  )A.sin2α B.(sin α+1)2C.sin2α+1 D.以上都不对B [因为y是关于t的线性经验回归方程,实际上即y是关于t的一次函数,又因为y=(sin α+1)2,若令t=(sin α+1)2,则可得y与t的函数关系式为y=t,此时变量y与变量t是线性相关关系.]5.某同学将收集到的六组数据(xi,yi)(i=1,2,3,4,5,6)制成如图所示的散点图,并通过计算得到其经验回归直线l1的方程为y=0.68x+,其样本相关系数为r1,决定系数为.经过残差分析确定点F为“离群点”(对应残差过大的点),把它去掉后,再利用剩下的五组数据计算得到其经验回归直线l2的方程为=x+0.68,其样本相关系数为r2,决定系数为.则以下结论中不正确的是(  ) B.C.=0.12 D.00,且r10.9,则认为回归模型拟合效果良好)=-R2=1-[解] (1)由题中表格数据可得=4=5则==0.08,故=1.23x+0.08.(2)设i=yi-i,所以1=-0.34,2=0.03,3=0.5,4=0.27,5=-0.46,则残差表如表所示,=(2.2-5)2+(3.8-5)2+(5.5-5)2+(6.5-5)2+(7-5)2=15.78,所以R2=1-≈0.96>0.9,所以该线性回归模型的拟合效果良好.10.以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=ln y,将其变换后得到经验回归方程z=0.2x+3,则c,k的值分别是 (  )A.e2,0.6 B.e2,0.3C.e3,0.2 D.e4,0.6C [因为y=cekx,所以等式两边同时取对数可得ln y=ln (cekx)=ln c+ln ekx=kx+ln c.因为z=ln y,所以上式可化为z=kx+ln c.因为z=0.2x+3,则k=0.2,ln c=3,所以c=e3,k=0.2.]11.某种产品的广告支出费用x(单位:万元)与销售量y(单位:万件)之间的对应数据如表所示:根据表中的数据可得经验回归方程=2.27x-1.08,R2≈0.96,以下说法正确的是(  )A.第三个样本点对应的残差3=-1,回归模型的拟合效果一般B.第三个样本点对应的残差3=1,回归模型的拟合效果较好C.销售量y的多少有96%是由广告支出费用引起的D.销售量y的多少有4%是由广告支出费用引起的C [由题意得3=7-(2.27×4-1.08)=-1,由于R2≈0.96,所以该回归模型拟合的效果比较好,故A,B错误;在线性回归模型中,R2表示解释变量对于响应变量的贡献率,R2≈0.96,则销售量y的多少有96%是由广告支出费用引起的,C正确,D错误.]12.已知变量y关于x的非线性经验回归方程为=,其一组数据如表所示:若x=5,则预测y的值可能为(  )A.e5 B. C.e7 D.D [将式子两边取对数,得到ln x-0.5,令x-0.5,列出x,的取值对应的表格如下:则==2.5==3.5,∵(x-0.5,∴3.5=×2.5-0.5,解得=1.6,∴=e1.6x-0.5,当x=5时,=e1.6×5-0.5=.]13.某机构统计了某市5个地区的外来务工人员数与他们选择留在当地过年的人数占比,得到如下的表格:根据这5个地区的数据求得留在当地过年人员数y与外来务工人员数x的经验回归方程为=0.813 5x+.该市对外来务工人员中选择留在当地过年的人员每人补贴1 000元,该市F区有10 000名外来务工人员,根据经验回归方程估计F区需要给外来务工人员中选择留在当地过年的人员的补贴总额为________万元.(参考数据:0.813 5×36≈29.29)818.6 [由题意得,==3 600,==2 980,因为经验回归直线一定过样本的中心点(),所以2 980=0.813 5×3 600+=0.813 5x+51.当x=10 000时,=0.813 5×10 000+51=8 186,所以估计补贴总额为8 186×0.1=818.6(万元).]14.耐盐碱水稻俗称“海水稻”,是一种可以长在滩涂和盐碱地的水稻.海水稻的灌溉是将海水稀释后进行灌溉.某试验基地为了研究海水浓度x(‰)对亩产量y(吨)的影响,通过在试验田的种植实验,测得了某种海水稻的亩产量与海水浓度的数据如表.绘制散点图发现,可用线性回归模型拟合亩产量y与海水浓度x之间的相关关系,用最小二乘法计算得y与x之间的经验回归方程为y=x+0.88.(1)求,并估计当浇灌海水浓度为8‰时该品种的亩产量;(2)①完成上述残差表;②统计学中常用决定系数R2来刻画回归效果,R2越大,模型拟合效果越好,如假设R2=0.8,就说明预报变量y的差异有80%是由解释变量x引起的.请计算决定系数R2(精确到0.01),并指出亩产量的变化多大程度上是由海水浓度引起的?附:残差公式i=yi-i,决定系数.[解] (1)经计算=5=0.48,由0.48=5=-0.08,当x=8时,=-0.08×8+0.88=0.24,所以当浇灌海水浓度为8‰时,该品种的亩产量约为0.24吨.(2)①由(1)知=-0.08x+0.88,从而有②R2=1-=1-=≈0.98,所以亩产量的变化有98%是由海水浓度引起的.15.已知某地区某种昆虫产卵数和温度有关,现收集了一只该品种昆虫的产卵数y(个)和温度x(℃)的7组观测数据,其散点图如图所示:根据散点图,结合函数知识,可以发现产卵数y和温度x可用方程y=ebx+a来拟合,令z=ln y,结合样本数据可知:z与温度x可用经验回归方程来拟合.根据收集到的数据,计算得到如下值:(1)求z关于温度x的经验回归方程(回归系数结果精确到0.001);(2)求产卵数y关于温度x的经验回归方程;若该地区一段时间内的气温在26 ℃~36 ℃之间(包括26 ℃与36 ℃),估计该品种一只昆虫的产卵数的范围.(参考数据:e3.282≈27,e3.792≈44,e5.832≈341,e6.087≈440,e6.342≈568)附:对于一组数据(ω1,v1),(ω2,v2),…,(ωn,vn),其经验回归方程=+ω的斜率和截距的最小二乘估计分别为[解] (1)由z和温度x可以用经验回归方程拟合,设,=3.537-0.255×27=-3.348.∴z关于x的经验回归方程为=0.255x-3.348.(2)由(1)可得ln y=0.255x-3.348,于是产卵数y关于温度x的经验回归方程为=e0.255x-3.348.当x=26时,=e0.255×26-3.348=e3.282≈27;当x=36时,=e0.255×36-3.348=e5.832≈341.∵函数=e0.255x-3.348单调递增,∴气温在26 ℃~36 ℃之间时,该品种一只昆虫的产卵数的估计范围是[27,341]内的正整数. 学习任务1.了解残差、残差图的概念.(数学抽象)2.会通过分析残差和利用R2判断回归模型的拟合效果.(数学运算、数据分析)3.了解非线性回归模型,掌握对数函数模型、指数函数模型和幂函数模型的求解过程.(数学运算、数学建模)第x天14916253649高度y/cm0479111213x165165157170175165155170y4857505464614359x99.51010.511y1110865x1416182022y1210753yi-i00.3-0.4-0.10.2yi-4.62.6-0.4-2.4-4.4x51015202530y7.258.128.959.9010.911.8yi-i0.050.005-0.08-0.0450.040.025yi--2.237-1.367-0.5370.4131.4132.313天数x/天123456繁殖个数y/个6122549951903.562.833.5317.5596.50512.04x123456z1.792.483.223.894.555.25时间x/min6080100120140150160170转化率y/%6.139.9915.0220.9231.1138.8547.2555.05x6080100120140150160170z (=ln y)1.8132.3022.7093.0413.4383.6603.8554.008甲乙丙丁r0.820.780.690.85m106115124103甲乙丙丁散点图残差平方和115106124103x23456y2.23.85.56.57.0x23456yi-ix23456yi-i-0.340.030.50.27-0.46广告支出费用x2.22.64.05.35.9销售量y3.85.47.011.612.2x1234yee3e4e6x12341346地区A区B区C区D区E区外来务工人员数5 0004 0003 5003 0002 500留在当地过年的人数占比80%90%80%80%84%海水浓度xi/‰34567亩产量yi/吨0.620.580.490.40.31残差i海水浓度xi(‰)34567亩产量yi(吨)0.620.580.490.40.31残差i-0.020.020.010-0.0127743.53718211.946.418

    精品成套资料

    人教A版 (2019)选择性必修 第三册
    • 课件
    • 教案
    • 试卷
    • 学案
    • 其他
    欢迎来到教习网
    • 900万优选资源,让备课更轻松
    • 600万优选试题,支持自由组卷
    • 高质量可编辑,日均更新2000+
    • 百万教师选择,专业更值得信赖
    微信扫码注册
    qrcode
    二维码已过期
    刷新

    微信扫码,快速注册

    手机号注册
    手机号码

    手机号格式错误

    手机验证码 获取验证码

    手机验证码已经成功发送,5分钟内有效

    设置密码

    6-20个字符,数字、字母或符号

    注册即视为同意教习网「注册协议」「隐私条款」
    QQ注册
    手机号注册
    微信注册

    注册成功

    返回
    顶部
    Baidu
    map