高中数学人教版新课标A选修1-21.1回归分析的基本思想及其初步应用多媒体教学课件ppt
展开【自主预习】 1.回归分析(1)概念:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(2)步骤:画_______→求_________→用回归方程进行_____.
2.线性回归模型(1)在线性回归方程 = + x中, =____________=___________, =______,其中 =_______, =_______, ( , )称为变量_____________,回归直线过样本点的中心.
(2)线性回归模型y=bx+a+e,其中e称为_________,自变量x称为_____变量,因变量y称为_____变量.
3.刻画回归效果的方式
【即时小测】1.对于两个变量x,y,若当x取一定值时,y的取值具有一定的随机性,x,y之间的这种非确定性关系叫做( )A.函数关系 B.线性相关C.相关关系D.回归分析【解析】选C.根据相关关系的定义知选C.
2.散点图在回归分析过程中的作用是( )A.统计个体个数B.比较个体数据的大小C.研究个体分类D.粗略判断变量是否线性相关【解析】选D.根据散点图的意义及作用知选D.
3.在建立两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的相关指数R2如下,其中拟合效果最好的模型是( )A.模型1的相关指数R2=0.98B.模型2的相关指数R2=0.80C.模型3的相关指数R2=0.50D.模型4的相关指数R2=0.25
【解析】选A.因为回归模型的相关指数R2的值越大,拟合效果越好.
4.已知回归方程 =2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和等于________.【解析】(4.9-5)2+(7.1-7)2+(9.1-9)2=0.03.答案:0.03
【知识探究】 探究点1 线性回归分析1.相关关系是确定性关系吗?提示:相关关系是一种不确定性的关系.
2.具有线性相关关系的两个变量,其散点图具有什么特征?提示:散点图中的点大部分分布在一个带形区域内.即分布在某条直线的附近.
【归纳总结】对回归分析的三点说明(1)回归分析的前提是两个变量之间具有相关关系.(2)对两个变量之间数量变化进行一般关系的测定,确定一个相应的数学表达式,即线性回归方程,达到由一个已知量推测或控制另一个变量的值的目标,是统计的一个重要方法.
(3)线性回归方程是根据样本数据得到的一个确定性的函数关系,是用来对未知变量进行预测的,为了预测的效果更好,减小误差,应在求线性回归方程时尽量多地选取样本,选择代表性较强的样本,使得预测值尽量地接近真实值.
特别提醒:在对两个变量进行线性回归分析时,要首先结合观察数据画出散点图,确定它们之间具有线性相关关系后,再进行线性回归分析.
探究点2 非线性回归分析1.如何评价回归模型拟合效果的优劣?提示:计算相关指数R2的值.R2越接近于1效果就越好.2.对于非线性回归模型,如何处理?提示:对于非线性回归模型可转化为线性回归模型来研究.
【归纳总结】1.数据拟合效果的比较对于给定的样本点(x1,y1),(x2,y2),…,(xn,yn),两个含有未知参数的模型
(1) 和(2) 其中a和b都是未知参数,可以按如下的步骤来比较它们的拟合效果:
①分别建立对应于两个模型的回归方程 =f(x, )与 =g(x, ),其中 和 分别是参数a和b的估计值.②分别计算模型(1)和模型(2)的R12,R22.③若R12>R22,则模型(1)的拟合效果比模型(2)好;若R12<R22,则模型(1)的拟合效果不如模型(2).
2.常见的几种变形形式(1)幂函数曲线y=axb.两边取对数变形为lny=lna+blnx,令y′=lny. x′=lnx,a′=lna,从而得到y′=a′+bx′.
(2)指数函数曲线y=aeb x.两边取对数变形为lny=lna+bx,令y′=lny,a′=lna,从而得到y′=a′+bx.
(3)负指数函数曲线y= 两边取对数变形为lny=lna+ ,令y′=lny,x′= ,a′=lna,得y′=a+bx′.(4)对数函数曲线y=a+blnx.令x′=lnx,得y=a+bx′.
类型一 线性回归模型【典例】1.(2016·东营高二检测)有下列说法:①线性回归分析就是由样本点去寻找一条直线方程,刻画这些样本点之间的关系的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性
相关表示;③通过线性回归方程 及其回归系数 ,可以估计和预报变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确说法的个数是( )A.1 B.2 C.3 D.4
2.(2014·湖北高考)根据如下样本数据得到的回归方程为 ,则( )
3.某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:(1)画出散点图.(2)求y关于x的回归方程.
【解题探究】1.典例1中,给定两个变量的一组样本点数据,都能进行线性回归分析吗?提示:不是,只有当它们具有线性相关关系时,才能进行线性回归分析,否则没有意义.
2.典例2中,回归直线方程中, , 的几何意义是什么?提示: 是回归直线的斜率. 是回归直线在y轴上的截距.
3.典例3中,画散点图的目的是什么?如何求关于x的回归直线方程?提示:画散点图的目的是分析变量x,y之间是否存在线性相关关系;利用最小二乘法求y关于x的回归直线方程.
【解析】1.选C.①反映的是最小二乘法思想,是正确的;②反映的是散点图的作用,是正确的;③反映的是求线性回归方程 的目的,也是正确的;④不正确,在求回归方程之前,必须进行相关性检验,以体现变量的相关关系.故有3个正确说法.
2.选A.由散点图及 , 的意义知A正确.3.(1)散点图如图所示.
(2)列出下表,并用科学计算器进行有关计算.
于是可得 =50-6.5×5=17.5.于是所求的回归方程是 =6.5x+17.5
【方法技巧】1.求线性回归方程的三个步骤(1)算:根据数据计算 (2)代:代入公式求 , 的具体数值.(3)求:由上面的计算结果求方程
2.求线性回归方程的关键点相关性的验证:求线性回归方程前必须判断两个变量是否线性相关,如果两个变量本身不具备相关关系,或者它们之间的相关关系不显著,那么即使求出回归方程也是毫无意义的.
特别提醒:回归直线一定过样本点的中心( , ),这在很多问题的求解中起着很重要的作用.
【变式训练】已知一个回归直线方程 =1.5x+45,xi∈{1,5,7,13,19},则 =( )A.53.5 B.55.5 C.58.5 D.60.5
【解析】选C.因为回归直线过样本点的中心( ),又 所以 =1.5 +45=1.5×9+45=58.5.
类型二 线性回归分析【典例】为研究质量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同质量的6个物体进行测量,数据如表所示:
(1)作出散点图,并求线性回归方程.(2)求出R2.(3)进行残差分析.【解题探究】本例中如何进行残差分析?提示:通过残差表或残差图进行残差分析.
【解析】(1)散点图如图所示.
因为 ×(5+10+15+20+25+30)=17.5, ×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487, =2275, =1076.2.计算得 ≈0.183, ≈6.285,所以所求线性回归方程为 =6.285+0.183x.
所以 所以 所以回归模型的拟合效果较好.
(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与质量成线性关系.
【延伸探究】1.在条件不变的情况下,画出残差图.【解析】如图所示:
2.当x=35时,估计y的值.【解析】当x=35时, =6.285+0.183×35=12.69.
【方法技巧】残差分析的思路(1)要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.(2)通过残差 来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这种分析工作称为残差分析,可以借助残差图来进行观察.
【补偿训练】对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是( )
【解析】选A.用残差图判断模型的拟合效果,残差点比较均匀地落在水平带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,拟合精度越高.故选A.
类型三 非线性回归分析【典例】电容器充电后,电压达到100V,然后开始放电,由经验知道,此后电压U随时间t变化的规律用公式U=Aebt(b<0)表示,现测得时间t(s)时的电压U(V)如下表:
试求电压U对时间t的回归方程.(提示:对公式两边取自然对数,把问题转化为线性回归分析问题)
【解题探究】本例中如何对等式“U=Aebt”变形,使其符合线性回归分析?提示:对U=Aebt两边取对数得lnU=lnA+bt,令y=lnU,a=lnA,x=t,则y=a+bx,进而借助线性回归分析求解,最后回代便可.
【解析】对U=Aebt两边取对数得lnU=lnA+bt,令y=lnU,a=lnA,x=t,则y=a+bx,得y与x的数据如下表:
根据表中数据作出散点图,如图所示,
从图中可以看出,y与x具有较强的线性相关关系,由表中数据求得 =5, ≈3.045,进而可以求得 ≈-0.313, =4.61,所以y对x的线性回归方程为y=4.61-0.313x.由y=lnU,得U=ey,U=e4.61-0.313x,因此电压U对时间t的回归方程为U=e4.61-0.313t.
【方法技巧】求非线性回归方程的步骤(1)确定变量,作出散点图.(2)根据散点图,选择恰当的拟合函数.(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程.
(4)分析拟合效果:通过计算相关指数或画残差图来判断拟合效果.(5)根据相应的变换,写出非线性回归方程.
【变式训练】若将函数y=axb转化为线性函数u=c+bv,则所作的变换是( )A.u=lny,v=lna,c=lnxB.u=lnx,v=lny,c=lnaC.u=lna,v=lnx,c=lnyD.u=lny,v=lnx,c=lna
【解析】选D.对y=axb两边取对数,得lny=lna+blnx.令u=lny,v=lnx,c=lna,得u=c+bv.
【补偿训练】(2016·南京高二检测)A地六年来轻工业产品利润总额y与年次x的试验数据如表所示:
由经验知,年次x与利润总额y(单位:亿元)有近似如下的关系:y=abxe0,其中a,b为正数,求y关于x的回归方程.
【解析】对y=abxe0两边取自然对数得lny=lnae0+xlnb,令z=lny,则z与x的数据如表:由z=lnae0+xlnb及最小二乘法公式得:lnb≈0.0477,lnae0≈2.378,即 =2.378+0.0477x,故 =10.8×1.05x.
自我纠错 求回归方程【典例】在一化学反应过程中,某化学物质的反应速度y(g/min)与一种催化剂的量x(g)有关,现收集了如表所示的8组数据,试建立y与x的回归方程.
分析解题过程,找出错误之处,并写出正确答案.提示:错误的根本原因是解题前没有审好题,原题求的是回归方程,并不是回归直线方程,因此应首先进行相关性检验,然后再求回归方程,不能盲目地求回归直线方程,正确解答过程如下.
【解析】根据收集的数据作散点图,如图所示.
根据样本点的分布情况,可选用指数型函数模型y=(c1,c2为待定的参数),令z=lny,则z=c2x+lnc1,即变换后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的周围,由y与x的数据表得z与x的数据表如下:
作出z与x的散点图,如图所示,由图可以看出变换后的样本点分布在一条直线附近,所以可用线性回归方程来拟合.
由表中数据可得 ≈0.1812, ≈-0.8485,故 =0.1812x-0.8485,所以 =e0.1812x-0.8485,因此该化学物质的反应速度与催化剂的量的非线性回归方程为 =e0.1812x-0.8485.
高中人教版新课标A2.2直接证明与间接证明教课课件ppt: 这是一份高中人教版新课标A2.2直接证明与间接证明教课课件ppt,共52页。PPT课件主要包含了要证明的结论,充分条件,本例改为求证,失误案例等内容,欢迎下载使用。
高中数学人教版新课标A选修1-22.1合情推理与演绎推理授课课件ppt: 这是一份高中数学人教版新课标A选修1-22.1合情推理与演绎推理授课课件ppt,共58页。PPT课件主要包含了特殊情况,三段论,已知的一般原理,所研究的特殊情况,解析如图所示等内容,欢迎下载使用。
人教版新课标A选修1-22.1合情推理与演绎推理说课ppt课件: 这是一份人教版新课标A选修1-22.1合情推理与演绎推理说课ppt课件,共46页。PPT课件主要包含了部分对象,全部对象,个别事实,类似特征,某些已知特征,这些特征,合情推理,所以所以等内容,欢迎下载使用。