高中数学人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用说课课件ppt
展开2.相关系数的性质: ① 当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关. ② |r|≤1; ③ 当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当|r|=1时,成对数据都落在一条直线上.
通过前面的学习我们已经了解到,根据成对样本数据的散点图和样本相关系数,可以推断两个变量是否存在相关关系、是正相关还是负相关,以及线性相关程度的强弱等.
思考 是否可以能像建立函数模型刻画两个变量之间的确定性关系那样,通过建立适当的统计模型来刻画两个变量之间的相关关系?
下面我们研究当两个变量线性相关时,如何利用成对样本数据建立统计模型,并利用模型进行预测的问题.
生活经验告诉我们,儿子的身高与父亲的身高不仅线性相关,而且还是正相关,即父亲的身高较高时,儿子的身高通常也较高. 为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如下表所示.
我们先用散点图对上面的数据进行分析。
问题1 根据上述数据画出来的散点图,你发现了什么?
可以发现,散点大致分布在一条从左下角到右上角的直线附近,表明儿子身高和父亲身高线性相关.
利用统计软件,求得样本相关系数为r≈0.886,表明儿子身高和父亲身高正线性相关,且相关程度较高.
问题2 根据表中的数据,儿子身高和父亲身高这两个变量之间的关系可以用函数模型刻画吗?
儿子身高不是父亲身高的函数
父亲身高不是儿子身高的函数
儿子身高和父亲身高之间不是函数关系,故不能用函数模型刻画.
但由于父子的身高有较强的线性相关,因此我们可以用一次函数来刻画父亲身高对儿子身高的影响
问题3 除父亲身高外,还有哪些因素影响儿子的身高?
母亲身高生活环境饮食习惯 体育锻炼 ……
追问 如何理解随机误差e对儿子身高的影响?
随机误差e是一个随机变量
①可取正或取负②有些无法测量③不可事先设定
我们称(1)式为Y关于x的一元线性回归模型.
其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.
模型中的Y也是随机变量,其值虽然不能由变量x的值确定,但是却能表示为bx+a与e的和(叠加),前一部分由 x所确定,后一部分是随机的. 如果e=0,那么Y与x之间的关系就可用一元线性函数模型来描述.
追问 为什么要假设E(e)=0,而不假设其为某个不为0的常数?
因为误差是随机的,即取各种正负误差的可能性一样,所以它们均值的理想状态应该为0.
问题4 你能结合父亲与儿子身高的实例,说明回归模型(1)的意义?
问题5 对于父亲身高为xi的某一名男大学生,他的身高yi一定是bxi+a吗?
问题6 你能结合具体实例解释产生模型(1)中随机误差项的原因吗?
随机误差e的来源(可以推广到一般):1、忽略了其它因素的影响:影响身高 y 的因素不只是体重 x,可能还包括遗传基因、饮食习惯、生长环境等因素;2、用线性回归模型近似真实模型所引起的误差;3、身高 y 的观测误差。 以上三项误差越小,说明我们的回归模型的拟合效果越好。
1. 说明函数模型与回归模型的区别,并分别举出两个应用函数模型和回归模型的例子.
函数模型与回归模型之间的差别
一元线性回归模型Y=bx+a+e增加了随机误差项e,因变量 Y 的值由 自变量x和随机误差项e共同确定, 即自变量x只能解释部分Y的变化.
解析:函数模型刻画的是变量之间具有的函数关系,是一种确定性的关系. 回归模型刻画的是变量之间具有的相关关系,不是一种确定性关系,即回归模型刻画的是两个变量之间的随机关系.
举例:路程与速度的关系、正方体体积与边长的关系可以应用函数模型刻画,体重与身高的关系、冷饮销量与气温的关系可以用回归模型刻画。
2. 在一元线性回归模型(1) 中,参数b的含义是什么?
解:参数b的含义可以解释为解释变量x对响应变量Y的均值的影响,变量x每增加1个单位,响应变量Y的均值将增加b个单位. 例如,教科书中父亲身高为175 cm的儿子身高的均值比父亲身高为174cm的儿子身高的均值高出0.839cm.注意:因为响应变量Y最终取值,除了受变量x的影响,还要受随机误差e的影响,所以不能解释成解释变量x每增加一个单位,响应变量Y一定增加b个单位.
3. 将图8.2-1中的点按父亲身高的大小次序用折线连起来,所得到的图象是一个折线图,可以用这条折线表示儿子身高和父亲身高之间的关系吗?
解:不能.一是父亲的身高与儿子的身高之间是随机关系,不是函数关系;二是这组数据仅是总体的一个样本,不一定能很好地描述两个变量之间的关系.
一元线性回归模型与函数模型的区别
Y称为因变量或响应变量
x称为自变量或解释变量
e是Y与bx+a之间的随机误差.
人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用教学ppt课件: 这是一份人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用教学ppt课件,共24页。
人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用教学ppt课件: 这是一份人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用教学ppt课件,共24页。
高中人教A版 (2019)8.2 一元线性回归模型及其应用获奖ppt课件: 这是一份高中人教A版 (2019)8.2 一元线性回归模型及其应用获奖ppt课件,共36页。