数学4.3.1 一元线性回归模型课前预习ppt课件
展开www.ks5u.com4.3 统计模型
4.3.1 一元线性回归模型
第1课时 相关关系与回归直线方程
学 习 目 标 | 核 心 素 养 |
1.了解变量间的相关关系.(易混点) 2.会根据散点图判断数据是否具有相关关系.(重点) 3.了解最小二乘法的思想,会求回归直线方程,掌握回归方程的性质.(重点、难点) | 1.通过回归直线方程及相关关系的学习,体会数学建模与直观想象的素养. 2.借助回归直线方程的求法,培养数学运算的素养. |
你知道“名师出高徒”的意思吗?——高明的师傅一定能教出技艺高的徒弟,比喻学识丰富的人对于培养人才的重要.也就是说,高水平的老师往往能教出高水平的学生.
问题:那么老师的水平与学生的水平之间具有怎样的关系呢?这种关系是确定的吗?该关系与函数关系相同吗?
1.相关关系
如果两个变量之间确实有一定的关系,但没有达到可以互相决定的程度,它们之间的关系带有一定的随机性,像这样两个变量之间的关系,统计学上都称为相关关系.
思考1:函数关系是相关关系吗?
[提示] 不是.函数关系中两个变量之间是一种确定关系.
2.线性相关
(1)散点图
一般地,如果收集到了变量x和变量y的n对数据(简称为成对数据),如下表所示.
序号i | 1 | 2 | 3 | … | n |
变量x | x1 | x2 | x3 | … | xn |
变量y | y1 | y2 | y3 | … | yn |
则在平面直角坐标系xOy中描出点(xi,yi),i=1,2,3,…,n,就可以得到这n对数据的散点图.
(2)线性相关:如果由变量的成对数据、散点图或直观经验可知,变量x与变量y之间的关系可以近似地用一次函数来刻画,则称x与y线性相关.
(3)正相关和负相关
若x与y线性相关,如果一个变量增大,另一个变量大体上也增大,则称这两个变量正相关;如果一个变量增大,另一个变量大体上减少,则称这两个变量负相关.
3.回归直线方程
(1)一般地,已知变量x与y的n对成对数据(xi,yi),i=1,2,3,…,n.任意给定一个一次函数y=bx+a,对每一个已知的xi,由直线方程可以得到一个估计值i=bxi+a,
如果一次函数=x+能使
取得最小值,则=x+称为y关于x的回归直线方程(对应的直线称为回归直线).因为是使得平方和最小,所以其中涉及的方法称为最小二乘法.
其中,回归系数==,
=-.
=(x1+x2+…+xn)=xi;
=(y1+y2+…+yn)=yi.
4.回归直线方程:=x+的性质
(1)回归直线一定过点(,).
(2)回归系数的实际意义
①是回归方程的斜率;
②当x增大一个单位时,增大个单位.
思考2:y与x正负相关的充要条件分别是什么?
[提示] 当>0时,y与x正相关,反之也成立,同理<0是y与x负相关的充要条件.
1.思考辨析(正确的打“√”,错误的打“×”)
(1)相关关系是两个变量之间的一种确定的关系. . ( )
(2)回归直线方程一定过样本中心点. ( )
(3)选取一组数据的部分点得到的回归方程与由整组数据得到的回归方程一定相同. ( )
(4)根据回归直线方程得到的结论一定是可靠的. ( )
[答案] (1)× (2)√ (3)× (4)×
2.下列两个变量具有正相关关系的是( )
A.正方形的面积与边长
B.吸烟与健康
C.数学成绩与物理成绩
D.汽车的重量与汽车每消耗1 L汽油所行驶的平均路程
C [正方形的面积与边长是函数关系,A错误;吸烟与健康具有负相关关系,B错误;汽车越重,每消耗1 L汽油所行驶的平均路程越短,所以汽车的重量与汽车每消耗1 L汽油所行驶的平均路程具有负相关关系,D错误;数学成绩越好,物理成绩也会越好,所以数学成绩与物理成绩具有正相关关系,C正确.]
3.已知x与y之间的一组数据.
x | 0 | 1 | 2 | 3 |
y | 1 | 3 | 5 | 7 |
若y与x线性相关,则y与x的回归直线=x+必过点( )
A.(2,2) B.(1.5,0)
C.(1,2) D.(1.5,4)
D [∵==1.5,
==4,
∴回归直线必过点(1.5,4).故选D.]
4.已知回归直线的斜率的估计值是1.23,且过定点(4,5),则线性回归方程是________.
=1.23x+0.08 [回归直线的斜率的估计值为1.23,
即=1.23,又回归直线过定点(4,5),
∴=5-1.23×4=0.08,
∴=1.23x+0.08.]
变量间相关关系的判断 |
【例1】 (1)下列关系中,属于相关关系的是________.(填序号)
①扇形的半径与面积之间的关系;
②农作物的产量与施肥量之间的关系;
③出租车费与行驶的里程;
④降雪量与交通事故的发生率之间的关系.
(2)某种产品的广告费支出x与销售额y之间有如下对应数据(单位:百万元).
x | 2 | 4 | 5 | 6 | 8 |
y | 30 | 40 | 60 | 50 | 70 |
①画出散点图;
②从散点图中判断销售金额与广告费支出成什么样的关系?
(1)②④ [在①中,扇形的半径与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③为确定的函数关系;在④中,降雪量与交通事故的发生率之间具有相关关系.]
(2)[解] ①以x对应的数据为横坐标,以y对应的数据为纵坐标,所作的散点图如图所示.
②从图中可以发现广告费支出与销售金额之间具有相关关系,并且当广告费支出由小变大时,销售金额也大多由小变大,图中的数据大致分布在某条直线的附近,即x与y成正相关关系.
两个变量是否相关的两种判断方法
1.根据实际经验:借助积累的经验进行分析判断.
2.利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观地进行判断.如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
1. 在下列所示的四个图中,每个图的两个变量具有相关关系的图是( )
(1) (2) (3) (4)
A.(1)(2) B.(1)(3)
C.(2)(4) D.(2)(3)
D [图(1)的两个变量具有函数关系;图(2)(3)的两个变量具有相关关系;图(4)的两个变量之间既不是函数关系,也不是相关关系.]
求回归直线方程 |
【例2】 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对应数据.
x | 3 | 4 | 5 | 6 |
y | 2.5 | 3 | 4 | 4.5 |
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
[解] (1)由题设所给数据,可得散点图如图.
(2)由对照数据,计算得: x=86,
==4.5,
==3.5,
已知xiyi=66.5,
所以,由最小二乘法确定的回归方程的系数为
===0.7,
=-b=3.5-0.7×4.5=0.35.
因此,所求的线性回归方程为=0.7x+0.35.
(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为90-(0.7×100+0.35)=19.65(吨标准煤).
求回归方程的一般步骤
(1)收集样本数据,设为(xi,yi)(i=1,2,…,n).
(2)作出散点图,确定x,y具有线性相关关系.
(3)计算,,x,xiyi.
(4)代入公式计算,,公式为
(5)写出回归方程= x+.
2.已知变量x,y有如下对应数据.
x | 1 | 2 | 3 | 4 |
y | 1 | 3 | 4 | 5 |
(1)作出散点图;
(2)用最小二乘法求关于x,y的回归方程.
[解] (1)散点图如图所示.
(2)==,==,
xiyi=1+6+12+20=39,
x=1+4+9+16=30,
==,
=-×=0,
所以=x即为所求的回归方程.
回归直线方程的性质及应用 |
[探究问题]
假设y与x具有相关关系,而且回归直线方程为=x+.
1.回归直线方程的单调性由哪个参数决定?
[提示] .
2.该方程必过哪个定点?
[提示] (,).
【例3】 (多选题)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
ABC [当x=170时,=0.85×170-85.71=58.79,
体重的估计值为58.79 kg,故D错误,ABC均正确.]
1.相关关系的正、负相关类同于函数的增、减性,与其斜率有关,必要时可画散点图以增强直观性.
2.由回归方程得出的函数值不一定是准确值,只是个估计值.
3.(1)根据如下样本数据得到的回归方程为=x+,则( )
x | 3 | 4 | 5 | 6 | 7 | 8 |
y | 4.0 | 2.5 | -0.5 | 0.5 | -2.0 | -3.0 |
A.>0,>0 B.>0,<0
C.<0,>0 D.<0,<0
(2)某单位为了了解用电量y度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表.
气温(℃) | 18 | 13 | 10 | -1 |
用电量(度) | 24 | 34 | 38 | 64 |
由表中数据得线性回归方程=x+中=-2,预测当气温为-4 ℃时,用电量的度数约为________度.
(1)B (2)68 [(1)画出散点图,知>0,<0.
(2)=10,=40,回归方程过点(,),
∴40=-2×10+.
∴=60.∴=-2x+60.
令x=-4,∴=(-2)×(-4)+60=68.]
1.相关关系和函数关系的异同点
(1)相同点:两者均是指两个变量的关系.
(2)不同点:函数关系是一种确定的关系,而相关关系是一种非确定的关系.
2.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图.根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关还是负相关.
3.回归方程必过点(,).利用回归方程,我们可以进行估计和预测,若回归方程为=x+,则在x=x0处的估计值为0=x0+.
1.以下四个散点图中,两个变量的关系适合用线性回归模型刻画的是( )
① ② ③ ④
A.①② B.①③
C.②③ D.③④
B [①③中的点分布在一条直线附近,适合线性回归模型.]
2.由变量x与y相对应的一组数据(1,y1),(5,y2),(7,y3),(13,y4),(19,y5)得到的线性回归方程为=2x+45,则=( )
A.135 B.90
C.67 D.63
D [∵=(1+5+7+13+19)=9,=2+45,
∴=2×9+45=63,故选D.]
3.工人工资y(元)与劳动生产率x(千元)的相关关系的回归方程为=50+80x,下列判断正确的是( )
A.劳动生产率为1 000元时,工人工资为130元
B.劳动生产率提高1 000元时,工人工资平均提高80元
C.劳动生产率提高1 000元时,工人工资平均提高130元
D.当月工资为250元时,劳动生产率为2 000元
B [因为回归直线的斜率为80,所以x每增加1,y平均增加80,即劳动生产率提高1 000元时,工人工资平均提高80元.]
4.某地区近10年居民的年收入x与年支出y之间的关系大致符合=0.8x+0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元.
12.1 [将x=15代入=0.8x+0.1,得=12.1.]
5.由某种设备的使用年限xi(年)与所支出的维修费yi(万元)的数据资料算得如下结果,x=90,xiyi=112,xi=20,yi=25.
(1)求所支出的维修费y对使用年限x的线性回归方程=x+;
(2)①判断变量x与y之间是正相关还是负相关;
②当使用年限为8年时,试估计支出的维修费是多少?
[解] (1)∵xi=20,yi=25,
∴=xi=4,=yi=5,
∴===1.2,
=-=5-1.2×4=0.2.
∴线性回归方程为=1.2x+0.2.
(2)①由(1)知=1.2>0,∴变量x与y之间是正相关.
②由(1)知,当x=8时,=1.2×8+0.2=9.8,即使用年限为8年时,支出的维修费约是9.8万元.
高中数学人教B版 (2019)选择性必修 第二册4.3.1 一元线性回归模型多媒体教学ppt课件: 这是一份高中数学人教B版 (2019)选择性必修 第二册4.3.1 一元线性回归模型多媒体教学ppt课件,文件包含人教B版高中数学选择性必修第二册431《相关系数与非线性回归》第2课时课件ppt、人教B版高中数学选择性必修第二册431《相关系数与非线性回归》第2课时教案doc等2份课件配套教学资源,其中PPT共60页, 欢迎下载使用。
人教B版 (2019)选择性必修 第二册第四章 概率与统计4.1 条件概率与事件的独立性4.1.2 乘法公式与全概率公式课文内容课件ppt: 这是一份人教B版 (2019)选择性必修 第二册第四章 概率与统计4.1 条件概率与事件的独立性4.1.2 乘法公式与全概率公式课文内容课件ppt,文件包含人教B版高中数学选择性必修第二册412《乘法公式》第1课时课件ppt、人教B版高中数学选择性必修第二册412《乘法公式》第1课时教案doc等2份课件配套教学资源,其中PPT共37页, 欢迎下载使用。
数学选择性必修 第二册4.3.1 一元线性回归模型图片课件ppt: 这是一份数学选择性必修 第二册4.3.1 一元线性回归模型图片课件ppt,共39页。PPT课件主要包含了知识梳理·自主探究,师生互动·合作探究,知识探究,当堂检测等内容,欢迎下载使用。