- 10.3《概率的简单性质》2个课件+教案 课件 9 次下载
- 10.4《直方图与频率分布》2个课件+教案 课件 9 次下载
- 10.5《总体与样本》2个课件+教案 课件 9 次下载
- 10.6《抽样方法》2个课件 课件 9 次下载
- 10.8《用样本估计总体》3个课件+教案 课件 10 次下载
高中数学语文版(中职)基础模块下册10.9 一元线性回归试讲课ppt课件
展开1 变量间关系的度量
1.1 变量间的关系1.2 相关关系的描述与测度1.3 相关系数的显著性检验
1.1 变量间的关系 函数关系
(1)是确定的关系(2)设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量(3)各观测点落在一条曲线上
函数关系 (几个例子)
函数关系的例子某种商品的销售额y与销售量x之间的关系可表示为 y = px (p 为单价)圆的面积S与半径之间的关系可表示为S=R2
相关关系 (crrelatin)
(1)变量间关系不能用函数关系精确表达(2)一个变量的取值不能由另一个变量唯一确定,但当一个或若干个变量X取一定值时,与之相对应的另一个变量Y的值虽然不确定,但却按某种规律在一定范围内变化。(3)当变量 x 取某个值时,变量 y 的取值可能有几个(4)各观测点分布在直线(或曲线)周围
相关关系 (几个例子)
相关关系的例子父亲身高y与子女身高x之间的关系收入水平y与受教育程度x之间的关系大气臭氧含量y与温度x之间的关系商品销售额y与广告费支出x之间的关系等等
相关关系 (类型)
散点图 (scatter diagram)
散点图 (例题分析)
【例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的增长,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据
散点图 (例题分析)
相关关系的描述与测度 相关系数 (crrelatin cefficient)
(1)对变量之间关系密切程度的度量(2)对两个变量之间线性相关程度的度量称为简单相关系数(3)若相关系数是根据总体全部数据计算的,称为总体相关系数,记为(4)若是根据样本数据计算的,则称为样本相关系数,记为 r
样本相关系数 (计算公式)
样本相关系数的计算公式
Var(x)Var(y)
相关系数 (取值及其意义)
r 的取值范围是 [-1,1] |r|=1,为完全相关r =1,为完全正相关r =-1,为完全负正相关 r = 0,不存在线性 相关关系 -1r<0,为负相关 0
相关系数矩阵 (例题分析)
2 一元线性回归
2.1 一元线性回归模型2.2 参数的最小二乘估计2.3 回归直线的拟合优度2.4 显著性检验
什么是回归分析? (Regressin)
(1)从一组样本数据出发,确定变量之间的数学关系式(数学分析与统计分析)(2)对这些关系式的可信程度进行各种统计检验(在经济意义的基础上),并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著(3)利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度
“回归” 一词的历史渊源
“回归”一词最早由Francis Galtn引入。 Galtn发现,虽然父母的身高对子女的身高起到决定性作用,但给定父母的身高后,他们儿女辈的平均身高却趋向于或者“回归”到社会平均水平。Galtn的普遍回归定律(law f universal regressin)。Galtn的朋友Karl Pearsn通过收集一些家庭的1000多名成员的父子身高数据,证明儿子确实“回归到中等(regressin t medicrity)”
回归分析与相关分析的区别
(1)相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化(2)相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量(3)相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制
(1)涉及一个自变量的回归(2)因变量y与自变量x之间为线性关系被预测或被解释的变量称为因变量(dependent variable),用y表示用来预测或用来解释因变量的一个或多个变量称为自变量(independent variable),用x表示 (3)因变量与自变量之间的关系用一个线性方程来表示
描述因变量 y 如何依赖于自变量 x 和误差项 的方程称为回归模型一元线性回归模型可表示为 y = 0 + 1 x + (总体回归模型)y 是 x 的线性函数(部分)加上误差项线性部分反映了由于 x 的变化而引起的 y 的变化误差项 是随机变量,反映了除 x 和 y 之间的线性关系外,随机因素对 y 的影响是不能由 x 和 y 之间的线性关系所解释的变异0 和 1 称为模型的参数,也称为回归系数
对于大量的实际问题,通常总体回归函数是未知的,因此我们只能从总体中抽取的样本数据进行观测,对于总体的参数,需要用样本回归的参数估计来替代,这样我们有样本回归函数: 其中 是与 相对应的估计值, 和 分别是样本回归函数的估计参数。
样本回归函数与总体回归函数的区别
1、总体回归函数虽然是未知的,但它是确定的;而从总体中每次抽样都能获得一个样本,就都能拟合一条样本回归线,所以样本回归线是随抽样波动而变化的,可以有很多条。因此样本回归线不等于总体回归线,最多只是未知总体回归线的近似表示。2、总体回归函数的参数是确定的常数;而样本回归线的参数是随抽样而变化的随机变量。3、总体回归函数中的误差项是不可直接观测的,而样本回归函数的误差项是可以直接计算得出。
利用样本回归函数去估计总体回归函数。由于样本对总体总是存在代表性误差,样本回归函数总会过高或者过低估计总体回归函数。我们研究的目的是,需要寻求一种规则和方法,使得样本回归函数中的参数能够“尽可能地接近”总体回归函数中的参数。
一元线性回归模型 (基本假定)
(1)误差项ε是一个期望值为0的随机变量,即E(ε)=0。对于一个给定的 x 值,y 的期望值为E (y) = 0+ 1 x(2)对于所有的 x 值,ε的方差σ2 都相同(3)误差项ε是一个服从正态分布的随机变量,且相互独立。即ε~N( 0 ,σ2 )假定无自相关误差项与自变量不相关
2.2 参数的最小二乘估计
使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法。即
用最小二乘法(OLS回归)拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小
最小二乘估计 (图示)
最小二乘法(OLS ) ( 和 的计算公式)
根据最小二乘法的要求,可得求解 和 的公式如下
最小二乘估计量的统计性质
线性无偏性有效性(最小方差性)
参数估计量 , 是Yi的一个线性函数参数估计量是一个随机变量,采用不同的参数估计方法,会构造出不同的参数估计量参数估计值是采用样本数据计算的具体数值,不同样本会得出不同的参数估计值
回归参数估计量是总体模型参数的无偏估计,即其均值等于总体模型参数值:
指在所有线性、无偏估计量中,该参数估计量方差最小
可以证明,OLS参数估计量的有效性指的是:在一切线性、无偏估计量中,OLS参数估计量的方差最小。
如果满足古典线性回归模型的基本假定,则在所有无偏估计量中,最小二乘估计(OLS)量具有最小方差性,即是最优线性无偏估计量(合称BLUE性质)(Best Linear Unbiased Estimatr)
线性:参数估计量是Yi的线性函数
无偏性:参数估计量的均值(期望)等于模型参数值。即
有效性:在所有线性、无偏估计量中,最小二乘估计量具有最小方差。
结论: 普通最小二乘估计量具有线性性、无偏性、最小方差性等优良性质。 具有这些优良性质的估计量又称为最佳线性无偏估计量,即BLUE估计量(the Best Linear Unbiased Estimatrs)。 显然这些优良的性质依赖于对模型的基本假设。
回归方程的求法 (例题分析)
【例】求不良贷款对贷款余额的回归方程
回归方程为:y = -0.8295 +0.037895 x回归系数 =0.037895 表示,贷款余额每增加1亿元,不良贷款平均增加0.037895亿元
不良贷款对贷款余额回归方程的图示
2.3 回归直线的拟合优度 变差
因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面由于自变量 x 的取值不同造成的除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示
变差的分解 (图示)
离差平方和的分解 (三个平方和的关系)
离差平方和的分解 (三个平方和的意义)
总平方和(SST)反映因变量的 n 个观察值与其均值的总离差回归平方和(SSR)反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和残差平方和(SSE)反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和
判定系数r2 (cefficient f determinatin)
(1)回归平方和占总离差平方和的比例
(2)反映回归直线的拟合程度(3)取值范围在 [ 0 , 1 ] 之间(4)R2 1,说明回归方程拟合的越好;R20,说明回归方程拟合的越差(5)判定系数等于相关系数的平方,即R2=r2
判定系数r2 (例题分析)
【例】计算不良贷款对贷款余额回归的判定系数,并解释其意义 判定系数的实际意义是:在不良贷款取值的变差中,有71.16%可以由不良贷款与贷款余额之间的线性关系来解释,或者说,在不良贷款取值的变动中,有71.16%是由贷款余额所决定的。也就是说,不良贷款取值的差异有2/3以上是由贷款余额决定的。可见不良贷款与贷款余额之间有较强的线性关系
实际意义检验(本例是经济意义)统计意义检验
检验参数估计量的符号检验参数估计量的大小参数之间的关系
统计意义上的显著性检验
相关系数检验回归系数检验线性关系检验
相关系数的显著性检验 (检验的步骤)
(1)检验两个变量之间是否存在线性相关关系(2)采用提出的 t 检验(3)检验的步骤为提出假设:H0: ;H1: 0
确定显著性水平,并作出决策 若t>t,拒绝H0 若t
对不良贷款与贷款余额之间的相关系数进行显著性检(0.05)提出假设:H0: ;H1: 0计算检验的统计量
3. 根据显著性水平=0.05,查t分布表得t(n-2)=2.069由于t=7.5344>t(25-2)=2.069,拒绝H0,不良贷款与贷款余额之间存在着显著的正线性相关关系
各相关系数检验的统计量
2.在一元线性回归中,等价于线性关系的显著性检验
检验 x 与 y 之间是否具有线性关系,或者说,检验自变量 x 对因变量 y 的影响是否显著
回归系数的检验 (检验步骤)
提出假设H0: 1 = 0 (没有线性关系) H1: 1 0 (有线性关系) 计算检验的统计量
确定显著性水平,并进行决策 t>t,拒绝H0; t
对例题的回归系数进行显著性检验(=0.05)提出假设H0: 1 = 0H1: 1 0计算检验的统计量
t=7.533515>t=2.201,拒绝H0,表明不良贷款与贷款余额之间有显著的线性关系
P=0.000000<=0.05,拒绝原假设,不良贷款与贷款余额之间有显著的线性关系
检验自变量与因变量之间的线性关系是否显著将回归均方(MSR)同残差均方(MSE)加以比较,应用F检验来分析二者之间的差别是否显著回归均方:回归平方和SSR除以相应的自由度(自变量的个数p) 残差均方:残差平方和SSE除以相应的自由度(n-p-1)
线性关系的检验 (检验的步骤)
(1)提出假设H0:r=0 线性关系不显著
(2)计算检验统计量F
(3)确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F (4)作出决策:若F>F ,拒绝H0;若F
(1)提出假设H0: r=0 不良贷款与贷款余额之间的线性关系不显著(2)计算检验统计量F
(3)确定显著性水平=0.05,并根据分子自由度1和分母自由度25-2找出临界值F =4.28(4)作出决策:若F>F ,拒绝H0,线性关系显著
线性关系的检验 (方差分析表)
其实,三种检验对于一元线性回归问题来说是等价的,在实际问题处理时,采取一种检验方式即可。F检验是检验回归方程的显著性t检验是检验回归系数是否为显著r检验是检验相关关系是否显著
1、若X表示在一家分店工作的售货人数,Y表示这家分店的年销售额(千元),已经求出Y对X的回归方程的估计结果如下表
1、写出估计的回归方程2、在研究中涉及多少家分店3、计算F统计量,在0.05显著性水平下检验线性关系的显著性4、说明各回归系数的含义并预测(估计)有12名售货员的某分店的年销售收入。在年销售收入的变差中,有百分之多少的变差可以由销售收入与销售员之间的线性关系来解释?
3 一元线性相关回归分析预测法
一元线性相关回归分析预测法,是根据自变量x和因变量y的相关关系,建立x与y的线性关系式,其关系式中求解参数的方法是统计回归分析法,所以x与y的关系式就称回归方程一元线性相关回归方程的一般形式为: yt=a+bxt
回归参数,回归直线的斜率
回归参数,y轴上的截距
一元相关回归分析预测法也称简单相关回归分析预测法,是用相关回归分析法对一个自变量与一个因变量之间的相关关系进行分析,建立一元回归方程作为预测模型,对随机现象进行预测的方法多元相关回归预测法也称复相关回归分析预测法,是用相关回归分析法对多个自变量与一个因变量之间的相关关系进行分析,建立多元回归方程作为预测模型,对随机现象进行预测的方法自相关回归分析预测法是对某一时间序列的因变量序列,与向前推移若干观察期的一个或多个自变量时间序列进行相关分析,并建立回归方程作为预测模型,对某一随机现象进行预测,这是利用随机现象时间序列对它自身进行预测的方法
根据预测的目的,选择和确定自变量和因变量确定回归方程,建立预测模型对回归模型进行检验用预测模型计算预测值,并对预测值作区间估计
利用回归方程进行估计和预测
根据自变量 x 的取值估计或预测因变量y 的取值,这是两个不同的问题当x=x0,寻求E(y0)= 0 + 1x0的点估计与区间估计,注意E(y0)是期望,是常数(参数)。当x=x0, y0的值以一定的概率在什么范围内,注意此处y0是随机变量,为此,只能求一个区间,即预测区间。
对于自变量 x 的一个给定值 ,根据回归方程得到 因变量 y 的一个估计值,
利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的的一个估点估计值y0。在前面的例子中,假如我们要估计贷款余额为100亿元时,所有分行不良贷款点估计 。根据估计的回归方程得
点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计区间估计有两种情况,其一,求总体条件均值E(Y|X=X0)的置信区间,其二,对于自变量 x 的一个给定值 x0,根据回归方程得到因变量 y 个值预测值的预测区间
对于一元线性回归模型
给定样本以外的解释变量的观测值X0,可以得到被解释变量的预测(估计)值Ŷ0 ,可以此作为其条件均值E(Y|X=X0)或个别值Y0的一个近似估计。
注意: 严格地说,Ŷ0只是被解释变量Y0的预测值的点估计值,而不是预测值。 原因:(1)参数估计量不确定; (2)随机项的影响
一、Ŷf是条件均值E(Y|X=X0)或个值Y0的一个无偏估计
对总体回归函数E(Y|X=Xi)=0+1Xi,X=X0时 E(Y|X=X0)=0+1X0
可见,Ŷ0是条件均值E(Y|X=X0)的无偏估计。
二、总体条件均值与个值预测值的置信区间
1、总体均值预测值的置信区间
将未知的 用它的无偏估计量 代替,可构造统计量:
这样,在1-的置信度下,总体均值E(Y|X0)的置信区间为 :展开有:
2、总体个值预测值的预测区间
如果已经知道实际的预测值,那么预测误差为:
从而在1-的置信度下, 当x=x0 时,Y0的置信区间为 :
置信区间、预测区间、回归方程
估计标准误差 (standard errr f estimate)
实际观察值与回归估计值离差平方和的均方根反映实际观察值在回归直线周围的分散状况通常情况下,总体标准差是未知的,我们要用样本标准差来代替,对误差项(回归残差)的标准差的样本估计,是在排除了x对y的线性影响后,y随机波动大小的一个估计量,称为回归标准差或者估计标准差。斜率与截距的估计会给数据加上两个约束条件,因此自由度为n-2 计算公式为
预测区间估计 (例题分析)
【例】求出贷款余额为100亿元的那个分行,不良贷款95%的预测区间 解:根据前面的计算结果,已知n=25, =1.9799,t(25-2)=2.069 预测区间为
贷款余额为100亿元的那个分行,其不良贷款的预测区间在-2.2766亿元到6.1366亿元之间
置信水平 (1 - )区间宽度随置信水平的增大而增大数据的样本容量样本容量越大,预测精度越高3.用于预测的 xp 与x 的差异程度区间宽度随 xp 与x 的差异程度的增大而增大
EX: 根据某地区10年农民人均收入年纯收入的资料,和该地区相应年份的销售额资料,预测该地区市场销售额。观察期资料见表1 人均收入 销售额
400136520152560156640164720172820182940190104020211602161280226
根据表1中x与y观察期十年资料绘制散点图散点图表明,x与y存在相关关系,且散点基本集中在一条直线上,说明相关程度较高,农民年人均纯收入(x)与销售额(y)表现较高程度的直线正相关。可以采用一元线性相关回归分析预测模型
应用最小平方法求回归方程中的参数,建立预测模型求解a、b值:则回归方程为: ŷ=99.121+0.1x
利用回归方程作为预测模型进行预测确定t值:本例中取预测区间置信度为95%,即1-ɑ=95%,ɑ=5%=0.05,ɑ/2=0.025,n=10,查t分布表,t(0.025,8)=2.306计算可得第11期~14期各期的预测区间
北师大版(2021)拓展模块一 下册10.2.2 一元线性回归模型及其应用精品课件ppt: 这是一份北师大版(2021)拓展模块一 下册10.2.2 一元线性回归模型及其应用精品课件ppt,文件包含北师大版《中职数学拓展模块一下册》第28课一元线性回归模型及应用课件pptx、北师大版《中职数学拓展模块一下册》第28课一元线性回归模型及应用教学设计docx等2份课件配套教学资源,其中PPT共14页, 欢迎下载使用。
中职数学高教版(2021)拓展模块二 下册10.2 一元线性回归示范课课件ppt: 这是一份中职数学高教版(2021)拓展模块二 下册10.2 一元线性回归示范课课件ppt,共18页。PPT课件主要包含了一元线性回归等内容,欢迎下载使用。
语文版(中职)基础模块下册10.9 一元线性回归课堂教学ppt课件: 这是一份语文版(中职)基础模块下册10.9 一元线性回归课堂教学ppt课件,共60页。PPT课件主要包含了对于任意Xi值有,故回归方程为,引例分析,SST,SSE,SSR,自由度ƒR为1,图9-6,图9-7,图9-8等内容,欢迎下载使用。