人教B版 (2019)选择性必修 第二册4.3.1 一元线性回归模型导学案及答案
展开知识点一 相关关系
1.两个变量之间有一定的关系,但没有达到可以相互决定的程度,他们之间的关系具有一定的随机性,统计学上称为相关关系.
2.线性相关:如果变量x与变量y之间的关系可以近似地用一次函数来刻画,则称x与y线性相关.
3.如果一个变量增大,另一个变量大体上也增大,则称这两个变量正相关.如果一个变量增大,另一个变量大体上减少,则称这两个变量负相关.
知识点二 回归直线方程
知识点三 回归直线方程的性质
1.回归直线过样本点的中心(eq \(x,\s\up6(-)),eq \(y,\s\up6(-)));
2.一次函数eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))的单调性由eq \(b,\s\up6(^))的符号决定,函数递增的充要条件是eq \(b,\s\up6(^))>0.这说明x与y正相关的充要条件是eq \(b,\s\up6(^))>0;x与y负相关的充要条件是eq \(b,\s\up6(^))<0.
3.回归方程中eq \(b,\s\up6(^))的实际意义是,当x增大一个单位时,eq \(y,\s\up6(^))增大eq \(b,\s\up6(^)) 个单位.
知识点四 相关系数
知识点五 非线性回归
两个变量x与y的关系,不再是线性相关关系,成为非线性相关关系,所得到的方程成为非线性回归方程(也简称回归方程),一般地,非线性回归方程的曲线类型可以通过做出散点图进行猜测,而回归方程有时可以通过变量替换后,借助求回归直线的过程确定.当然,确定了非线性回归方程之后,也可以利用它进行预测.
[基础自测]
1.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为eq \(y,\s\up6(^))=0.85x-85.71,则下列结论中正确的是________.(填序号)
①y与x具有正的线性相关关系;
②回归直线过样本点的中心(eq \(x,\s\up6(-)),eq \(y,\s\up6(-)));
③若该大学某女生身高增加1 cm,则其体重约增加0.85 kg;
④若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg.
2.下列判断正确的____________
(1)求回归直线方程前必须进行相关性检验.
(2)两个变量的相关系数越大,它们的相关程度越强.
(3)若相关系数r=0,则两变量x,y之间没有关系.
3.下列结论正确的是( )
①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
A.①② B.①②③
C.①②④ D.①②③④
4.下表是x和y之间的一组数据,则y关于x的线性回归方程必过点( )
A.(2,3) B.(1.5,4)
C.(2.5,4) D.(2.5,5)
题型一 回归分析的有关概念
例1 (1)有下列说法:
①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),可以估计和观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.
其中正确命题的个数是( )
A.1 B.2
C.3 D.4
(2)关于变量y与x之间的回归直线方程,叙述正确的是( )
A.表示y与x之间的一种确定性关系
B.表示y与x之间的相关关系
C.表示y与x之间的最真实的关系
D.表示y与x之间真实关系的一种效果最好的拟合
(3)如果某地的财政收入x与支出y满足线性回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))+ε(单位:亿元),其中eq \(b,\s\up6(^))=0.8,eq \(a,\s\up6(^))=2,|ε|≤0.5,如果今年该地区财政收入10亿元,则今年支出预计不会超过________亿.
方法归纳
1.在分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程.
2.由线性回归方程给出的是一个预报值而非精确值.
3.随机误差的主要来源.
(1)线性回归模型与真实情况引起的误差;
(2)省略了一些因素的影响产生的误差;
(3)观测与计算产生的误差.
跟踪训练1 下列有关线性回归的说法,不正确的是________(填序号).
①自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;
②在平面直角坐标系中,用描点的方法得到表示具有相关关系的两个量的一组数据的图形叫做散点图;
③线性回归方程最能代表观测值x,y之间的关系;
④任何一组观测值都能得到具有代表意义的回归直线方程.
题型二 线性回归分析
例2 为研究拉力x(N)对弹簧长度y(cm)的影响,对不同拉力的6根弹簧进行测量,测得如下表中的数据:
(1)画出散点图;
(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的回归直线方程.
eq \x(状元随笔)
eq \x(作散点图)→eq \x(得到x,y有较好的线性关系)→eq \x(代入公式求得线性回归方程)
方法归纳
1.散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.
2.求回归直线方程时,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.
跟踪训练2 本例条件不变,若x增加2个单位,eq \(y,\s\up6(^))增加多少?
题型三 非线性回归分析
eq \x(状元随笔) 1.如何解答非线性回归问题?
[提示] 非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:
2.已知x和y之间的一组数据,则下列四个函数中,哪一个作为回归模型最好?
①y=3×2x-1;②y=lg2x;③y=4x;④y=x2.
[提示] 观察散点图中样本点的分布规律可判断样本点分布在曲线y=3×2x-1附近.①作为回归模型最好.
例3 某地区不同身高的未成年男性的体重平均值如下表:
(1)试建立y与x之间的回归直线方程;
(2)如果一名在校男生身高为168 cm,预测他的体重约为多少?
eq \x(状元随笔) 先由散点图确定相应的函数模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.
方法归纳
两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y=c1ec2x,我们可以通过对数变换把指数关系变为线性关系,令z=ln y,则变换后样本点应该分布在直线z=bx+a(a=ln c1,b=c2)的周围.
跟踪训练3 有一个测量水流量的实验装置,测得试验数据如下表:
根据表中数据,建立Q与h之间的回归方程.
教材反思
4.3 统计模型
4.3.1 一元线性回归模型
新知初探·自主学习
知识点二
eq \f(1,n)eq \i\su(i=1,n,x)i eq \f(1,n)eq \i\su(i=1,n,y)i eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-))
[基础自测]
1.解析:回归方程中x的系数为0.85>0,因此y与x具有正的线性相关关系,①正确;
由回归方程系数的意义可知回归直线过样本点的中心(eq \(x,\s\up6(-)),eq \(y,\s\up6(-))),②正确;
依据回归方程中eq \(b,\s\up6(^))的含义可知,x每变化1个单位,eq \(y,\s\up6(^))相应变化约0.85个单位,③正确;
用回归方程对总体进行估计不能得到肯定结论,故④不正确.
答案:①②③
2.解析:(1)正确,相关性检验是了解成对数据的变化规律的,所以求回归方程前必须进行相关性检验.
(2)错误,相关系数|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.
(3)错误,若r=0是指x,y之间的相关关系弱,但并不能说没有关系.
答案:(1)
3.解析:函数关系和相关关系的区别是前者是确定性关系,后者是非确定性关系,故①②正确;回归分析是对具有相关关系的两个变量进行统计分析的一种方法,故③错误,④正确.
答案:C
4.解析:线性回归方程必过样本点的中心(eq \(x,\s\up6(-)),eq \(y,\s\up6(-))),即(2.5,4),故选C.
答案:C
课堂探究·素养提升
例1 【解析】 (1)①反映的正是最小二乘法思想,故正确.②反映的是画散点图的作用,也正确.③解释的是回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))的作用,故也正确.④是不正确的,在求回归方程之前必须进行相关性检验,以发现两变量的关系.
(2)回归直线方程能最大可能地反映y与x之间的真实关系,故选项D正确.
(3)由题意可得:eq \(y,\s\up6(^))=0.8x+2+ε,当x=10时,eq \(y,\s\up6(^))=0.8×10+2+ε=10+ε,又|ε|≤0.5,∴9.5≤eq \(y,\s\up6(^))≤10.5.
故今年支出预计不会超过10.5亿.
【答案】 (1)C (2)D (3)10.5
跟踪训练1 解析:只有具有线性相关的两个观测值才能得到具有代表意义的回归直线方程.
答案:④
例2 【解析】 (1)散点图如图所示.
(2)将已知表中的数据列成下表:
eq \(x,\s\up6(-))=17.5,eq \(y,\s\up6(-))≈9.49,eq \i\su(i=1,6,x)iyi=1 076.2,eq \i\su(i=1,6,x)eq \\al(2,i)=2 275.
∴eq \(b,\s\up6(^))=eq \f(\i\su(i=1,6,x)iyi-6\(x,\s\up6(-)) \(y,\s\up6(-)),\i\su(i=1,6,x)\\al(2,i)-6\(x,\s\up6(-))2)=eq \f(1 076.2-6×17.5×9.49,2 275-6×17.52)≈0.18,
eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-))=9.49-0.18×17.5=6.34,
∴回归直线方程为eq \(y,\s\up6(^))=0.18x+6.34.
跟踪训练2 解析:若x增加2个单位,则
eq \(y,\s\up6(^))=0.18(x+2)+6.34
=0.18x+6.34+0.36,
故eq \(y,\s\up6(^))增加0.36个单位.
例3 【解析】 (1)根据表中的数据画出散点图,如下:
由图看出,这些点分布在某条指数型函数曲线y=c1ec2x的周围,于是令z=ln y,列表如下:
作出散点图,如下:
由表中数据可求得z与x之间的回归直线方程为eq \(z,\s\up6(^))=0.693+0.020x,则有eq \(y,\s\up6(^))=e0.693+0.020x.
(2)由(1)知,当x=168时,eq \(y,\s\up6(^))=e0.693+0.020×168≈57.57,所以在校男生身高为168 cm,预测他的体重约为57.57 kg.
跟踪训练3 解析:由表中测得的数据可以作出散点图,如图.
观察散点图中样本点的分布规律,可以判断样本点分布在某一条曲线附近,表示该曲线的函数模型是Q=m·hn(m,n是正的常数).两边取常用对数,
则lg Q=lg m+n·lg h,
令y=lg Q,x=lg h,那么y=nx+lg m,
即为线性函数模型y=bx+a的形式(其中b=n,a=lg m).
由下面的数据表,用最小二乘法可求得eq \(b,\s\up6(^))≈2.509 7,eq \(a,\s\up6(^))=-0.707 7,所以n≈2.51,m≈0.196.
于是所求得的回归方程为Q=0.196·h2.51.最新课程标准
1.通过对典型案例的探究,了解回归分析的基本思想、方法及其初步应用.
2.会求回归直线方程,并用回归直线方程进行预报.(重点、难点)
计算
r=eq \f(\i\su(i=1,n, )xi-\(x,\s\up6(-))yi-\(y,\s\up6(-)),\r(\i\su(i=1,n, )xi-\(x,\s\up6(-))2\i\su(i=1,n, )yi-\(y,\s\up6(-))2))=eq \f(\i\su(i=1,n,x)iyi-n\(x,\s\up6(-)) \(y,\s\up6(-)),\r(\i\su(i=1,n,x)\\al(2,i)-n\(x,\s\up6(-))2\i\su(i=1,n,y)\\al(2,i)-n\(y,\s\up6(-))2))
性质
范围
|r|≤1且x与y正相关的充要条件是r>0
x与y负相关的充要条件是r<0
线性相
关程度
|r|越接近1,线性相关性越强
|r|越接近0,线性相关性越弱
|r|=1的充要条件是成对数据构成的点都在回归直线上
x
1
2
3
4
y
1
3
5
7
x
5
10
15
20
25
30
y
7.25
8.12
8.95
9.9
10.9
11.8
x
1
2
3
y
3
5.99
12.01
身高x(cm)
60
70
80
90
100
110
体重y(kg)
6.13
7.90
9.99
12.15
15.02
17.50
身高x(cm)
120
130
140
150
160
170
体重y(kg)
20.92
26.86
31.11
38.85
47.25
55.05
i
1
2
3
4
5
6
7
水深h(厘米)
0.7
1.1
2.5
4.9
8.1
10.2
13.5
流量Q(升/分钟)
0.082
0.25
1.8
11.2
37.5
66.5
134
xi
5
10
15
20
25
30
yi
7.25
8.12
8.95
9.9
10.9
11.8
xiyi
36.25
81.2
134.25
198
272.5
354
xeq \\al(2,i)
25
100
225
400
625
900
x
60
70
80
90
100
110
z
1.81
2.07
2.30
2.50
2.71
2.86
x
120
130
140
150
160
170
z
3.04
3.29
3.44
3.66
3.86
4.01
i
hi
Qi
xi=lg hi
yi=lg Qi
xeq \\al(2,i)
xiyi
1
0.7
0.082
-0.154 9
-1.086 2
0.024
0.168 3
2
1.1
0.25
0.041 4
-0.602 1
0.001 7
-0.024 9
3
2.5
1.8
0.397 9
0.255 3
0.158 3
0.101 6
4
4.9
11.2
0.690 2
1.049 2
0.476 4
0.724 2
5
8.1
37.5
0.908 5
1.574 0
0.825 4
1.430 0
6
10.2
66.5
1.008 6
1.822 8
1.017 3
1.838 5
7
13.5
134
1.130 3
2.127 1
1.277 6
2.404 3
∑
41
251.332
4.022
5.140 1
3.780 7
6.642
高中数学人教B版 (2019)选择性必修 第二册4.3.1 一元线性回归模型学案设计: 这是一份高中数学人教B版 (2019)选择性必修 第二册4.3.1 一元线性回归模型学案设计,共23页。
人教B版 (2019)选择性必修 第二册第四章 概率与统计4.3 统计模型4.3.1 一元线性回归模型学案: 这是一份人教B版 (2019)选择性必修 第二册第四章 概率与统计4.3 统计模型4.3.1 一元线性回归模型学案,共18页。学案主要包含了思路导引,补偿训练等内容,欢迎下载使用。
高中4.1.1 条件概率学案设计: 这是一份高中4.1.1 条件概率学案设计,共7页。