人教版新课标A选修1-21.1回归分析的基本思想及其初步应用学案设计
展开
这是一份人教版新课标A选修1-21.1回归分析的基本思想及其初步应用学案设计,共8页。学案主要包含了求线性回归方程,线性回归分析,非线性回归分析等内容,欢迎下载使用。
一、求线性回归方程
活动与探究1
某班5名学生的数学和物理成绩如下表:
(1)画出散点图;
(2)求物理成绩y对数学成绩x的回归直线方程;
(3)一名学生的数学成绩是96,试预测他的物理成绩.
迁移与应用
某商场经营一批进价是30元/台的小商品,在市场试验中发现,此商品的销售单价x(x取整数)元与日销售量y台之间有如下关系:
(1)y与x是否具有线性相关关系?如果具有线性相关关系,求出回归直线方程.(方程的斜率保留一位有效数字)
(2)设经营此商品的日销售利润为P元,根据(1)写出P关于x的函数关系式,并预测当销售单价x为多少元时,才能获得最大日销售利润.
(1)求线性回归方程的基本步骤:
(2)需特别注意的是,只有在散点图大致呈直线时,求出的线性回归方程才有实际意义,否则求出的回归方程毫无意义.
二、线性回归分析
活动与探究2
某运动员训练次数与运动成绩之间的数据关系如下:
(1)作出散点图;
(2)求出线性回归方程;
(3)作出残差图,并说明模型的拟合效果;
(4)计算R2,并说明其含义.
迁移与应用
在一段时间内,某种商品的价格x元和需求量y件之间的一组数据为:
且知x与y具有线性相关关系,求出y关于x的回归直线方程,并说明拟合效果的好坏.
“相关指数R2、残差图”在回归分析中的作用:
(1)相关指数R2是用来刻画回归效果的,由R2=1-eq \f(\(∑,\s\up6(n),\s\d4(i=1))(yi-\(y,\s\up6(^))i)2,\(∑,\s\up6(n),\s\d4(i=1))(yi-\x\t(y))2)可知,R2越大,意味着残差平方和越小,也就是说模型的拟合效果就越好.
(2)残差图也是用来刻画回归效果的,判断依据是:残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合精度越高,回归方程预报的精度也越高.
三、非线性回归分析
活动与探究3
下表为收集到的一组数据:
(1)作出x与y的散点图,并猜测x与y之间的关系;
(2)建立x与y的关系,预报回归模型并计算残差;
(3)利用所得模型,预报x=40时y的值.
迁移与应用
在一次抽样调查中测得样本的5个样本点,数值如下表:
试建立y关于x之间的回归方程.
非线性回归问题有时并不给出经验公式,这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决.
答案:
课前·预习导学
【预习导引】
1.(1)确定性 非确定性 (2)相关
(3) eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x) (eq \x\t(x),eq \x\t(y)) (4)随机误差 解释变量 预报变量
预习交流1 D
2.yi-bxi-a yi-eq \(y,\s\up6(^))i yi-eq \(b,\s\up6(^))xi-eq \(a,\s\up6(^))
3.1-eq \f(\(∑,\s\up6(n),\s\d4(i=1))(yi-\(y,\s\up6(^))i)2,\(∑,\s\up6(n),\s\d4(i=1))(yi-\x\t(y))2)
预习交流2 提示:散点图可以说明变量间有无线性相关关系,但只能粗略地说明两个变量之间关系的密切程度,而相关指数R2能精确地描述两个变量之间的密切程度.
预习交流3 提示:(1)回归方程只适用于所研究的样本的总体.
(2)所建立的回归方程一般都有时间性.
(3)样本取值的范围会影响回归方程的适用范围.
(4)不能期望回归方程得到的预报值就是预报变量的精确值.事实上,它是预报变量的可能取值的平均值.
课堂·合作探究
【问题导学】
活动与探究1 思路分析:先画散点图,分析物理与数学成绩是否有线性相关关系,若相关,再利用线性回归模型求解预报变量.
解:(1)散点图如图所示.
(2)因为eq \x\t(x)=eq \f(1,5)×(88+76+73+66+63)=73.2,
eq \x\t(y)=eq \f(1,5)×(78+65+71+64+61)=67.8,
eq \(∑,\s\up6(5),\s\d4(i=1))xiyi=88×78+76×65+73×71+66×64+63×61=25 054,
eq \(∑,\s\up6(5),\s\d4(i=1))xeq \\al(2,i)=882+762+732+662+632=27 174.
所以eq \(b,\s\up6(^))=eq \f(\(∑,\s\up6(5),\s\d4(i=1))xiyi-5\x\t(x)\x\t(y),\(∑,\s\up6(5),\s\d4(i=1))x\\al(2,i)-5\x\t(x)2)=eq \f(25 054-5×73.2×67.8,27 174-5×73.22)
≈0.625,
eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x)≈67.8-0.625×73.2=22.05.
所以y对x的回归直线方程是eq \(y,\s\up6(^))=0.625x+22.05.
(3)x=96,则eq \(y,\s\up6(^))=0.625×96+22.05≈82,即可以预测他的物理成绩是82.
迁移与应用 解:(1)散点图如图所示,从图中可以看出这些点大致分布在一条直线附近,因此两个变量线性相关.
设回归直线为eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),
由题知eq \x\t(x)=42.5,eq \x\t(y)=34,
则求得eq \(b,\s\up6(^))=eq \f(\(∑,\s\up6(4),\s\d4(i=1))(xi-\x\t(x))(yi-\x\t(y)),\(∑,\s\up6(4),\s\d4(i=1))(xi-\x\t(x))2)=eq \f(-370,125)≈-3.
eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x)=34-(-3)×42.5=161.5.
∴eq \(y,\s\up6(^))=-3x+161.5.
(2)依题意有
P=(-3x+161.5)(x-30)
=-3x2+251.5x-4 845
=-3eq \b\lc\(\rc\)(\a\vs4\al\c1(x-\f(251.5,6)))2+eq \f(251.52,12)-4 845.
∴当x=eq \f(251.5,6)≈42时,P有最大值,约为426.
即预测销售单价为42元时,能获得最大日销售利润.
活动与探究2 思路分析:先画出散点图,确定是否具有线性相关关系,求出回归方程,再求出残差,确定模型的拟合效果和R2的含义.
解:(1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.
(2)eq \x\t(x)=39.25,eq \x\t(y)=40.875,
eq \i\su(i=1,8,x)eq \\al(2,i)=12 656,
eq \i\su(i=1,8,y)eq \\al(2,i)=13 731,
eq \i\su(i=1,8,x)iyi=13 180,
∴eq \(b,\s\up6(^))=eq \f(\(∑,\s\up6(8),\s\d4(i=1))(xi-\x\t(x))(yi-\x\t(y)),\(∑,\s\up6(8),\s\d4(i=1))(xi-\x\t(x))2)=eq \f(\i\su(i=1,8,x)iyi-8\x\t(x)\x\t(y),\i\su(i=1,8,x)\\al(2,i)-8\x\t(x)2)≈1.041 5,
eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x)=-0.003 875,
∴线性回归方程为eq \(y,\s\up6(^))=1.041 5x-0.003 875.
(3)作残差图如图所示,
由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适.
(4)计算得相关指数R2=0.985 5,说明了该运动员成绩的差异有98.55%是由训练次数引起的.
迁移与应用 解:eq \x\t(x)=eq \f(1,5)×(14+16+18+20+22)=18,
eq \x\t(y)=eq \f(1,5)×(12+10+7+5+3)=7.4,
eq \(∑,\s\up6(5),\s\d4(i=1))xeq \\al(2,i)=142+162+182+202+222=1 660,
eq \(∑,\s\up6(5),\s\d4(i=1))yeq \\al(2,i)=122+102+72+52+32=327,
eq \(∑,\s\up6(5),\s\d4(i=1))xiyi=14×12+16×10+18×7+20×5+22×3=620,
∴eq \(b,\s\up6(^))=eq \f(\(∑,\s\up6(5),\s\d4(i=1))xiyi-5\x\t(x)\x\t(y),\(∑,\s\up6(5),\s\d4(i=1))x\\al(2,i)-5\x\t(x)2)=eq \f(620-5×18×7.4,1 660-5×182)=-1.15.
∴eq \(a,\s\up6(^))=7.4+1.15×18=28.1,
∴y对x的回归直线方程为eq \(y,\s\up6(^))=-1.15x+28.1.
列出残差表为
∴eq \(∑,\s\up6(5),\s\d4(i=1))(yi-eq \(y,\s\up6(^))i) 2=0.3,eq \(∑,\s\up6(5),\s\d4(i=1))(yi-eq \x\t(y))2=53.2,
R2=1-eq \f(\(∑,\s\up6(5),\s\d4(i=1))(yi-\(y,\s\up6(^)))2,\(∑,\s\up6(5),\s\d4(i=1))(yi-\x\t(y))2)≈0.994.
∴R2≈0.994,拟合效果较好.
活动与探究3 思路分析:先由数值表作出散点图,然后根据散点的形状模拟出近似函数,进而转化为线性函数,由数值表求出回归函数.
解:(1)作出散点图如图所示,从散点图中可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y=c1ec2x的周围,其中c1,c2为待定的参数.
(2)对两边取对数把指数关系变为线性关系,令z=ln y,则变换后的样本点应分布在直线z=bx+a,a=ln c1,b=c2的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为:
求得回归直线方程为eq \(z,\s\up6(^))=0.272x-3.849,
∴eq \(y,\s\up6(^))=e0.272x-3.849.
残差
(3)当x=40时,y=e0.272x-3.849≈1 131.
迁移与应用 解:画出散点图如图所示.
根据散点图可知y与x近似地呈反比例函数关系,设y=eq \f(k,x),令t=eq \f(1,x),则y=kt,原数据变为:
由散点图可以看出y与t呈近似的线性相关关系.列表如下:
所以eq \x\t(t)=1.55,eq \x\t(y)=7.2.
所以eq \(b,\s\up6(^))=eq \f(\(∑,\s\up6(5),\s\d4(i=1))tiyi-5\x\t(t)\x\t(y),\(∑,\s\up6(5),\s\d4(i=1))t\\al(2,i)-5\x\t(t)2)≈4.134 4.
eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(t)≈0.8,
所以eq \(y,\s\up6(^))=4.134 4t+0.8.
所以y关于x的回归方程是eq \(y,\s\up6(^))=eq \f(4.134 4,x)+0.8.
当堂检测
1.有下列说法:
①线性回归分析就是由样本点去寻找一条直线,使它贴近这些样本点的数学方法;
②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;
③通过回归方程及其回归系数,可以估计和观测变量的取值和变化趋势;
④因为由任何一组观测值都可以求得一个回归直线方程,所以没有必要进行相关性检验.
其中正确说法的个数是( ).
A.1 B.2 C.3 D.4
答案:C 解析:①反映的正是最小二乘法思想,故正确.
②反映的是画散点图的作用,也正确.
③反映的是回归模型y=bx+a+e,其中e为随机误差,故也正确.
④是不正确的,在求回归方程之前必须进行相关性检验,以确定两变量的关系.
2.在两个变量y与x的回归模型中,分别选择了4个不同的模型.它们的相关指数R2如下,其中拟合效果最好的模型是( ).
A.模型1的相关指数R2为0.98
B.模型2的相关指数R2为0.80
C.模型3的相关指数R2为0.50
D.模型4的相关指数R2为0.25
答案:A 解析:相关指数R2越接近于1,则该模型的拟合效果就越好,精度越高.
3.设有一个回归方程=2-1.5x,则变量x增加1个单位时,( ).
A.y平均增加1.5个单位
B.y平均增加2个单位
C.y平均减少1.5个单位
D.y平均减少2个单位
答案:C 解析:∵=-1.5<0,
∴x增加1个单位时,y平均减少1.5个单位.
4.若施肥量x(kg)与小麦产量y(kg)之间的回归直线方程为=250+4x,当施肥量为50 kg时,预计小麦产量为________.
答案:450 kg 解析:将x=50代入回归方程得=450 kg.
5.若对于变量y与x的10组统计数据的回归模型中,相关指数R2=0.95,又知残差平方和为120.53,那么的值为__________.
答案:2 410.6 解析:依题意有0.95=1-,
所以=2 410.6.
x
35
40
45
50
y
56
41
28
11
次数(x)
30
33
35
37
39
44
46
50
成绩(y)
30
34
37
39
42
46
48
51
x(元)
14
16
18
20
22
y(件)
12
10
7
5
3
x
21
23
25
27
29
32
35
y
7
11
21
24
66
115
325
x
0.25
0.5
1
2
4
y
16
12
5
2
1
yi-eq \(y,\s\up6(^))i
0
0.3
-0.4
-0.1
0.2
yi-eq \x\t(y)
4.6
2.6
-0.4
-2.4
-4.4
x
21
23
25
27
29
32
35
z
1.946
2.398
3.045
3.178
4.190
4.745
5.784
yi
7
11
21
24
66
115
325
eq \(y,\s\up6(^))i
6.443
11.101
19.125
32.950
56.770
128.381
290.325
eq \(e,\s\up6(^))i
0.557
-0.101
1.875
-8.950
9.23
-13.381
34.675
t
4
2
1
0.5
0.25
y
16
12
5
2
1
序号
ti
yi
tiyi
teq \\al(2,i)
yeq \\al(2,i)
1
4
16
64
16
256
2
2
12
24
4
144
3
1
5
5
1
25
4
0.5
2
1
0.25
4
5
0.25
1
0.25
0.062 5
1
∑
7.75
36
94.25
21.312 5
430
提示:用最精练的语言把你当堂掌握的核心知识的精华部分和基本技能的要领部分写下来并进行识记.
相关学案
这是一份高中数学人教版新课标A选修1-21.1回归分析的基本思想及其初步应用导学案及答案,
这是一份数学选修1-21.1回归分析的基本思想及其初步应用学案及答案,
这是一份高中数学人教版新课标A选修1-21.1回归分析的基本思想及其初步应用导学案,