所属成套资源:【同步课堂】2025-2026学年高中数学选择性必修三同步讲义(人教A版2019)
- 第7章第3节 离散型随机变量的数字特征 2025-2026学年高中数学选择性必修三同步复习讲义(人教A版2019)学案0 次下载
- 第7章第4节 二项分布与超几何分布 2025-2026学年高中数学选择性必修三同步复习讲义(人教A版2019)学案0 次下载
- 第7章第5节 正态分布 2025-2026学年高中数学选择性必修三同步复习讲义(人教A版2019)学案0 次下载
- 第8章第1节 成对数据的统计相关性 2025-2026学年高中数学选择性必修三同步复习讲义(人教A版2019)学案0 次下载
- 第8章第3节 列联表与独立性检验 2025-2026学年高中数学选择性必修三同步复习讲义(人教A版2019)试卷0 次下载
高中数学人教A版 (2019)选择性必修 第三册一元线性回归模型及其应用优秀导学案
展开 这是一份高中数学人教A版 (2019)选择性必修 第三册一元线性回归模型及其应用优秀导学案,共9页。学案主要包含了知识点的认识,解题方法点拨等内容,欢迎下载使用。
▉题型1 经验回归方程与经验回归直线
【知识点的认识】
线性回归是利用数理统计中的回归分析,来确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法之一,运用十分广泛.分析按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析.如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析.如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析.变量的相关关系中最为简单的是线性相关关系,设随机变量与变量之间存在线性相关关系,则由试验数据得到的点将散布在某一直线周围.因此,可以认为关于的回归函数的类型为线性函数.
【解题方法点拨】
例:对于线性回归方程ŷ=1.5x+45,x1∈{1,7,5,13,19},则y=
解:x=1+7+5+13+195=9,因为回归直线必过样本中心(x,y),
所以y=1.5×9+45=13.5+45=58.5.
故答案为:58.5.
方法就是根据线性回归直线必过样本中心(x,y),求出x,代入即可求y.这里面可以看出线性规划这类题解题方法比较套路化,需要熟记公式.
1.已知两个随机变量(X,Y)的4组成对数据为(4,2),(6,m),(8,5),(10,6).由这4组数据可得Y关于X的线性回归方程为Ŷ=0.7X−0.9,则m=( )
A.2.8B.3C.3.3D.4
2.下列说法正确的是( )
A.样本数据点的中心(x,y)不一定在线性回归直线上
B.残差平方和越小的模型,拟合的效果越好
C.回归直线就是散点图中经过样本数据点最多的那条直线
D.如果两个变量的相关性越强,则相关系数r就越接近于1
3.对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的y称为预测值,观测值减去预测值称为残差.将某公司新产品自上市起的月份x与该月的对应销量y(单位:万件)整理成如表格:
建立y与x的线性回归方程为ŷ=0.21x+0.37,则第2个月和第4个月的残差和为( )
A.﹣0.919B.﹣0.1C.0.1D.0.919
4.下列结论中,错误的是( )
A.数据4,1,6,2,9,5,8的第60百分位数为6
B.若随机变量ξ~N(1,σ2),P(ξ≤﹣2)=0.21,则P(ξ≤4)=0.79
C.已知经验回归方程为ŷ=b̂x+1.8,且x=2,y=20,则b̂=9.1
D.根据分类变量X与Y成对样本数据,计算得到χ2=9.632,依据小概率值α=0.001的χ2独立性检验(x0.001=10.828),可判断X与Y有关联,此推断犯错误的概率不大于0.001
5.具有相关关系的变量x、y满足的线性回归直线方程为y=bx+a,x、y的数据如下:
求2a+1b的最小值( )
A.4B.6C.8D.9
6.已知由样本数据(xi,yi)(i=1,2,3,…,10)组成一个样本,可得到回归直线方程为ŷ=2x+â,且x=3,y=4.7,则样本点(4,7)的残差为( )
A.0.3B.﹣0.3C.1.3D.﹣1.3
7.下列说法中正确的是( )
A.回归直线ŷ=b̂x+â恒过样本中心点(x,y),且至少过一个样本点
B.用决定系数R2刻画回归效果时,R2越接近1,说明模型的拟合效果越差
C.若随机变量X~B(4,34),则D(2X+1)=6
D.基于小概率值α的检验规则是:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α
8.已知变量x,γ呈线性相关关系,回归方程为ŷ=−x+â,且变量x,y的样本数据如下表所示
据此计算出在x=3时,预测值为﹣0.2,则m的值为( )
A.3B.2.8C.2D.1
9.第19届亚运会的吉祥物琮琮、莲莲、宸宸深受大家喜爱,某商家统计了最近5个月吉祥物的销量,如下表所示:若y与x线性相关,且线性回归方程为ŷ=−0.6x+â,则下列说法正确的是:( )
A.由题中数据可知,变量y与x正相关
B.当x=5时,残差为0.2
C.线性回归方程ŷ=−0.6x+5.7
D.可以预测当x=6时销量约为2万只
10.色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得数据列于表中.已知该产品的色度y和色差x之间满足线性相关关系,且ŷ=0.8x+â,现有一对测量数据为(30,m),若该数据的残差为0.6,则m=( )
A.23.4B.23.6C.23.8D.24.0
11.某学习小组对一组数据(xi,yi)(i=1,2,3,…,7)进行回归分析,甲同学首先求出回归直线方程ŷ=3x+2,样本点的中心为(2,m).乙同学对甲的计算过程进行检查,发现甲将数据(4,6)误输成(6,4),将这两个数据修正后得到回归直线方程ŷ=kx+4,则实数k=( )
A.138B.53C.103D.52
12.已知变量x,y的部分数据如下表,由表中数据得x,y之间的经验回归方程为ŷ=0.8x+â,现有一测量数据为(35,n),若该数据的残差为1.2,则n=( )
A.25.6B.28C.29.2D.24.4
13.色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得数据列于表中:已知该产品的色度y和色差x之间满足线性相关关系,且ŷ=0.8x+â,现有一对测量数据为(30,23.6),则该数据的残差为( )
A.﹣0.96B.﹣0.8C.0.8D.0.96
14.下列说法正确的是( )
A.若两个随机变量的线性相关性越强,则相关系数r的值越接近于1
B.根据分类变量X与Y的成对样本数据,计算得到χ2=4.712,依据α=0.05的独立性检验(x0.05=3.841),可判断X与Y无关
C.对具有线性相关关系的变量x,y,其线性回归方程为ŷ=0.3x﹣m,若样本点的中心为(m,2.8),则实数m的值是﹣4
D.已知随机变量X服从二项分布B(n,13),若E(3X+1)=6,则n=6
▉题型2 回归分析
【知识点的认识】
1、回归直线:
如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线.记为:ŷ=b̂x+â.求回归直线方程的一般步骤:
①作出散点图(由样本点是否呈条状分布来判断两个量是否具有线性相关关系),若存在线性相关关系;
②求回归系数;
③写出回归直线方程,并利用回归直线方程进行预测说明.
2、回归分析:
对具有相关关系的两个变量进行统计分析的一种常用方法.
建立回归模型的基本步骤是:
①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;
②画好确定好的解释变量和预报变量的散点图,观察它们之间的关系(线性关系).
③由经验确定回归方程的类型.
④按一定规则估计回归方程中的参数 (最小二乘法);
⑤得出结论后在分析残差图是否异常,若存在异常,则检验数据是否有误,模型是否合适等.
15.有一散点图如图所示,在六组数据(xi,yi)(i=1,2,…,6)中去掉B点后重新进行回归分析,则下列说法正确的是( )
A.样本数据的两变量x,y正相关
B.相关系数r的绝对值更接近于0
C.残差平方和变大
D.变量x与变量y相关性变强
16.下列有关线性回归分析的四个命题:
①线性回归直线必过样本数据的中心点(x,y);
②回归直线就是散点图中经过样本数据点最多的那条直线;
③当相关性系数r>0时,两个变量正相关;
④如果两个变量的相关性越强,则相关性系数r就越接近于1.
其中真命题的个数为( )
A.1个B.2个C.3个D.4个
▉题型3 残差及残差图
【知识点的认识】
﹣残差:实际值与回归模型预测值的差异.
﹣残差图:用来检查回归模型的拟合效果,横轴通常为预测值,纵轴为残差.
【解题方法点拨】
﹣计算:通过回归方程预测值,并计算残差.
﹣绘图:绘制残差图,分析残差是否符合随机分布.
17.已知一系列样本点(xi,yi)(i=1,2,3,…)的一个经验回归方程为ŷ=2x+â,若样本点(1,﹣1)的残差为2,则â=( )
A.﹣1B.1C.﹣5D.5
18.如果散点图中所有的散点都落在一条斜率不为0的直线上,则下列结论错误的是( )
A.解释变量和响应变量线性相关
B.相关系数r=±1
C.决定系数R2=1
D.残差平方和等于1
19.已知变量x和y的统计数据如表,若由表中数据得到回归直线方程为ŷ=−3.2x+â,则x=4时的残差为( )
A.0.2B.﹣0.3C.0.4D.﹣0.2
▉题型4 非线性回归模型
【知识点的认识】
﹣非线性回归:用于数据与回归模型之间的关系不是线性的情况,例如多项式回归、指数回归等.
【解题方法点拨】
﹣建模:选择合适的非线性模型,根据数据特点建立回归方程.
﹣拟合:使用非线性回归方法估计模型参数.
20.MCN即多频道网络,是一种新的网红经济运行模式,这种模式将不同类型和内容的PGC(专业生产内容)联合起来,在资本有力支持下,保障内容的持续输出,从而最终实现商业的稳定变现,在中国以直播电商、短视频为代表的新兴网红经济的崛起,使MCN机构的服务需求持续增长.数据显示,近年来中国MCN市场规模迅速扩大.下表为2018年﹣2022年中国MCN市场规模(单位:百亿元),其中2018年﹣2022年对应的代码依次为1﹣5.
(1)由上表数据可知,可用指数函数模型y=a•bx拟合y与x的关系,
①建立y关于x的回归方程;
②预测2025年中国MCN市场规模(单位:百亿元):
(2)从2018年﹣2022年中国MCN市场规模中随机抽取3个数据,记这3个数据中与y的差的绝对值小于1的个数为X,求X的分布列与期望.
参考数据:
其中vi=lnyi,y=15i=15 yi,v=15i=15 vi.
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v̂=â+β̂u的斜率和截距的最小二乘估计公式分别为β̂=i=1n uivi−nuvi=1nui2−nu2,â=v−β̂u.
参考数据:e2.196=8.99,e2,535=12.61,e2.874=17.71
21.生态学家高斯为研究有限资源下的种群增长问题,在实验室培养了草履虫,调查得到一组数据((ti,yi)(i=1,2,⋯,8),其中yi表示第ti天草履虫的数量),经研究该组数据可用Lgistic模型拟合,函数模型为y=2001+Ae−rt.设初始数量为y0(y0∈N*)(个/m1),A=200y0−1.经计算得到如下统计量的值:i=18 ti=36,i=18 zi≈0.2,i=18 ti2=204,i=18 tizi≈−33.4,其中zi=ln(200yi−1),
(1)求y关于t的经验回归方程,以及y0的估计值(r,A精确到小数点后1位);
(2)Lgistic模型可用于研究生物学中一般种群的“S”型增长,某种群数量f(t)与时间t的关系为f(t)=K1+Ae−rt(A,K>0),证明:当种群数量达到K的一半时,该种群增长速度最快.
附:对于一组数据(x1,y1),(x2,y2),⋯,(xn,yn),其经验回归直线ŷ=â+b̂x的斜率和截距的最小二乘估计分别为b̂=i=1n (xi−x)(yi−y)i=1n (xi−x)2,â=y−b̂x;e3.7≈40.4.
22.某企业最近十年的年份编号x与利润y(单位,万元)的统计数据如表所示:
若y与x满足经验回归方程:ŷ=b̂lnx+â,令u=lnx.
(1)根据提供的数据及最小二乘原理,求y关于x的经验回归方程;(系数精确到1)
(2)若企业利润的残差e1̂~N(μ,σ2),其中μ=0,σ=1.6.残差值在区间(μ﹣3σ,μ+3σ)外,就认为某年的利润统计数据有误.现对数据进行核查,发现后五年中某一年数据有误,其真实数据为66万元,求修正数据后的经验回归方程.(系数精确到1)
附:i=110 uiyi≈790.8,i=110 ui2≈27.7,u≈1.5;b̂=i=1n (xi−x)(yi−y)i=1n (xi−x)2,â=y−b̂x.
23.众所周知,乒乓球被称为中国的“国球”,是一种世界流行的球类体育项目,包括进攻、对抗和防守.某学校为了丰富学生的课后活动内容,增强学生体质,决定组织乒乓球活动社.以下是接下来7个星期(用x=1表示第1个星期,用x=2表示第二个星期,以此类推)参加活动的累计人数y(人)的统计数据.
(1)根据表中数据可以判断y与x大致满足回归模型ŷ=cdx,试建立y与x的回归方程(精确到0.01);
(2)为了更好地开展体育类型活动,学校继续调查全校同学的身高情况.采用按比例分层抽样抽取了男生30人,其身高的平均数和方差分别为171.5和13.0;抽取了女生20人,其身高的平均数和方差分别为161.5和27.0,试求全体学生身高的平均数和方差.
参考数据:y=66,z≈1.57,i=17xiyi=2681,i=17xizi=50.95,其中zi=lgyi,z=17i=17 zi;
参考公式:对于一组数据(u1,v1),(u2,v2),⋯,(un,vn),其回归直线v̂=α̂+βu的斜率和截距的最小二乘估计公式分别为β=i=1n uivi−nuvi=1n ui2−nu2,α̂=v−β̂u.
▉题型5 决定系数与模型的拟合效果
【知识点的认识】
﹣决定系数R2:衡量回归模型对数据的解释能力,取值范围在0到1之间,越接近1表示模型拟合效果越好.
【解题方法点拨】
﹣计算:通过回归模型的预测值与实际值计算决定系数,评估模型的解释力.
24.某团队尝试用回归模型甲、乙、丙、丁描述人的1000米跑步成绩与肺活量的关系,已知模型甲、乙、丙、丁对应的决定系数R2分别为0.14,0.17,0.72,0.45,则拟合效果最好的模型是( )
A.甲B.乙C.丙D.丁
25.下列说法正确的个数是( )
①线性相关系数|r|越接近1,两个变量的线性相关程度越强;
②独立性检验可以100%确定两个变量之间是否具有某种关系;
③在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高;
④甲、乙两个模型的决定系数R2分别约为0.88和0.80,则模型甲的拟合效果更好.
A.1B.2C.3D.4
26.在政府发布的光伏发电补贴政策的引导下,西北某地光伏发电装机量急剧上升,现对2016年至2023年的新增光伏装机量进行调查,根据散点图选择了两个模型进行拟合,并得到相应的经验回归方程.为判断模型的拟合效果,甲、乙、丙三位同学进行了如下分析:
(1)甲同学通过计算残差作出了两个模型的残差图,如图所示;
(2)乙同学求出模型①的残差平方和为0.4175、模型②的残差平方和为1.5625;
(3)丙同学分别求出模型①的决定系数R12=0.9520、模型②的决定系数为R22=0.9781;
经检验,模型①拟合效果最佳,则甲、乙、丙三位同学中,运算结果肯定出错的同学是 .(填“甲”或“乙”或“丙”)
27.已知成对样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2)中x1,x2,…,xn不全相等,且所有样本点(xi,yi)(i=1,2,…,n)都在直线y=−34x+1上,则这组成对样本数据的样本相关系数r= ,其决定系数R2= .
题型1 经验回归方程与经验回归直线
题型2 回归分析
题型3 残差及残差图
题型4 非线性回归模型
题型5 决定系数与模型的拟合效果
月份x
1
2
3
4
5
销量y
0.5
s
1
t
1.4
x
﹣1
1
3
5
y
0
0.8
1.2
2
x
﹣2
﹣1
0
1
2
y
5
4
m
2
1
时间x
1
2
3
4
5
销售量y(万只)
5
4.5
4
3.5
2.5
色差x
21
23
25
27
色度y
15
18
19
20
x
21
23
25
27
y
15
18
19
20
色差x
21
23
25
27
色度y
15
18
19
20
x
4
4.5
5
5.5
6
y
7
6
4
2
1
年份代码x
1
2
3
4
5
中国MCN市场规模y
1.12
1.68
2.45
3.35
4.32
y
v
i=15 xiyi
i=15 xivi
2.58
0.84
46.83
15.99
x
1
2
3
4
5
6
7
8
9
10
lnx
……
1.8
1.9
2.1
2.2
2.3
y
10
25
35
42
48
54
58
60
62
56
x
1
2
3
4
5
6
7
y
6
14
20
37
74
108
203
相关学案
这是一份高中数学人教A版 (2019)选择性必修 第三册一元线性回归模型及其应用优秀导学案,共9页。学案主要包含了知识点的认识,解题方法点拨等内容,欢迎下载使用。
这是一份高中数学8.2 一元线性回归模型及其应用优秀导学案,文件包含人教A版高中数学选择性必修第三册同步讲义第27讲82一元线性回归模型及其应用原卷版doc、人教A版高中数学选择性必修第三册同步讲义第27讲82一元线性回归模型及其应用含解析doc等2份学案配套教学资源,其中学案共0页, 欢迎下载使用。
这是一份人教B版 (2019)选择性必修 第二册4.3.1 一元线性回归模型学案,文件包含431一元线性回归模型教师版2023-2024学年高二数学同步讲义人教B版2019选择性必修第二册pdf、431一元线性回归模型学生版2023-2024学年高二数学同步讲义人教B版2019选择性必修第二册pdf等2份学案配套教学资源,其中学案共24页, 欢迎下载使用。
相关学案 更多
- 1.电子资料成功下载后不支持退换,如发现资料有内容错误问题请联系客服,如若属实,我们会补偿您的损失
- 2.压缩包下载后请先用软件解压,再使用对应软件打开;软件版本较低时请及时更新
- 3.资料下载成功后可在60天以内免费重复下载
免费领取教师福利 






.png)
.png)



