人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用同步测试题
展开考法一 一元线性回归模型
【例1-1】(2024·四川绵阳)已知变量x,y之间的线性回归方程为,且变量x,y之间的一组相关数据如表所示,
则下列说法正确的是( )
A.
B.变量y与x是负相关关系
C.该回归直线必过点
D.x增加1个单位,y一定增加2个单位
【例1-2】(2024湖南长沙)党的十八大以来,全国各地区各部门持续加大就业优先政策实施力度,促进居民收入增长的各项措施持续发力,居民分享到更多经济社会发展红利,居民收入保持较快增长,收入结构不断优化,随着居民总收入较快增长,全体居民人均可支配收入也在不断提升.下表为某市2014~2022年全体居民人均可支配收入,将其绘制成散点图(如图1),发现全体居民人均可支配收入与年份具有线性相关关系.
参考数据:.
参考公式:对于一组数据,其回归直线方程的斜率和截距的最小二乘估计分别为.
(1)设年份编号为(2014年的编号为1,2015年的编号为2,依此类推),记全体居民人均可支配收入为(单位:万元),求经验回归方程(结果精确到0.01);
(2)为进一步对居民人均可支配收入的结构进行分析,某分析员从2014~2022中任取2年的数据进行分析,将选出的人均可支配收入超过3万的年数记为,求随机变量的分布列与数学期望.
【例1-3】(2023河南南阳)在线性回归方程中,为回归系数,下列关于的说法中不正确的是( )
A.为回归直线的斜率
B.,表示随增加,值增加,,表示随增加,值减少
C.是唯一确定的值
D.回归系数的统计意义是当每增加(或减少)一个单位,平均改变个单位
【一隅三反】
1.(2023青海海南)某厂近几年陆续购买了几台 A 型机床,该型机床已投入生产的时间x(单位:年)与当年所需要支出的维修费用y(单位:万元)有如下统计资料:
根据表中的数据可得到线性回归方程为 则该型机床已投入生产的时间为10年时,当年所需要支出的维修费用估计为( )
A.12.9万元B.12.36万元
C.13.1万元D.12.38 万元
2.(2024·甘肃陇南)(多选)某厂近几年陆续购买了几台 A 型机床,该型机床已投入生产的时间x(单位:年)与当年所需要支出的维修费用y(单位:万元)有如下统计资料:
根据表中的数据可得到经验回归方程为. 则( )
A.
B.y与x的样本相关系数
C.表中维修费用的第60百分位数为6
D.该型机床已投入生产的时间为 10年时,当年所需要支出的维修费用一定是12.38万元
3.(2024·陕西)某村在推进乡村振兴的过程中,把做活乡村产业作为强村富民的重要抓手,因地制宜推进茶叶种植,成立了茶叶合作社.为了对茶叶在销售旺季进行合理定价,合作社进行了市场调研,得到了销售旺季时销量(吨)关于售价(元/公斤)的散点图.
(1)求关于的线性回归方程;
(2)该合作社2023年茶叶总产量为150吨,如果在销售旺季时售价为250元/公斤,在销售旺季没能售出的,年底以每公斤100元的价格卖给批发商,则该合作社2023年的总销售额为多少万元?
公式及参考数据:关于的线性回归方程为,其中,;,,,.
考法二 残差的计算
【例2】(2024·云南大理)已知某种商品的广告费支出(单位:万元)与销售额(单位:万元)之间有如下表对应数据:
根据表中数据得到关于的经验回归方程为,则当时,残差为 .(残差观测值-预测值)
【一隅三反】
1.(2023黑龙江双鸭山)色差和色度是衡量玩具质量优劣的重要指标,已知该产品的色度和色差之间满足线性相关关系,且,现有一对测量数据为(30,22.8),则该数据的残差为( )
A.0.6B.0.4C.D.
2.(2023·河南)已知一组样本数据,,,,根据这组数据的散点图分析与之间的线性相关关系,若求得其线性回归方程为,则在样本点处的残差为( )
A.38.1B.22.6C.D.91.1
3.(2024·云南楚雄)对具有线性相关关系的变量有一组观测数据(),其经验回归方程为,且,,则相应于点的残差为 .
考法三 回归效果的刻画方式
【例3-1】(2024吉林长春)(多选)对两组线性相关成对数据进行回归分析,得到不同的统计结果,第一组和第二组成对数据的样本相关系数,残差平方和,决定系数分别为和,则( )
A.若,则第一组成对数据的线性相关关系比第二组的强
B.若,则第一组成对数据的线性相关关系比第二组的强
C.若,则第二组成对数据的经验回归模型拟合效果比第一组的好
D.若,则第二组成对数据的经验回归模型拟合效果比第一组的好
【例3-2】(2024黑龙江哈尔滨)如图,5个数据,去掉后,下列说法正确的是( )
A.样本相关系数r变小
B.残差平方和变大
C.决定系数变大
D.解释变量x与响应变量 y的相关性变弱
【一隅三反】
1.(2024河北邢台)中国茶文化博大精深、茶水的口感与茶叶的类型和水的温度有关,某数学建模小组建立了茶水冷却时间x和茶水温度y的一组数据,经过分析,提出了四种回归模型,①②③④四种模型的残差平方和的值分别是1.23、0.80、0.12、1.36.则拟合效果最好的模型是( )
A.模型①B.模型②C.模型③D.模型④
2.(2023四川成都)收集一只棉铃虫的产卵数与温度的几组数据后发现两个变量有相关关系,按不同的曲线来拟合与之间的回归方程,并算出了对应的决定系数如下表:
则这组数据模型的回归方程的最好选择应是( )
A.B.
C.D.
3.(2023·江苏徐州)(多选)某研究小组采集了组数据,作出如图所示的散点图.若去掉后,下列说法正确的是( )
A.相关系数变小
B.决定系数变大
C.残差平方和变大
D.解释变量与预报变量的相关性变强
4.(2024重庆·开学考试)(多选)为研究女儿身高与母亲身高的关系,现经过随机抽样获得成对样本数据,,下列说法正确的是( )
A.落在回归直线上的样本点越多,回归直线方程的拟合效果越好
B.样本相关系数越大,变量线性相关程度越强
C.决定系数越小,残差平方和越大,模型的拟合效果越好
D.决定系数越大,残差平方和越小,模型的拟合效果越好
考法四 经验回归模型的选择
【例4-1】(2023河南信阳·期末)如图是两个变量的散点图,y关于x的回归方程可能是( )
A.B.C.D.
【例4-2】(2023江苏)在一次数学建模活动中,某同学采集到如下一组数据:
以下四个函数模型(a,b为待定系数)中,最能反映y与x的函数系的是( )
A.B.C.D.
【一隅三反】
1.(2023河南)已知关于变量有相关关系,由观测数据得到的样本数据散点图如图所示,则该组观测数据中关于的回归方程可能是( )
A.B.
C.D.
2.(2023福建福州)某个国家某种病毒传播的中期感染人数y和天数x的散点图如图所示,下列最适宜作为感染人数y和天数x的经验回归方程类型的是( )
A.B.
C.D.
考法五 非线性回归方程
【例5-1】(2023·四川遂宁)某池塘中水生植物的覆盖水塘面积x(单位:)与水生植物的株数y(单位:株)之间的相关关系,收集了4组数据,用模型去拟合x与y的关系,设,x与z的数据如表格所示:
得到x与z的线性回归方程,则 .
【例5-2】(2024江西·期中)2020年是具有里程碑意义的一年,我们将全面建成小康社会,实现第一个百年奋斗目标;2020年也是脱贫攻坚决战决胜之年.为贯彻落实党中央全面建设小康社会的战略部署.某贫困地区的广大党员干部深入农村积极开展“精准扶贫”工作﹒经过多年的精心帮扶,2020年8月,为估计该地能否在2020年全面实现小康,统计了该地当时最贫困的一个家庭2020年1至7月的人均月纯收入,作出散点图如下.观察散点图,发现其家庭人均月纯收入(元)与时间代码之间不具有线性相关关系(记2020年1月、2月…分别为,,…,依此类推),现考虑用对数函数模型和指数函数模型分别对两个变量的关系进行拟合.
(1)根据散点图判断,与(,均为大于零的常数)哪一个适宜作为家庭人均月纯收入关于时间代码的回归方程类型;(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及参考数据,求关于的回归方程.
参考数据:
其中,.
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为,.
【一隅三反】
1.(2023·全国·模拟预测)以函数模型去拟合一组数据,,…,,设,,,则c的值为 .
2.(2024山东·开学考试)某市为繁荣地方经济,大力实行人才引进政策,为了解政策的效果,统计了2018-2023年人才引进的数量(单位:万人),并根据统计数据绘制了如图所示的散点图(表示年份代码,年份代码1-6分别代表2018-2023年).
(1)根据散点图判断与(均为常数)哪一个适合作为关于的回归方程类型;(给出结论即可,不必说明理由)
(2)根据(1)的结果及表中的数据,求出关于的回归方程,并预测该市2025年引进人才的数量;
(3)从这6年中随机抽取4年,记引进人才数量超过4万人的年数为,求的分布列和数学期望.
参考数据:
其中.
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:.
3.(2024浙江宁波 )某企业对2023年上半年的月利润情况进行调查统计,得到数据如下:
根据以上数据,绘制了散点图.
(1)根据散点图判断,与(均为大于零的常数)哪一个更适宜作为描述与关系的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果求出关于的回归方程;
(3)已知该企业的产品合格率为,现随机抽取9件产品进行检测,则这9件产品中合格的件数最有可能是多少?
参考数据:
其中.
参考公式:用最小二乘法求经验回归直线方程的系数公式为,
,.
单选题
1.(2024·全国·模拟预测)已知与之间的一组数据:
则与的线性回归方程必过定点( )
A.B.
C.D.
2.(2024安徽)下表数据为年我国生鲜零售市场规模(单位:万亿元),根据表中数据可求得市场规模关于年份代码的线性回归方程为,则( )
A.1.01B.3.68C.3.78D.4.7
3.(2024江西上饶)根据如下样本数据,得到回归直线方程,则( )
A.,B.,
C.,D.,
4.(2024辽宁)下列有关回归分析的说法正确的是( )
A.样本相关系数越大,则两变量的相关性就越强.
B.回归直线就是散点图中经过样本数据点最多的那条直线.
C.回归直线方程不一定过样本中心点.
D.回归分析中,样本相关系数,则两变量是负相关关系.
5.(2023·江苏苏州)为研究某地区疫情结束后一段时间内的复工率,用模型(1)和模型(2)模拟复工率y(%)与复工时间x(x的取值为5,10,15,20,25,30天)的回归关系:模型(1),模型(2),设两模型的决定系数依次为和.若两模型的残差图分别如下,则( )
A.C.>D.、关系不能确定
6.(2024河南)两个变量与的回归模型中,分别选择了4个不同的模型,其中拟合效果最好的模型是( )
A.模型1的决定系数B.模型2的决定系数
C.模型3的决定系数D.模型4的决定系数
7.(2024天津)下列说法中正确的个数为( )个
①互斥事件一定是对立事件.
②在回归直线方程中,当解释变量每增加一个单位时,预报变量增加个单位;
③两个随机变量的线性相关性越强,相关系数的绝对值越接近于;
④在回归分析模型中,若相关指数越大,则残差平方和越小,模型的拟合效果越好.
A.B.C.D.
8.(2024·浙江 )假设变量与变量的对观测数据为,两个变量满足一元线性回归模型.要利用成对样本数据求参数的最小二乘估计,即求使取最小值时的的值,则( )
A.B.
C.D.
多选题
9.(2024河南)已知变量之间的经验回归方程为,且变量的数据如下表所示:
则下列说法正确的是( )
A.变量之间负相关B.
C.当时,可估计的值为11D.当时,残差为
10(2023·江苏)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y(单位:℃)存在着较强的线性相关关系.某地观测人员根据下表的观测数据,建立了y关于x的经验回归方程,则下列说法正确的是( )
A.k的值是20
B.变量x,y呈正相关关系
C.若x的值增加1,则y的值约增加0.25
D.当蟋蟀52次/分鸣叫时,该地当时的气温预测值为33.5℃
11.(2023重庆沙坪坝·阶段练习)两个具有相关关系的变量x,y的一组数据为,,求得样本中心点为,回归直线方程为,决定系数为;若将数据调整为,,求得新的样本中心点为,回归直线方程为,决定系数为,则以下说法正确的有( )
附,,
A.B.
C.D.
12(2023·广东湛江 )某服装生产商为了解青少年的身高和体重的关系,在15岁的男生中随机抽测了10人的身高和体重,数据如下表所示:
由表中数据制作成如下所示的散点图:
由最小二乘法计算得到经验回归直线的方程为,相关系数为,决定系数为;经过残差分析确定为离群点(对应残差过大),把它去掉后,再用剩下的9组数据计算得到经验回归直线的方程为,相关系数为,决定系数为.则以下结论中正确的有( )
A.B.
C.D.
填空题
13.(2024全国·模拟预测)根据下表中的数据得到线性回归方程为,则可以预测,当时,的值为 .
14.(2023全国·专题练习)x和y的散点图如图所示,在相关关系中,若用拟合时的决定系数为,用拟合时的决定系数为,则,中较大的是 .
15.(2024内蒙古)下列四个命题中为真命题的是 .(写出所有真命题的序号)
①若随机变量服从二项分布,则其方差;
②若随机变量服从正态分布,且,则;
③已知一组数据的方差是3,则的方差是6;
④对具有线性相关关系的变量,其线性回归方程为,若样本点的中心为,则实数的值是.
16.(2023·陕西西安)数学兴趣小组对具有线性相关的两个变量x和y进行了统计分析,得到了下表:
并由表中数据求得y关于x的回归方程为,若a,b,c成等差数列,则 .
解答题
17.(2024青海)某企业投资两个新型项目,投资新型项目的投资额(单位:十万元)与纯利润(单位:万元)的关系式为,投资新型项目的投资额(单位:十万元)与纯利润(单位:万元)的散点图如图所示.
(1)求关于的线性回归方程;
(2)若该企业有一笔资金(万元)用于投资两个项目中的一个,为了收益最大化,应如何设计投资方案?
附:回归直线的斜率和截距的最小二乘估计分别为,.
18.(2024福建)某市政府为调查集贸蔬菜市场个体承包摊户年收入情况,随机抽取了6个摊户进行分析,得到样本数据,),其中和分别表示第个摊户和该摊户年收入(单位:万元),如下
(1)请用相关系数判断该组数据中与之间线性相关关系的强弱(若,相关性较强;若,相关性一般;若,相关性较弱);
(2)求关于的线性回归方程;
(3)若该集贸蔬菜市场个体承包摊户有300个,根据题设估计该集贸蔬菜市场个体承包摊户年收入总值.
参考公式:相关系数,对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计分别为,,.
19.(2024江苏)某公司为了解年研发资金投入量(单位:亿元)对年销售额(单位:亿元)的影响.对公司近12年的年研发资金投入量和年销售额的数据,进行了对比分析,建立了两个模型:①,②,其中,,,均为常数,为自然对数的底数,并得到一些统计量的值.令,,(,,,…,),经计算得如下数据:
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?
(2)根据(1)的分析及表中数据,求关于的回归方程.
附:(1)相关系数;(2)线性回归方程中,的计算公式分别为:,.
20.(2023·新疆哈密·期末)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如表:
参考公式:,
(1)在给定的坐标系中画出表中数据的散点图;
(2)求出关于的线性回归方程;
(3)预测加工10个零件需要多少小时?
21.(2024重庆 )研究表明,学生的学习成绩y(分)与每天投入的课后学习时间x(分钟)有较强的线性相关性.某校数学小组为了研究如何高效利用自己的学习时间,收集了该校高三(1)班学生9个月内在某学科(满分100分)所投入的课后学习时间和月考成绩的相关数据,下图是该小组制作的原始数据与统计图(散点图).
(1)当时,该小组建立了与的线性回归模型,求其经验回归方程;
(2)当时,由图中观察到,第3个月的数据点明显偏离回归直线,若剔除第3个月数据点后,用余下的4个散点做线性回归分析,得到新回归直线,证明:;
(3)当时,该小组确定了与满足的线性回归方程为:,该数学小组建议该班在该学科投入课后学习时间为40分钟,请结合第(1)(2)问的结论说明该建议的合理性.
附:经验回归直线的斜率和截距的最小二乘估计公式分别为:,
22.(2024云南)混凝土的抗压强度x较容易测定,而抗剪强度y不易测定,工程中希望建立一种能由x推算y的经验公式,下表列出了现有的9对数据,分别为,,…,.
以成对数据的抗压强度x为横坐标,抗剪强度y为纵坐标作出散点图,如图所示.
(1)从上表中任选2个成对数据,求该样本量为2的样本相关系数r.结合r值分析,由简单随机抽样得到的成对样本数据的样本相关系数是否一定能确切地反映变量之间的线性相关关系?
(2)根据散点图,我们选择两种不同的函数模型作为回归曲线,根据一元线性回归模型及最小二乘法,得到经验回归方程分别为:①,②.经验回归方程①和②的残差计算公式分别为,,.
(ⅰ)求;
(ⅱ)经计算得经验回归方程①和②的残差平方和分别为,,经验回归方程①的决定系数,求经验回归方程②的决定系数.
附:相关系数,决定系数,.
x
2
4
6
8
y
5
8.2
13
m
年份
2014
2015
2016
2017
2018
2019
2020
2021
2022
全体居民人均可支配收入(元)
18352
20110
22034
24153
26386
28920
30824
33803
35666
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7
1
3
4
5
7
15
20
30
40
45
拟合曲线
直线
指数曲线
抛物线
二次曲线
与的回归方程
0.746
0.996
0.902
0.002
x
0
1
2
3
y
0.24
0.51
1
2.02
3.98
8.02
x
3
4
6
7
z
2
2.5
4.5
7
5.15
1.55
17.5
20.95
3.85
月份
1
2
3
4
5
6
净利润(万元)
5
10
26
50
96
195
3.50
63.67
3.49
17.50
9.49
12.95
519.01
0
1
2
3
1
3
5
7
年份
2017
2018
2019
2020
2021
年份代码
1
2
3
4
5
市场规模
4.2
4.4
4.7
5.1
5.6
3
4
5
6
7
8
-3.0
-2.0
0.5
-0.5
2.5
4.0
5
6
8
12
14
10
8
6
5
1
x(单位:次数/分钟)
20
30
40
50
60
y(单位:℃)
25
27.5
29
32.5
36
编号
1
2
3
4
5
6
7
8
9
10
身高/cm
165
168
170
172
173
174
175
177
179
182
体重/kg
55
89
61
65
67
70
75
75
78
80
4
5
6
7
8
9
90
84
83
80
75
68
x
4
6
8
10
12
y
a
2
b
c
6
1
2
3
4
5
6
5
6
7
7
9
8
零件的个数x(个)
2
3
4
5
加工的时间y(小时)
2.5
3
4
4.5
月次
1
2
3
4
5
6
7
8
9
某科课后投入时间(分钟)
20
25
30
35
40
45
50
55
60
高三(1)班某科平均分(分)
65
68
75
72
73
73
73
73.5
73
x
141
152
168
182
195
204
223
254
277
y
23.1
24.2
27.2
27.8
28.7
31.4
32.5
34.8
36.2
人教A版 (2019)8.2 一元线性回归模型及其应用当堂达标检测题: 这是一份人教A版 (2019)<a href="/sx/tb_c4000364_t7/?tag_id=28" target="_blank">8.2 一元线性回归模型及其应用当堂达标检测题</a>,共38页。
高中数学人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用优秀综合训练题: 这是一份高中数学人教A版 (2019)选择性必修 第三册<a href="/sx/tb_c4000364_t7/?tag_id=28" target="_blank">8.2 一元线性回归模型及其应用优秀综合训练题</a>,文件包含人教A版高中数学选择性必修三同步讲义第20讲82一元线性回归模型及其应用821一元线性回归模型+822一元线性回归模型参数的最小二乘法估计原卷版doc、人教A版高中数学选择性必修三同步讲义第20讲82一元线性回归模型及其应用821一元线性回归模型+822一元线性回归模型参数的最小二乘法估计教师版doc等2份试卷配套教学资源,其中试卷共64页, 欢迎下载使用。
人教版高中数学选择性必修第三册8.2一元线性回归模型及其应用同步精练(含解析): 这是一份人教版高中数学选择性必修第三册8.2一元线性回归模型及其应用同步精练(含解析),共38页。试卷主要包含了5B.3C.3,2个单位D.平均减少3个单位,9之间的定义为超重,1),25,87等内容,欢迎下载使用。