所属成套资源:2026届高考数学二轮复习全国通用
相关系数、决定系数专项训练-2026届高考数学二轮复习
展开 这是一份相关系数、决定系数专项训练-2026届高考数学二轮复习,共14页。
(1)求关于的样本相关系数,并据此判断与的线性相关性强弱;(的值精确到0.01)
(2)若该社区2026年计划投入健身设施维护、更新的资金为25万元,求关于的线性回归方程,并预测该社区2026年参与健身的居民总人次.
附:(ⅰ)在线性回归方程中,,;
(ⅱ)样本相关系数,若,则可判断与的线性相关性很强;
(ⅲ),,,.
【答案】(1)0.99,与的线性相关性很强.
(2),46.3千人次.
【分析】(1)根据给定的数据代入相关系数公式计算,进而推断相关程度;
(2)利用最小二乘法求出线性回归直线方程,进而将代入计算即可.
【详解】(1)依题意得
,
因为,所以与的线性相关性很强.
(2)这10年每年用于健身设施维护、更新的资金投入的平均数
,
这10年每年参与健身活动的居民总人次的平均数
.
,,
所以线性回归方程为.
将代入,得,
即预测该社区2026年参与健身的居民总人次约为46.3千人次.
例2.(2026·湖南·一模)某科技公司统计了过去10年每年的研发投入(单位:亿元)和营业额(单位:亿元)的数据,如下表:
参考数据:,,,.
参考公式:相关系数.
(1)估计该公司平均每年的研发投入和平均每年的营业额;
(2)求样本的相关系数(精确到0.01);
(3)已知与的关系可以用线性回归模型进行拟合,若该公司今年投入13.5亿元用于研发,利用该模型预测该公司今年的营业额.
【答案】(1)12,650
(2)
(3)710亿元
【分析】(1)利用平均数的计算方法求和.
(2)将所给数据代入相关系数计算公式进行计算即可.
(3)根据线性回归方程必过样本中心点确定的值,再利用回归方程进行预测即可.
【详解】(1)平均每年的研发投入为
平均每年的营业额为
.
(2)将所给数据代入相关系数计算公式得
.
其中,所以.
(3)由题意知,回归直线过样本中心点,即,解得.
所以回归方程为.将代入回归方程,得,故预测该公司今年的营业额为710亿元.
例3.(2026·河北沧州·二模)某人统计了2020-2024年某网站“双11”当天的交易额,统计结果如表:
(1)请根据表中提供的数据,用样本相关系数说明与的线性相关程度;
(2)求出关于的经验回归方程,并预测2027年该网站“双11”当天的交易额.
附:在经验回归方程中,,,,
【答案】(1)非常接近1,说明变量与的线性相关程度很强
(2),38.5百亿元
【分析】(1)根据表格里的数据与公式计算样本相关系数的值,再根据的取值判断线性相关程度;
(2)利用问题(1)中已算出的数据以及公式计算出的值,再代入样本中心点得的值,即得关于的经验回归方程,可得答案.
【详解】(1)由题意,根据表格中的数据,
可得,,
,,
,
故,
所以,
非常接近,说明变量与的线性相关程度很强.
(2)由(1)可得,,,,
所以,
则.
可得关于的经验回归方程为,
令,可得,
所以预测2027年该网站“双11”当天的交易额为38.5百亿元.
变式1.(2026·陕西西安·模拟预测)近年来我国新能源汽车行业蓬勃发展,新能源汽车不仅对环境保护具有重大的意义,而且还能够减少对不可再生资源的开发,是全球汽车发展的重要方向.某地区近几年新能源汽车的购买情况如下表所示:
(1)计算与的相关系数(保留三位小数);
(2)求关于的线性回归方程,并预测该地区2026年新能源汽车购买数量.
参考公式:.
参考数值:.
【答案】(1);
(2),2.9万辆.
【详解】(1)由题意,,
则,,
则.
故与的相关系数为.
(2)由(1),
则,
故关于的线性回归方程为,
令,则,
故可预测该地区2026年新能源汽车购买数量为万辆.
变式2.(2026·江苏南京·一模)为研究昼夜温差(单位:)与某植物种子当日的百粒发芽数(单位:粒)之间的关系,实验室记录了6天的每日昼夜温差与种子当日的百粒发芽数,如下表所示:
(1)根据表中的数据,计算样本相关系数(精确到0.01);
(2)求百粒发芽数关于温差的经验回归方程,并估计昼夜温差为时,这种植物种子当日的百粒发芽数.
参考公式:相关系数,
,,
参考数据:,,,.
【答案】(1)
(2),
【分析】(1)根据条件,直接计算,即可求解;
(2)根据条件,直接求出,即可求出线性回归方程,再将代入,即可求解.
【详解】(1)相关系数.
(2)由题意得,,
所以,,
所以所求的经验回归方程是,
当时,,
故当昼夜温差为时,这种植物种子当日百粒发芽数为.
变式3.(25-26高二下·河南南阳·月考)实现乡村振兴,开发本地资源,提高村民的收入,某村办企业研发了一种新手工产品,为确定合适的定价,统计了不同定价(元)与网上月销量(万件)的数据如下:
(1)求相关系数(保留3位小数),并说明与的线性相关程度;
(2)建立关于的线性回归方程;
(3)若月销量不低于万件可保证盈利,根据回归方程预测定价最高可定为多少元?(取整数)
(参考数据:,,,,)
(参考公式:,)
【答案】(1),与完全线性负相关.
(2)
(3)定价最高为元.
【详解】(1),,
故
,
故与完全负相关.
(2),故,
故回归方程为.
(3)由题设,此时,故,故定价最高为元.
考点二 决定系数
例1.(25-26高三下·江西景德镇·月考)某学校校庆时统计连续5天进入学校参加活动的校友数(单位:千人)如下:
(1)由上表数据看出,可用线性回归模型拟合y与x的关系,请用相关系数r加以说明(保留小数点后两位);(若>0.75,则认为y与x的线性相关性很强),并求出y关于x的线性回归方程;
(2)校庆期间学校开放1号门、2号门和3号门供校友出入,校友从1号门、2号门和3号门进入学校的概率分别为,若校友从某个门进入学校,则其从该门出学校的概率为,从其他两个门出学校的概率各为.假设校友从1号门、2号门、3号门出入学校互不影响,现有甲乙丙丁4名校友于10月1日回母校参加活动,设X为4人中从2号门出学校的人数,求X的期望及方差.
附:参考数据:.
参考公式:回归直线方程y=bx+a,其中.相关系数.
【答案】(1),说明见解析,
(2),.
【分析】(1)求出,将参考数据代入相关系数公式,求出的值,即可得出结论;再将数据代入最小二乘法公式,求出、的值,即可得出回归直线方程;
(2)利用全概率公式求出每个人从2号门出校园的概率均为,由此可知,利用二项分布可得出随机变量的分布列,利用二项分布的期望公式可得出的值.
【详解】(1)依题意,,而,,,
则.
因为时线性相关程度高,所以与线性相关性很强,可以用线性回归模型拟合.
,,
因此,回归方程为.
(2)记“甲从2号门出学校”为事件,“甲从1号门进学校”为事件,
“甲从2号门进学校”为事件,“甲从3号门进学校”为事件,
由题意可得,,,
,,
由全概率公式得: ,
同理乙、丙、丁从2号门出学校的概率也为,
为4人中从2号门出学校的人数,则,
,,
,,
,
故的分布列为:
,.
例2.(2026·广东广州·模拟预测)某公司为了了解A商品销售收入(单位:万元)与广告支出(单位:万元)之间的关系,现收集的5组样本数据如下表所示,且经验回归方程为.
(1)求的值;
(2)现从这5组数据的残差中抽取2组进行分析(观测值减去预测值称为残差),记X表示抽到数据的残差为负的组数,求X的分布列和期望;
(3)已知,且当时,回归方程的拟合效果良好,试结合数据,判断经验回归方程的拟合效果是否良好.
【答案】(1)
(2)分布列见解析,
(3)经验回归方程的拟合效果不良好
【分析】(1)求出根据回归直线必过样本中心点求解即可;
(2)可能取值为,求出对应概率,进而得到分布列和期望;
(3)求出代入公式,即可得到答案.
【详解】(1),
,
因为,即,
解得.
(2)5组数据中,两组数据残差为正值,三组数据残差为负值,
所以可能取值为,
,
,
,
所以X的分布列为
期望.
(3),
,
所以经验回归方程的拟合效果是不良好.
例3.(25-26高三上·湖南长沙·月考)海水稻的灌溉是将海水稀释后进行灌溉.某试验基地为了研究海水浓度x(‰)对亩产量y(吨)的影响,通过在试验田的种植实验,测得了某种海水稻的亩产量与海水浓度的数据如表.绘制散点图发现,可用线性回归模型拟合亩产量y与海水浓度x之间的相关关系,用最小二乘法计算得y与x之间的经验回归方程为.
(1)请你估计:当浇灌海水浓度为8‰时,该品种海水稻的亩产量;
(2)(i)完成上述残差表;
(ii)在统计学中,常用决定系数来刻画回归效果,越大,模型拟合效果越好,并用它来说明响应变量与解释变量的相关性.你能否利用以上表格中的数据,计算决定系数,并判断模型的拟合效果.(计算中数据精确到0.01)
(附:残差,决定系数)
【答案】(1)吨.
(2)残差表见解析;,拟合效果较好.
【分析】(1)先求出平均数,代入经验回归方程即可求出b,从而求解.
(2)(i)根据经验回归方程求解,从而可得;
(ii)根据公式求出决定系数,进而判断.
【详解】(1)根据题中数据可知,,
将样本中心点的坐标代入经验回归方程得
,解得,
所以经验回归方程为.
当时,,
即当浇灌海水浓度为8‰时,该品种海水稻的亩产量为吨.
(2)(i)由经验回归方程可得
,;
,;
,;
,;
,.
所以残差表如下:
(ii)由上数据可知,
,
所以决定系数,与1比较接近,
所以拟合效果较好.
变式1.(2025·云南·模拟预测)自2021年以来,新能源汽车因其动力充沛、提速快、用车成本低等特点得到民众的追捧,某地区电动汽车保有量呈现快速增长趋势,下表给出了近5年该地区的电动汽车保有量(单位:万辆).
若用作为该数据的回归直线模型,并已求得,
(1)结合已知数据求出2023年该地区的电动汽车保有量,并预测2030年该地区的电动汽车保有量;
(2)若已知,求此模型下的决定系数(精确到0.01).
参考公式及数据:一组数据,其经验回归直线的斜率和截距的最小二乘估计公式分别为,决定系数.
【答案】(1)3.4万辆,14.52万辆.
(2)0.93
【分析】(1)首先根据回归直线方程过样本点中心,根据求2023年汽车的保有量;
(2)首先求的值,再代入决定系数公式,即可求解.
【详解】(1)由题意可得,且,
所以,
所以2023年电动汽车保有量万辆.
2030年对应的年份编号为10,代入回归直线方程,可求得.
即在2030年时,电动汽车保有量可能为14.52万辆.
(2),
所以决定系数.
变式2.(2025·广西南宁·模拟预测)现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本(单位:万元)和企业利润的数据(单位:万元)如下表所示:
根据最小二乘法公式求得经验回归方程为.
(1)求的值,并利用已知的经验回归方程求出8月份对应的残差值;
(2)请先求出线性回归模型的决定系数(精确到0.0001),若根据非线性模型求得解释变量(物流成本)对于响应变量(利润)的决定系数,请说明以上两种模型哪种模型拟合效果更好.
参考公式及数据:,,.
【答案】(1),;
(2),拟合程度更好.
【分析】(1)根据经验回归方程过样本中心点,先由经验回归方程和的平均数,求出的平均数,再根据平均数的定义求出;然后根据残差定义计算8月份的残差.
(2)先求出残差平方和,再代入公式计算,最后与非线性回归模型的比较大小,即可判断.
【详解】(1)因为,,,
则,解得;
8月份对应的残差值.
(2)因为,
所以,
所以,
所以线性回归模型拟合程度更好.
变式3.(24-25高二下·广东江门·月考)台山市镇海湾蚝是台山市著名的特产,因镇海湾的生蚝田处于咸淡水交汇之地,所以这里的生蚝长得比其他地方肥大,味道更加鲜美.2023年镇海湾某养殖基地考虑增加人工投入,根据市场调研与模拟,得到人工投入增量x人与年收益增量y万元的数据和散点图分别如下:
根据散点图,建立了y与x的两个回归模型:
模型①:;模型②:
(1)求出模型②中y关于x的回归方程(精确到0.1);
(2)比较模型①,②的决定系数的大小,说明哪个模型拟合效果更好,并用该模型预测,要使年收益增量超过80万元,人工投入增量至少需要多少人?(精确到1)
线性回归方程的系数:
,;
模型的决定系数:.
参考数据:令,则,且,,,;模型①中;模型②中.
【答案】(1)
(2)模型①中的决定系数小于模型②的决定系数;模型②的拟合效果更好;人工投入增量至少需要20人.
【分析】(1),先求出关于的线性回归方程,进而可求y关于x的回归方程;
(2)代入公式分别求出模型①和模型②的决定系数比较大小即可,进而可判断模型②的拟合效果更好;再通过解不等式即可得至少人工投入增量人数.
【详解】(1)令,则模型②为:,
由,,,,
得,
,
所以模型②中y关于x的回归方程是.
(2)模型①中的决定系数,
模型②的决定系数,
因为,所以模型①中的决定系数小于模型②的决定系数,
所以模型②的拟合效果更好.
在模型②下,年收益增量超过80万元,
则有,所以,
所以人工投入增量至少需要20人.考点目录
相关系数
决定系数
年份
2016
2017
2018
2019
2020
2021
2022
2023
2024
2025
/万元
18
20
19
21
22
17
20
19
21
23
/千人次
32
36
34
38
40
30
37
35
39
42
/亿元
12.1
12.5
11.3
12.4
13.1
11.5
11.0
11.3
12.6
12.2
/亿元
650
680
620
660
695
640
600
630
665
660
年份
2020
2021
2022
2023
2024
年份代码
1
2
3
4
5
交易额百亿元
9
12
17
21
26
年份
2019
2020
2021
2022
2023
购买量(万辆)
0.40
0.70
1.10
1.50
1.80
日期编号
1
2
3
4
5
6
温差
9
13
11
15
10
14
百粒发芽数
23
28
26
31
25
29
日期
10月1日
10月2日
10月3日
10月4日
10月5日
第x天
1
2
3
4
5
参观人数y(千人)
2.2
2.6
3.1
5.2
6.9
0
1
2
3
4
2
5
6
8
9
16
20
21
28
10.96
19.24
22
27.52
30.28
0
1
2
海水浓度(‰)
3
4
5
6
7
亩产量 (吨)
0.62
0.58
0.49
0.4
0.31
残差
海水浓度(‰)
3
4
5
6
7
亩产量 (吨)
0.62
0.58
0.49
0.4
0.31
残差
年份
2021
2022
2023
2024
2025
年份编号
1
2
3
4
5
电动汽车保有量
1.5
2.5
4.9
7.8
月份
1
2
3
4
5
6
7
8
物流成本
83
83.5
80
86.5
89
84.5
79
86.5
利润
114
116
106
122
132
114
132
残差
0.2
0.6
1.8
-3
-1
-4.6
x
2
3
4
6
8
10
13
y
13
22
31
42
50
56
58
相关试卷
这是一份相关系数、决定系数专项训练-2026届高考数学二轮复习,共14页。
这是一份非线性回归问题、相关系数问题专项训练-2026届高考数学二轮复习,共16页。
这是一份用样本估计总体、相关关系专项训练含答案-2026届高考数学二轮复习,文件包含圆锥曲线离心率问题焦点三角形问题面积问题专项训练原卷版docx、圆锥曲线离心率问题焦点三角形问题面积问题专项训练解析版docx等2份试卷配套教学资源,其中试卷共9页, 欢迎下载使用。
相关试卷 更多
- 1.电子资料成功下载后不支持退换,如发现资料有内容错误问题请联系客服,如若属实,我们会补偿您的损失
- 2.压缩包下载后请先用软件解压,再使用对应软件打开;软件版本较低时请及时更新
- 3.资料下载成功后可在60天以内免费重复下载
免费领取教师福利 


.png)




