所属成套资源:2025届高考数学一轮复习专练(Word版附解析)
2025届高考数学一轮复习专练66 变量的相关性与一元线性回归模型(Word版附解析)
展开这是一份2025届高考数学一轮复习专练66 变量的相关性与一元线性回归模型(Word版附解析),共12页。
【基础落实练】
1.(5分)下列有关线性回归的说法,不正确的是( )
A.具有相关关系的两个变量不是因果关系
B.散点图能直观地反映数据的相关程度
C.回归直线最能代表线性相关的两个变量之间的关系
D.任一组数据都有经验回归方程
【解析】选D.根据两个变量具有相关关系的概念,可知A正确;
散点图能直观地描述具有相关关系的两个变量的相关程度,且回归直线最能代表它们之间的相关关系,所以B,C正确;
具有相关关系的成对样本数据才有经验回归方程,所以D不正确.
2.(5分)下图是某地区2001年至2021年环境保护建设投资额(单位:万元)的折线图.根据该折线图判断,下列结论正确的是( )
A.为预测该地2026年的环境保护建设投资额,应用2001年至2021年的数据建立回归模型更可靠
B.为预测该地2026年的环境保护建设投资额,应用2010年至2021年的数据建立回归模型更可靠
C.投资额与年份负相关
D.投资额与年份的相关系数r<0
【解析】选B.因为2009年之前与2010年之后投资额变化较大,故为预测该地2026年的环境保护建设投资额,应用2010年至2021年的数据建立回归模型更可靠,所以A错误,B正确;随年份的增长,投资额总体上在增长,所以投资额与年份正相关,r>0,故C,D错误.
3.(5分)某单位为了了解办公楼用电量y(kW·h)与气温x(℃)之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表:
由表中数据得到经验回归方程=-2x+,当气温为-4℃时,预测用电量为( )
A.68 kW·hB.52 kW·hC.12 kW·hD.28 kW·h
【解析】选A.由题干表格可知x=10,y=40,
根据经验回归直线必过(x,y)得=40+20=60,所以经验回归方程为=-2x+60,
因此当x=-4时,=68.
4.(5分)下列命题是真命题的为( )
A.经验回归方程=x+一定不过样本点
B.可以用样本相关系数r来刻画两个变量x和y线性相关程度的强弱,r的值越小,说明两个变量线性相关程度越弱
C.在回归分析中,决定系数R2=0.80的模型比决定系数R2=0.98的模型拟合的效果要好
D.残差平方和越小的模型,拟合的效果越好
【解析】选D.对于A,经验回归方程不一定经过其样本点,但一定经过(x,y),所以A是假命题;
对于B,由样本相关系数的意义,当|r|越接近0时,表示变量y与x之间的线性相关程度越弱,所以B是假命题;
对于C,用决定系数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好,所以C是假命题;
对于D,由残差的统计学意义知,D是真命题.
5.(5分)(多选题)(2023·济南模拟)某同学将收集到的六对数据制作成散点图,得到其经验回归方程为l1:=0.68x+,计算其相关系数为r1,决定系数为R12.经过分析确定点F为“离群点”,把它去掉后,再利用剩下的五对数据计算得到经验回归方程为l2:=x+0.68,相关系数为r2,决定系数为R22.下列结论正确的是( )
A.r2>r1>0B.R12>R22
C.0<<0.68D.>0.68
【解析】选AC.由题图可知两变量呈正相关,故r1>0,r2>0,去掉“离群点”后,相关性更强,所以r1
若y与x线性相关,且经验回归方程为=0.1x+9.1,则下列说法正确的是( )
A.a=24B.y与x正相关
C.y与x的相关系数为负数D.若x=220,则y=31.1
【解析】选AB.依题意,x=140+150+170+180+1955=167,y=23+a+26+28+285=a+1055,
由a+1055=0.1×167+9.1,解得a=24,故A正确;
因为经验回归方程=0.1x+9.1中x的系数为正,所以y与x正相关,且相关系数为正数,故B正确,C错误;
当x=220时,y的值约为31.1,故D错误.
7.(5分)为了研究疫苗的有效率,在某地进行临床试验,对符合一定条件的10 000名试验者注射了该疫苗,一周后有20人感染,为了验证疫苗的有效率,同期,从相同条件下未注射疫苗的人群中抽取2 500人,分成5组,各组感染人数如下:
并求得y与x的经验回归方程为=0.011x+,同期,在人数为10 000的条件下,以拟合结果估算未注射疫苗的人群中感染人数,记为N;注射疫苗后仍被感染的人数记为n,则估计该疫苗的有效率为________.(疫苗的有效率为1-nN,结果保留3位有效数字)
【解析】由题表中的数据可得x=500,y=5,故=5-0.011×500=-0.5,故N=0.011×10 000-0.5=110-0.5=109.5,而n=20,故疫苗的有效率为1-20109.5≈0.817.
答案:0.817
8.(5分)两个线性相关变量x与y的统计数据如表:
其经验回归方程是=x+40,则相应点(9,11)的残差为________.
【解析】因为x=15×(9+9.5+10+10.5+11)=10,y=15×(11+10+8+6+5)=8,
所以8=10+40,解得=-3.2,所以=-3.2x+40,当x=9时,=11.2,
所以残差为11-11.2=-0.2.
答案:-0.2
9.(10分)(2020·全国Ⅱ卷节选)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得=60,=1 200, =80, =9 000,=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01).
附:相关系数r=,2≈1.414.
【解析】(1)样区这种野生动物数量的平均数为120=120×1 200=60,
地块数为200,该地区这种野生动物数量的估计值为200×60=12 000.
(2)样本(xi,yi)的相关系数r==80080×9 000=223≈0.94.
【能力提升练】
10.(5分)甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做了试验,并用回归分析方法分别求得相关系数r与残差平方和m,如表:
则哪位同学的试验结果体现的A,B两变量有更强的线性相关性( )
A.甲B.乙C.丙D.丁
【解析】选D.|r|越接近1,m越小,线性相关性越强.
11.(5分)(多选题)(2023·唐山模拟)某制衣品牌为使成衣尺寸更精准,选择了10名志愿者,对其身高(单位:cm)和臂展(单位:cm)进行了测量,这10名志愿者身高和臂展的折线图如图所示.已知这10名志愿者身高的均值为176 cm,根据这10名志愿者的数据求得臂展u关于身高v的经验回归方程为=1.2v-34,则下列结论正确的是( )
A.这10名志愿者身高的极差小于臂展的极差
B.这10名志愿者的身高和臂展呈负相关
C.这10名志愿者臂展的均值为176.2 cm
D.根据经验回归方程可估计身高为160 cm的人的臂展为158 cm
【解析】选AD.对于选项A,因为这10名志愿者臂展的最大值大于身高的最大值,而臂展的最小值小于身高的最小值,所以这10名志愿者身高的极差小于臂展的极差,故A正确;
对于选项B,因为1.2>0,所以这10名志愿者的身高和臂展呈正相关关系,故B错误;
对于选项C,因为这10名志愿者身高的均值为176 cm,所以这10名志愿者臂展的均值为1.2×176-34=177.2(cm),故C错误;
对于选项D,若一个人的身高为160 cm,则由经验回归方程=1.2v-34,可得这个人的臂展的估计值为158 cm,故D正确.
12.(5分)(多选题)针对某疾病,各地医疗机构采取了各种有针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如表所示,由表格可得y关于x的经验回归方程为=6x2+,则下列说法正确的是( )
A.=4B.=-8
C.此回归模型第4周的残差为5D.估计第6周治愈人数为220
【解析】选BC.设t=x2,则=6t+,
由已知得t=15×(1+4+9+16+25)=11,y=15×(2+17+36+93+142)=58,
所以=58-6×11=-8,故A错误,B正确;
在=6x2-8中,令x=4,得4=6×42-8=88,
所以此回归模型第4周的残差为y4-4=93-88=5,故C正确;
在=6x2-8中,令x=6,得6=6×62-8=208,故D错误.
13.(5分)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
x=46.6,y=563,w=6.8,=1.6,=1 469, =108.8,其中wi=xi,w=18.
则____________(y=a+bx与y=c+dx二选一)适宜作为年销售量y关于年宣传费x的经验回归方程,其解析式为______________.
【解析】由题中散点图可以判断,y=c+dx适宜作为年销售量y关于年宣传费x的经验回归方程类型.
令w=x,先建立y关于w的经验回归方程.
由于==,=y-w=563-68×6.8=100.6,
所以y关于w的经验回归方程为=100.6+68w,因此y关于x的经验回归方程为=100.6+68x.
答案:y=c+dx =100.6+68x
14.(10分)某地对一家企业进行深入调研,数据显示,该企业近年加大了科技研发资金的投入,其科技投入x(百万元)与收益y(百万元)的数据统计如下:
根据数据特点,甲认为样本点分布在指数型曲线y=的周围,据此他对数据进行了一些初步处理.如表:
其中zi=lg2yi,z=17.
(1)请根据表中数据,建立y关于x的经验回归方程(系数精确到0.1);
(2)①乙认为样本点分布在直线y=mx+n的周围,并计算得经验回归方程为=8.25x+3,以及该回归模型的决定系数R乙2=0.893,试比较甲、乙两人所建立的模型,谁的拟合效果更好?
②由①所得的结论,计算该企业欲使收益达到2.56亿元,科技投入的费用至少要多少百万元?
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归直线=u+的斜率和截距的最小二乘法估计分别为==,=v-u,决定系数: .
【解析】(1)将y=2bx+a两边取对数得lg2y=bx+a,令z=lg2y,则=x+,
因为x=4,所以根据最小二乘估计可知
==149-7×4×5140-7×42≈0.3,
所以=z-x≈5-0.3×4=3.8,
所以经验回归方程为=0.3x+3.8,
即=.
(2)①甲建立的回归模型:R甲2=1-1302 134≈0.939>R乙2=0.893.
所以甲建立的回归模型拟合效果更好.
②由①知,甲建立的回归模型拟合效果更好.
设≥256,解得0.3x+3.8≥lg2256=8,解得x≥14.
所以科技投入的费用至少要14百万元,该企业的收益才能达到2.56亿元.
15.(10分)(2022·全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
并计算得=0.038, =1.615 8, =0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数r=,1.896≈1.377.
【解析】(1)样本中10棵这种树木的根部横截面积的均值x=0.610=0.06,样本中10棵这种树木的材积量的均值y=3.910=0.39,据此可估计该林区这种树木平均一棵的根部横截面积为0.06 m2,平均一棵的材积量为0.39 m3;
(2)r==
=0.247 4-10×0.06×0.39(0.038-10×0.062)(1.615 8-10×0.392)=0.013 40.000 189 6≈0.013 40.013 77≈0.97,则r≈0.97;
(3)设该林区这种树木的总材积量的估计值为Y m3,
又已知树木的材积量与其根部横截面积近似成正比,
可得,解得Y=1 209,
则该林区这种树木的总材积量估计为1 209 m3.
【素养创新练】
16.(5分)如图是相关变量x,y的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到经验回归方程=1x+1,样本相关系数为r1;方案二:剔除点(10,21),根据剩下的数据得到经验回归方程=2x+2,样本相关系数为r2.
则( )
A.0
方案一中,没剔除离群值,线性相关性弱些;
方案二中,剔除离群值,线性相关性强些;
所以样本相关系数-1
A.相关变量x,y具有正相关关系
B.去除两个歧义点后,新样本中变量xj(j=1,2,…,8)的均值变大
C.去除两个歧义点后的经验回归方程为1=3x-3
D.去除两个歧义点后,样本数据(4,8.9)的残差为0.1
【解析】选ABC.对于A,因为经验回归直线的斜率大于0,所以相关变量x,y具有正相关关系,故A正确;
对于B,将x=2代入=2x-0.4得y=3.6,则去除两个歧义点后,得到新的相关变量的均值分别为X=2×10+(-2)+28=52,Y=3.6×10+1+(-1)8=92,故B正确;
对于C,=92-3×52=-3,新的经验回归方程为1=3x-3,故C正确;
对于D,当x=4时,1=3×4-3=9,残差为8.9-9=-0.1,故D错误.气温(℃)
18
13
10
-1
用电量(kW·h)
24
34
38
64
x
140
150
170
180
195
y
23
a
26
28
28
调查人数x
300
400
500
600
700
感染人数y
3
3
6
6
7
x
9
9.5
10
10.5
11
y
11
10
8
6
5
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
m
106
115
124
103
周数(x)
1
2
3
4
5
治愈人数(y)
2
17
36
93
142
科技投入x
1
2
3
4
5
6
7
收益y
19
20
22
31
40
50
70
z
5
140
1 239
149
2 134
130
样本号i
1
2
3
4
5
根部横截面积xi
0.04
0.06
0.04
0.08
0.08
材积量yi
0.25
0.40
0.22
0.54
0.51
样本号i
6
7
8
9
10
总和
根部横截面积xi
0.05
0.05
0.07
0.07
0.06
0.6
材积量yi
0.34
0.36
0.46
0.42
0.40
3.9
相关试卷
这是一份2025届高考数学一轮复习专练74 正态分布(Word版附解析),共10页。
这是一份2025届高考数学一轮复习专练1 集合(Word版附解析),共9页。
这是一份2025年高考数学一轮复习-10.3-变量的相关性与一元线性回归模型-专项训练【含解析】,共20页。