23版新高考一轮分层练案(五十四) 变量间的相关关系
展开一轮分层练案(五十四) 变量间的相关关系
A级——基础达标
1.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-3x+1上,则这组样本数据的相关系数为( )
A.-3 B.0
C.-1 D.1
【答案】C 由题设知,这组成对样本数据完全负相关,也就是具有函数关系,其相关系数为-1.
2.根据如下样本数据:
x
3
4
5
6
7
8
y
4.0
2.5
0.5
0.5
0.4
0.1
得到的经验回归方程为=x+,则( )
A.>0,>0 B.>0,<0
C.<0,>0 D.<0,<0
【答案】B 根据给出的数据可发现:整体上y与x呈现负相关,所以<0,由样本点(3,4.0)及(4,2.5)可知>0,故选B.
3.已知x与y之间的一组数据如表:
x
0
1
2
3
y
m
3
5.5
7
已求得y关于x的经验回归方程为=2.1x+0.85,则m的值为( )
A.1 B.0.85
C.0.7 D.0.5
【答案】D ==1.5,==,因为点(,)在经验回归直线上,所以=2.1×1.5+0.85,解得m=0.5,故选D.
4.某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y与x具有线性相关关系,且经验回归方程为=0.6x+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为( )
A.66% B.67%
C.79% D.84%
【答案】D ∵y与x具有线性相关关系,且满足经验回归方程=0.6x+1.2,该城市居民人均工资为=5,∴可以估计该城市的职工人均消费=0.6×5+1.2=4.2,∴可以估计该城市人均消费额占人均工资收入的百分比为=84%.
5.(多选)下列说法正确的是( )
A.在经验回归直线方程=-0.85x+2.3中,当解释变量x每增加1个单位时,预报变量平均减少2.3个单位
B.两个具有线性相关关系的变量,当相关系数r的值越接近于0,则这两个变量的相关性就越强
C.若两个变量的决定系数R2=0.88,则说明预报变量的差异有88%是由解释变量引起的
D.在经验回归直线方程=-0.85x+2.3中,相对于样本点(1,1.2)的残差为-0.25
【答案】CD 对于A,根据经验回归直线方程,当解释变量x每增加1个单位时,预报变量平均减少0.85个单位,A错误;对于B,当相关系数r的值越接近于1,两个变量的相关性就越强,B错误;对于C,由决定系数R2的意义可知C正确;对于D,当解释变量x=1时,预报变量=1.45,则样本点(1,1.2)的残差为-0.25,D正确.故选C、D.
6.(多选)小明同学在做市场调查时得到如下样本数据:
x
1
3
6
10
y
8
a
4
2
他由此得到经验回归方程为=-2.1x+15.5,则下列说法正确的是( )
A.变量x与y线性负相关
B.当x=2时可以估计y=11.3
C.a=6
D.变量x与y之间是函数关系
【答案】ABC 由经验回归方程为=-2.1x+15.5,可知变量x与y之间线性负相关,故A正确;当x=2时,y=-2.1×2+15.5=11.3,故B正确;∵=5,=,∴样本点的中心坐标为,代入=-2.1x+15.5,得=-2.1×5+15.5,解得a=6,故C正确;变量x与y之间具有线性负相关关系,不是函数关系,故D错误.故选A、B、C.
7.(多选)某城市收集并整理了该市2020年1月份至10月份各月最低气温与最高气温(单位:℃)的数据,绘制了下面的折线图.
已知该城市各月的最低气温与最高气温具有较好的线性关系,则根据折线图,下列结论正确的是( )
A.最低气温与最高气温为正相关
B.10月的最高气温不低于5月的最高气温
C.月温差(最高气温减最低气温)的最大值出现在1月
D.最低气温低于0 ℃的月份有4个
【答案】ABC 在A中,最低气温与最高气温为正相关,故A正确;在B中,10月的最高气温不低于5月的最高气温,故B正确;在C中,月温差(最高气温减最低气温)的最大值出现在1月,故C正确;在D中,最低气温低于0 ℃的月份有3个,故D错误.故选A、B、C.
8.已知变量x和y线性相关,其一组观测数据为(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),由最小二乘法求得经验回归方程为=0.67x+50.9.若已知x1+x2+x3+x4+x5=150,则y1+y2+y3+y4+y5=______.
解析:由x1+x2+x3+x4+x5=150,得==30,
再由(,)在回归直线=0.67x+50.9上,
得=0.67×30+50.9=71,
∴y1+y2+y3+y4+y5=5=5×71=355.
【答案】355
9.在一次考试中,5名学生的数学和物理成绩如下表:(已知学生的数学和物理成绩具有线性相关关系)
学生的编号i
1
2
3
4
5
数学成绩x
80
75
70
65
60
物理成绩y
70
66
68
64
62
现已知其经验回归方程为=0.36x+,则=______,根据此经验回归方程估计数学得90分的同学的物理成绩为________(四舍五入到整数).
解析:==70,
==66,
所以66=0.36×70+,即=40.8,
即线性回归方程为=0.36x+40.8.
当x=90时,=0.36×90+40.8=73.2≈73.
【答案】40.8 73
10.在2018年俄罗斯举办足球世界杯期间,莫斯科的部分餐厅经营了来自中国的小龙虾,这些小龙虾标有等级代码.为得到小龙虾等级代码数值x与销售单价y之间的关系,经统计得到如下数据:
等级代码数值x
38
48
58
68
78
88
销售单价y(元/kg)
16.8
18.8
20.8
22.8
24
25.8
(1)已知代码超过60的为A等品,某公司从上表6种产品中任取2种产品进口,求2种产品全为A等品的概率;
(2)已知销售单价y与等级代码数值x之间存在线性相关关系,求y关于x的经验回归方程(系数精确到0.1);
(3)若莫斯科某餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元?
参考公式:经验回归直线的斜率和截距的最小二乘估计公式分别为:=,=-,参考数据:iyi=8 440,=25 564.
解:(1)由图表可知,A等品有3种,总产品有6种,
则从上表6种产品中任取2种产品进口,2种产品全为A等品的概率P===.
(2)由题意得,=×(38+48+58+68+78+88)=63,
=×(16.8+18.8+20.8+22.8+24+25.8)=21.5,
==≈0.2,
=-=21.5-0.2×63=8.9,
∴y关于x的经验回归方程为=0.2x+8.9.
(3)由(2)知当x=98时,=28.5,
故估计该等级的中国小龙虾销售单价为28.5元.
B级——综合应用
11.下列说法中正确的是( )
①相关系数r用来衡量两个变量之间线性关系的强弱,|r|越接近于1,相关性越弱;
②经验回归直线=x+一定经过样本点的中心(,);
③随机误差e满足E(e)=0;
④决定系数R2用来刻画回归的效果,R2越小,说明模型的拟合效果越好.
A.①② B.③④
C.①④ D.②③
【答案】D ①线性相关系数r是衡量两个变量之间线性关系强弱的量,|r|越接近于1,这两个变量线性相关关系越强,|r|越接近于0,线性相关关系越弱,①错误;②经验回归直线=x+一定经过样本点的中心(,),②正确;③随机误差e是衡量预报精确度的一个量,它满足E(e)=0,③正确;④决定系数R2用来刻画回归的效果,R2越大,说明模型的拟合效果越好,④错误.
12.(多选)中华人民共和国成立以来,我国文化事业得到了充分发展,尤其是中共十八大以来,文化事业发展更加迅速,如图是从2015年到2020年六年间我国公共图书馆业机构数与对应年份编号的散点图(为便于计算,将2015年编号为1,2016年编号为2,…,2020年编号为6,把每年的公共图书馆业机构数作为预报变量,把年份编号作为解释变量进行回归分析),得到回归直线方程为=13.743x+3 095.7,其决定系数R2=0.981 7,下列结论正确的是( )
A.公共图书馆业机构数与年份编号的正相关性较强
B.在2016~2020年间,2018年公共图书馆业机构数增加量最多
C.公共图书馆业机构数平均每年增加13.743
D.可预测2021年公共图书馆业机构数为3 190
【答案】AC 因为散点图中各点散布在从左下角到右上角的区域内,所以为正相关,因为R2=0.981 7接近于1,所以公共图书馆业机构数与年份编号的相关性较强,故A正确;由题图可知,在2016~2020年间,2017年公共图书馆业机构数增加量最多,故B错误;因为回归直线的斜率为13.743,所以公共图书馆业机构数平均每年增加13.743,故C正确;将x=7代入回归直线方程=13.743x+3 095.7,解得=3 191.901≈3 192,所以可预测2021年公共图书馆业机构数为3 192,故D错误.故选A、C.
13.(多选)已知由样本数据点集合{(xi,yi)|i=1,2,…,n},求得的经验回归方程为=1.5x+0.5,且=3,现发现两个数据点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得的经验回归直线l的斜率为1.2,则( )
A.变量x与y具有正相关关系
B.去除后的经验回归方程为=1.2x+1.4
C.去除后y的估计值增加速度变快
D.去除后相应于样本点(2,3.75)的残差为0.05
【答案】AB 因为经验回归直线方程为=1.5x+0.5,1.5>0,所以变量x与y具有正相关关系,故A正确;当=3时,=3×1.5+0.5=5,样本中心点为(3,5),去掉两个数据点(1.2,2.2)和(4.8,7.8)后,样本中心点还是(3,5),又因为去除后重新求得的经验回归直线l的斜率为1.2,所以5=3×1.2+,解得=1.4,所以去除后的经验回归方程为=1.2x+1.4,故B正确;因为1.5>1.2,所以去除后y的估计值增加速度变慢,故C错误;因为=1.2×2+1.4=3.8,所以y-=3.75-3.8=-0.05,故D错误,故选A、B.
14.国际青年物理学家竞赛(简称IYPT)是当今最受重视的中学生顶级国际物理赛事,某中学物理兴趣小组通过实验对其中一道竞赛题的两个物理量u、v进行测量,得到10组数据(u1,v1),(u2,v2),…,(u10,v10),通过散点图发现具有较强的线性相关关系,并且利用最小二乘法求得经验回归方程为=1.5u+1,由于数据保存失误导致i丢失,但i=50被保存,通过所学知识可以求得i=______.
解析:由i=50,得=i=×50=5,
再由经验回归方程恒过样本点的中心可得,
=1.5×+1=1.5×5+1=8.5,
∴i=10=10×8.5=85.
【答案】85
15.随着科技的发展,网购已经逐渐融入了人们的生活.某公司组织统计了近五年来该公司网购的人数yi(单位:人)与时间ti(单位:年)的数据,列表如下:
ti
1
2
3
4
5
yi
24
27
41
64
79
(1)依据表中给出的数据,是否可用经验回归模型拟合y与t的关系,请计算相关系数r并加以说明;(计算结果精确到0.01);(若|r|>0.75,则线性相关程度很高,可用经验回归模型拟合)
(2)建立y关于t的经验回归方程,并预测第6年该公司的网购人数(计算结果精确到整数).
附:相关系数公式 r=
=,
参考数据:≈75.47.
参考公式:==,=-.
解:(1)由题知=3,=47,iyi=852, =, =,
则r=
=
==≈≈0.97>0.75.
故y与t的线性相关程度很高,可用经验回归模型拟合.
(2)由(1)得==14.7,
=47-14.7×3=2.9.
所以y与t的经验回归方程为=14.7t+2.9.
将t=6代入经验回归方程,得=91.1≈91,
所以预测第6年该公司的网购人数约为91人.
C级——迁移创新
16.有甲、乙两家公司都需要招聘求职者,这两家公司的聘用信息如表所示:
甲公司
职位
A
B
C
D
月薪/元
6 000
7 000
8 000
9 000
获得相应职位概率
0.4
0.3
0.2
0.1
乙公司
职位
A
B
C
D
月薪/元
5 000
7 000
9 000
11 000
获得相应职位概率
0.4
0.3
0.2
0.1
(1)根据以上信息,如果你是该求职者,你会选择哪一家公司?说明理由;
(2)某课外实习作业小组调查了1 000名职场人士,就选择这两家公司的意愿做了统计,得到以下数据分析:
选择人员结构
40岁以上(含40岁)男性
40岁以上(含40岁)女性
40岁以下男性
40岁以下女性
选择甲公司
110
120
140
80
选择乙公司
150
90
200
110
若分析选择意原与年龄这两个分类变量,计算得出观测值为χ1=5.551 3,则得出“选择意愿与年龄有关系”的结论犯错误的概率的上限是多少?并用统计学知识分析,选择意愿与年龄变量和性别变量哪一个关联性更大?
附:χ2=,其中n=a+b+c+d.
α
0.050
0.025
0.010
0.005
xα
3.841
5.024
6.635
7.879
解:(1)设甲公司与乙公司的月薪分别为随机变量X,Y,
则E(X)=6 000×0.4+7 000×0.3+8 000×0.2+9 000×0.1=7 000(元),
E(Y)=5 000×0.4+7 000×0.3+9 000×0.2+11 000×0.1=7 000(元),
D(X)=(6 000-7 000)2×0.4+(7 000-7 000)2×0.3+(8 000-7 000)2×0.2+(9 000-7 000)2×0.1=1 0002,
D(Y)=(5 000-7 000)2×0.4+(7 000-7 000)2×0.3+(8 000-7000)2×0.2+(11 000-7 000)2×0.1=2 0002,
则E(X)=E(Y),D(X)
若希望不同职位的月薪差距大一些,则选择乙公司;
(2)因为χ1=5.551 3>5.024,故根据临界值表得出“选择意愿与年龄有关系”的结论犯错误的概率的上限是0.025.
由数据分布可得选择意愿与性别两个分类变量的2×2列联表如表所示:
选择甲公司
选择乙公司
合计
男
250
350
600
女
200
200
400
合计
450
550
1 000
计算观测值
χ2=
≈6.734>6.635,
对照临界值表得出“选择意愿与愊有关系”的结论犯错误的概率的上限为0.01.
由于0.01<0.025,所以与年龄相比,选择意愿与性别关联性更大.
17.某地区不同身高的未成年男性的体重平均值如表所示:
身高
x(cm)
60
70
80
90
100
110
体重
y(kg)
6.13
7.90
9.99
12.15
15.02
17.50
身高
x(cm)
120
130
140
150
160
170
体重
y(kg)
20.92
26.86
31.11
38.85
47.25
55.05
(1)试建立y与x之间的经验回归方程;
(2)如果体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么这个地区一名身高175 cm、体重82 kg的在校男生体重是否正常?
解:(1)根据题表中的数据画出散点图如图所示
由图可看出,样本点分布在某条指数函数曲线y=c1ec2x的周围,
于是令z=ln y,得下表:
x
60
70
80
90
100
110
z
1.81
2.07
2.30
2.50
2.71
2.86
x
120
130
140
150
160
170
z
3.04
3.29
3.44
3.66
3.86
4.01
作出散点图如图所示:
由表中数据可得z与x之间的经验回归直线方程为
=0.662 5+0.020x,
则有=e0.662 5+0.020x.
(2)当x=175时,平均体重的预测值为
=e0.662 5+0.020×175≈64.23,
因为64.23×1.2≈77.08<82,所以这个男生偏胖.
18.随着食品安全问题逐渐引起人们的重视,有机、健康的高端绿色蔬菜越来越受到消费者的欢迎,同时生产—运输—销售一体化的直销供应模式,不仅减少了成本,而且减去了蔬菜的二次污染等问题.
(1)在有机蔬菜的种植过程中,有机肥料使用是必不可少的.根据统计,某种有机蔬菜的产量与有机肥料的用量有关系,每个有机蔬菜大棚产量的增加量y(百千克)与使用堆沤肥料x(千克)之间对应数据如表:
使用堆沤肥料x(千克)
2
4
5
6
8
产量增加量y(百千克)
3
4
4
4
5
依据表中的数据,用最小二乘法求出y关于x的线性回归方程=x+,并根据所求线性回归方程估计如果每个有机蔬菜大棚使用堆沤肥料10千克,则每个有机蔬菜大棚产量增加量y是多少百千克;
(2)某大棚蔬菜种植基地将采摘的有机蔬菜以每份三千克称重并保鲜分装,以每份10元的价格销售到生鲜超市.“乐购”生鲜超市以每份15元的价格卖给顾客,如果当天前8小时卖不完,则超市通过促销以每份5元的价格卖给顾客(根据经验,当天能够把剩余的有机蔬菜都低价处理完毕,且处理完毕后,当天不再进货).该生鲜超市统计了100天有机蔬菜在每天的前8小时内的销售量(单位:份),制成如下表格(注:x,y∈N*,且x+y=30):
每日前8个小时
销售量(单位:份)
15
16
17
18
19
20
21
频数
10
x
16
16
15
13
y
若以100天记录的频率作为每日前8小时销售量发生的概率,以该生鲜超市当天销售有机蔬菜利润的期望为决策依据,当购进17份比购进18份的利润的期望大时,求x的取值范围.
附:回归方程系数公式=,=-.
解:(1)==5,==4,
计算得=0.3,=2.5,
所以y关于x的线性回归方程为=0.3x+2.5,
当x=10时,=0.3×10+2.5=5.5,
所以如果每个有机蔬菜大棚使用堆沤肥料10千克,估计每个有机蔬菜大棚产量的增加量是5.5百千克.
(2)若该超市一天购进17份这种有机蔬菜,设Y1表示当天的利润(单位:元),那么Y1的分布列为
Y1
65
75
85
P
Y1的数学期望E(Y1)=65×+75×+85×=;
若该超市一天购进18份这种有机蔬菜,设Y2表示当天的利润(单位:元),那么Y2的分布列为
Y2
60
70
80
90
P
Y2的数学期望E(Y2)=60×+70×+80×+90×=,
又购进17份比购进18份的利润的期望大,故>,解得x>24,故x的取值范围是[25,30)且x∈N*.
23版新高考一轮分层练案(一) 集合: 这是一份23版新高考一轮分层练案(一) 集合,共4页。
23版新高考一轮分层练案(四十四) 圆的方程: 这是一份23版新高考一轮分层练案(四十四) 圆的方程,共5页。试卷主要包含了在平面直角坐标系内,若曲线C,已知点P,圆C等内容,欢迎下载使用。
23版新高考一轮分层练案(四十八) 双曲线: 这是一份23版新高考一轮分层练案(四十八) 双曲线,共7页。试卷主要包含了已知F1,F2分别是双曲线C,已知双曲线C,P是双曲线C等内容,欢迎下载使用。