高中北师大版 (2019)2.2 成对数据的线性相关性巩固练习
展开第七章 §1 §2
A 组·素养自测
一、选择题
1.已知变量X与Y负相关,且由观测数据算得样本平均数=1.5,=5,则由该观测数据算得的线性回归方程可能是( A )
A.Y=-0.8X+6.2 B.Y=-0.5X+8
C.Y=-0.6X+4.1 D.Y=0.6X+5
[解析] 因为变量X与Y负相关,所以排除D;因为回归直线过样本中心点(,),将(1.5,5)代入A,B,C对应的方程中,可知选A.
2.下图是具有相关关系的两个变量的一组数据的散点图和回归直线,若去掉一个点使得余下的5个点所对应的数据的相关系数最大,则应当去掉的点是( B )
A.D B.E
C.F D.A
[解析] 由具有相关关系的两个变量的一组数据的散点图和回归直线可知,散点越靠近直线,对应的数据的相关系数越大,故应该去掉最远点E.
3.小明家所在小区倡导对生活垃圾进行分类,他对垃圾分类后处理垃圾X(千克)所需费用Y(角)的情况做了调研,统计了下表中几组对应数据,用最小二乘法得到Y关于X的线性回归方程Y=0.7X+0.35,则下列说法错误的是( D )
X | 3 | 4 | 5 | 6 |
Y | 2.5 | 3 | 4 | m |
A.变量X,Y之间呈正相关关系
B.m=4.5
C.可以预测当X=10,Y=7.35
D.由表格中数据知样本中心点为(4.5,4.5)
[解析] 因为Y=0.7X+0.35,所以变量X,Y之间呈正相关关系,A选项正确;将X=10代入线性回归方程Y=0.7X+0.35,可以预测Y=7.35,C选项正确;所得回归直线一定经过数据的样本中心点,==4.5,将其代入Y=0.7X+ 0.35,得=3.5,D选项错误;由中心点坐标可求得m=4.5,B选项正确,故选D.
4.对有线性相关关系的两个变量建立的回归直线方程=+x中,回归系数b( C )
A.不能小于0 B.不能大于0
C.不能等于0 D.只能小于0
[解析] 回归系数b可以大于0,可以小于0,但不能等于0.
5.已知x与y之间的几组数据如下表.
x | 1 | 2 | 3 | 4 | 5 | 6 |
y | 0 | 2 | 1 | 3 | 3 | 4 |
假设根据上表数据所得线性回归方程为=x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′ ,则以下结论正确的是( C )
A.>b′,>a′ B.>b′,<a′
C.<b′,>a′ D.<b′,<a′
[解析] 由(1,0),(2,2)求b′,a′.
b′==2,a′=0-2×1=-2.
求,时,xiyi=0+4+3+12+15+24=58,
=,=,x=1+4+9+16+25+36=91,
∴==,
=-×=-=-,
∴<b′,>a′.
6.(多选)下列关系中,属于相关关系的是( BD )
A.正方形的边长与面积之间的关系
B.生活习惯与健康状况的关系
C.人的身高与年龄之间的关系
D.降雪量与交通事故的发生率之间的关系
[解析] 在A中,正方形的边长与面积之间的关系是函数关系;在B中,生活习惯与健康状况不具有严格的函数关系,但具有相关关系;在C中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在D中,降雪量与交通事故的发生率之间具有相关关系.
二、填空题
7.对具有线性相关关系的变量x和y,测得一组数据如下表:
x | 2 | 4 | 5 | 6 | 8 |
y | 30 | 40 | 60 | 50 | 70 |
若已求得它们的回归直线方程的斜率为6.5,则这条回归直线的方程为_=6.5x+17.5__.
[解析] 设回归直线为=6.5x+a,点(,)在此直线上,故a=17.5.
8.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程和相关系数r,分别得到以下四个结论:
①y=2.347x-6.423,且r=-9.928 4;②y=-3.476x+5.648,且r=-0.953 3;③y=5.437x+8.493,且r=0.983 0;④y=-4.326x-4.578,且r=0.899 7.
其中一定不正确的结论的序号是_①④__.
[解析] 对于①,两变量为正相关,∴r应该大于0,∴①错误;
对于④,两变量为负相关,∴r应该小于0,∴④错误;②③是正确的.
三、解答题
9.某个服装店经营某种服装, 在某周内获纯利y(元)与该周每天销售这种服装件数x之间的一组数据关系见表:
x | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
y | 66 | 69 | 73 | 81 | 89 | 90 | 91 |
已知x=280,xiyi=3 487.
(1)求,;
(2)已知纯利y与每天销售件数x线性相关,试求出其回归直线方程.
[解析] (1)==6,==.
(2)因为y与x有线性相关关系,
所以===4.75,=-6×4.75=≈51.36.
故回归直线方程为=4.75x+51.36.
B 组·素养提升
一、选择题
1.某公司过去五个月的广告费支出x(单位:万元)与销售额y(单位:万元)之间有下列对应数据:
x | 2 | 4 | 5 | 6 | 8 |
y | ▲ | 40 | 60 | 50 | 70 |
工作人员不慎将表格中y的第一个数据丢失,已知y对x呈线性相关关系,且回归方程为=6.5x+17.5,则下列说法正确的有( B )
A.销售额y与广告费支出x负相关
B.丢失的数据(表中▲处)为30
C.该公司广告费支出每增加1万元,销售额一定增加6.5万元
D.若该公司下月广告费支出为8万元,则销售额约为75万元
[解析] 由回归方程=6.5x+17.5,可知=6.5,则销售额y与广告费支出x正相关,所以A错误;设丢失的数据为m,由表中的数据可得=5,=,把点代入回归方程,可得=6.5×5+17.5,解得m=30,所以B正确;该公司广告费支出每增加1万元,销售额不一定增加6.5万元,所以C不正确;若该公司下月广告费支出为8万元,则销售额约为y=6.5×8+17.5=69.5(万元),所以D不正确,故选B.
2.某同学将收集到的六组数据制作成散点图如图所示,并得到其回归直线的方程为l1:y=0.68x+,计算其相关系数为r1.经过分析确定点F为“离群点”,把它去掉后,再利用剩下的5组数据计算得到回归直线的方程为l2:y=x+0.68,相关系数为r2,以下结论中,错误的是( B )
A.r1>0,r2>0 B.r1>r2
C.=0.12 D.0<<0.68
[解析] 由图可知两变量呈现正相关,故r1>0,r2>0,且r1<r2,故A正确,B错误;又回归直线l1:y=0.68x+必经过样本中心点(3.5,2.5),所以=2.5-0.68×3.5=0.12,C正确;回归直线l2:y=x+0.68必经过样本中心点(3,2),所以2=×3+0.68,所以=0.44,也可直接根据图象判断0<<0.68(比较两直线的倾斜程度),故ACD正确,B错误.
3.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( D )
A.-1 B.0
C. D.1
[解析] 因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1.
4.已知变量y关于x的回归方程为=ebx-0.5,其一组数据如下表所示:
x | 1 | 2 | 3 | 4 |
y | e | e3 | e4 | e6 |
若x=5,则预测y的值可能为( D )
A.e5 B.e
C.e7 D.e
[解析] 将式子两边取对数,得到ln =bx-0.5,令z=ln ,得到z=bx-0.5,列出x,z的取值对应的表格,
x | 1 | 2 | 3 | 4 |
z | 1 | 3 | 4 | 6 |
则==2.5,==3.5,
∵(,)满足z=bx-0.5,∴3.5=b×2.5-0.5,
解得b=1.6,∴z=1.6x-0.5,∴y=e1.6x-0.5,当x=5时,=e1.6×5-0.5=e,故选D.
二、填空题
5.对某台机器购置后的运行年限x(x=1,2,3,…)与当年利润y的统计分析知x,y具备线性相关关系,回归方程为=10.47-1.3x,估计该台机器最为划算的使用年限为_8__年.
[解析] 当年利润小于或等于零时应该报废该机器,当y=0时,令10.47-1.3x=0,解得x≈8,故估计该台机器最为划算的使用年限为8年.
6.以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln y,其变换后得到线性回归方程z=0.3x+4,则c=_e4__.
[解析] 由题意,得ln(cekx)=0.3x+4,所以lnc+kx=0.3x+4,所以lnc=4,所以c=e4.
三、解答题
7.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据.
单价x(元) | 8 | 8.2 | 8.4 | 8.6 | 8.8 | 9 |
销量y(件) | 90 | 84 | 83 | 80 | 75 | 68 |
(1)求回归直线方程=x+,其中=-20;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元? (利润=销售收入-成本)
[解析] (1)由于==8.5,
==80.
所以=-=80+20×8.5=250,从而回归直线方程为=-20x+250.
(2)设工厂获得的利润为L元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1 000=-20(x-8.25)2+361.25.
当且仅当x=8.25时,L取得最大值,故当单价定为8.25元时,工厂可获得最大利润.
8.如图是某企业2015年至2021年的污水净化量(单位:吨)的折线图.
注:年份代码1~7分别对应年份2015~2021.
(1)由折线图看出,可用线性回归模型拟合y和t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程,预测2022年该企业的污水净化量.
[解析] (1)由折线图中的数据得,
=4, (ti-)2=28, (yi-)2=18, (ti-)(yi-)=21,所以r=≈0.94.
因为y与t的相关系数近似为0.94,说明y与t的线性相关程度相当大,所以可以用线性回归模型拟合y与t的关系.
(2)因为=54,===,
所以=-=54-×4=51,
所以y关于t的线性回归方程为=t+=t+51,将2022年对应的t=8代入上式,得=×8+51=57,
所以预测2022年该企业污水净化量约为57吨.
高中数学北师大版 (2019)选择性必修 第一册第七章 统计案例2 成对数据的线性相关性2.2 成对数据的线性相关性精练: 这是一份高中数学北师大版 (2019)选择性必修 第一册第七章 统计案例2 成对数据的线性相关性2.2 成对数据的线性相关性精练,共10页。试卷主要包含了1 相关系数 2等内容,欢迎下载使用。
高中数学北师大版 (2019)选择性必修 第一册2.2 成对数据的线性相关性当堂检测题: 这是一份高中数学北师大版 (2019)选择性必修 第一册2.2 成对数据的线性相关性当堂检测题,共8页。试卷主要包含了下列两个变量具有正相关关系的是,对变量x,y由观测数据得散点图,下面的变量之间具有相关关系的是等内容,欢迎下载使用。
高中数学第七章 统计案例2 成对数据的线性相关性2.2 成对数据的线性相关性巩固练习: 这是一份高中数学第七章 统计案例2 成对数据的线性相关性2.2 成对数据的线性相关性巩固练习,共9页。试卷主要包含了939,0,下列说法中正确的是 等内容,欢迎下载使用。