高考数学一轮复习第十章统计统计案例第三节变量间的相关关系与统计案例课时规范练理含解析新人教版
展开第三节 变量间的相关关系与统计案例
[A组 基础对点练]
1.下面四个命题中,错误的是( )
A.从匀速传递的产品生产流水线上,质检员每15分钟从中抽取一件产品进行某项指标检测,这样的抽样是系统抽样
B.对分类变量X与Y的随机变量K2的观测值k来说,k越大,“X与Y有关系”的把握程度越大
C.两个随机变量相关性越强,则相关系数的绝对值越接近于0
D.在回归直线方程=0.4x+12中,当解释变量x每增加一个单位时,预报变量平均增加0.4个单位
解析:两个随机变量相关性越强,则相关系数的绝对值越接近于1,故选项C错误.
答案:C
2.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),可得散点图如图①,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),可得散点图如图②.由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
解析:由散点图可得两组数据均线性相关,且图①的线性回归方程斜率为负,图②的线性回归方程斜率为正,则由散点图可判断变量x与y负相关,u与v正相关.
答案:C
3.(2021·河北邯郸模拟)为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高条形图,最能体现该药物对预防禽流感有效果的图形是( )
解析:选项D中不服药样本中患病的频率与服药样本中患病的频率差距最大.
答案:D
4.(2020·河南新乡模拟)下列四个选项中,关于两个变量所具有的相关关系描述正确的是( )
A.圆的面积与半径具有相关性
B.纯净度与净化次数不具有相关性
C.作物的产量与人的耕耘是负相关
D.学习成绩与学习效率是正相关
解析:对于选项A,圆的面积与半径是确定的关系,是函数关系,不是相关关系,选项A错误;
对于选项B,一般地,净化次数越多,纯净度就越高,所以纯净度与净化次数是正相关关系,选项B错误;
对于选项C,一般地,作物的产量与人的耕耘是一种正相关关系,所以选项C错误;
对于选项D,学习成绩与学习效率是一种正相关关系,所以选项D正确.
答案:D
5.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且=2.347x-6.423;②y与x负相关且=-3.476x+5.648;③y与x正相关且=5.437x+8.493;④y与x正相关且=-4.326x-4.578.
其中一定不正确的结论的序号是( )
A.①② B.②③
C.③④ D.①④
解析:=x+,当>0时,为正相关,<0时,为负相关,故①④错误.
答案:D
6.(2021·重庆模拟)某青少年成长关爱机构为了调研所在地区青少年的年龄与身高状况,随机抽取6岁,9岁,12岁,15岁,18岁的青少年身高数据各1 000个,根据各年龄段平均身高作出如图所示的散点图和回归直线l.根据图中数据,下列对该样本描述错误的是 ( )
A.据样本数据估计,该地区青少年身高与年龄成正相关
B.所抽取数据中,5 000名青少年平均身高约为145 cm
C.直线l的斜率的值近似等于样本中青少年平均身高每年的增量
D.从这5种年龄的青少年中各取一人的身高数据,由这5人的平均年龄和平均身高数据作出的点一定在直线l上
解析:由题图知该地区青少年身高与年龄成正相关,选项A描述正确;由题图中数据得5 000名青少年平均身高为
=145 (cm),选项B描述正确;由回归直线l的斜率定义知选项C描述正确;对于选项D中,从这5种年龄的青少年中各取一人的身高数据不一定能代表所有的平均身高,所以选项D描述不正确.
答案:D
7.已知变量x,y之间具有线性相关关系,其回归方程为=-3+x.若xi=17,yi=4,则的值为( )
A.2 B.1
C.-2 D.-1
解析:依题意知,==1.7,==0.4,而直线=-3+x一定经过点(,),则-3+×1.7=0.4,解得=2.
答案:A
8.根据如下样本数据:
x | 3 | 4 | 5 | 6 | 7 |
y | 4.0 | a-5.4 | -0.5 | 0.5 | b-0.6 |
得到的回归方程为=x+.若样本点的中心为(5,0.9),则当x每增加1个单位时,y( )
A.增加1.4个单位 B.减少1.4个单位
C.增加7.9个单位 D.减少7.9个单位
解析:依题意得,==0.9,故a+b=6.5①;又样本点的中心为(5,0.9),故0.9=5b+a②,联立①②,解得b=-1.4,a=7.9,即=-1.4x+7.9,可知当x每增加1个单位时,y减少1.4个单位.
答案:B
9.经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y关于x的回归直线方程:=0.245x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析:x变为x+1,=0.245(x+1)+0.321=0.245x+0.321+0.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元.
答案:0.245
10.某炼钢厂废品率x(%)与成本y(元/吨)的线性回归方程为=105.492+42.569x.当成本控制在176.5元/吨时,可以预计生产的1 000吨钢中,约有________吨钢是废品(结果保留两位小数).
解析:因为176.5=105.492+42.569x,解得x≈1.668,即当成本控制在176.5元/吨时,废品率约为1.668%,所以生产的1 000吨钢中,约有1 000×1.668%=16.68吨是废品.
答案:16.68
11.(2020·山西运城模拟)某科考试题中有甲、乙两道不同类型的选做题,且每道题满分为10分,每位考生需从中任选一题作答.
(1)A同学将自己在该考试中历次的选题及得分情况统计如下:
选甲题8次,得分分别为:6,10,10,6,6,10,6,10;
选乙题10次,得分分别为:5,10,9,8,9,8,10,8,5,8.
某次考试中,A同学的剩余时间仅够阅读并解答出甲、乙两题中的某一道题,他应该选择甲题还是乙题?
(2)某次考试中,某班40名同学中选择甲、乙两题的人数相等,在16名该选做题获得满分的同学中有10人选的是甲题,求能否在犯错误的概率不超过1%的情况下,判断该选做题得满分与选题有关?
参考公式:K2=.
参考数据:
P(K2≥k0) | 0.1 | 0.01 | 0.001 |
k0 | 2.706 | 6.635 | 10.828 |
解析:(1)计算甲、乙两题得分的平均数分别为
甲=×(6+10+10+6+6+10+6+10)=8,
乙=×(5+10+9+8+9+8+10+8+5+8)=8.
甲、乙两题得分的方差为
s=×[(6-8)2+…+(10-8)2]=4,
s=×[(5-8)2+…+(8-8)2]=2.8,
因此选择乙题更加稳妥.
(2)根据题意,填写2×2列联表如下:
| 甲 | 乙 | 合计 |
满分 | 10 | 6 | 16 |
非满分 | 10 | 14 | 24 |
合计 | 20 | 20 | 40 |
因此K2的观测值
k==≈1.667<6.635,
所示不能在犯错误的概率不超过1%的情况下,判断该选做题得满分与选题有关.
[B组 素养提升练]
1.(2021·湖南岳阳模拟)某考察团对全国10个城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程=0.66x+1.562.若某城市居民人均消费水平为7.675(千元),估计该城市人均消费占人均工资收入的百分比约为________.
解析:由=0.66x+1.562知,当y=7.675时,x=,故所求百分比为=≈83%.
答案:83%
2.(2020·安徽合肥模拟)某品牌手机厂商推出新款的旗舰机型,并在某地区跟踪调查得到这款手机上市时间(x个月)和市场占有率(y%)的几组相关对应数据:
x | 1 | 2 | 3 | 4 | 5 |
y | 0.02 | 0.05 | 0.1 | 0.15 | 0.18 |
(1)根据上表中的数据,用最小二乘法求出y关于x的线性回归方程;
(2)根据上述回归方程,分析该款旗舰机型市场占有率的变化趋势,并预测自上市起经过多少个月,该款旗舰机型市场占有率能超过0.5%(精确到月).
附:=,=-.
解析:(1)由题意知=3,=0.1,iyi=1.92,=55,所以===0.042,
=-=0.1-0.042×3=-0.026,
所以线性回归方程为=0.042x-0.026.
(2)由(1)中的回归方程可知,上市时间与市场占有率正相关,即上市时间每增加1个月,市场占有率约增加0.042个百分点.
由=0.042x-0.026>0.5,解得x≥13,故预计上市13个月时,该款旗舰机型市场占有率能超过0.5%.
3.近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次(单位:十人次),统计数据如下表所示:
x | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
y | 6 | 11 | 21 | 34 | 66 | 101 | 196 |
根据以上数据,绘制了如图所示的散点图.
(1)根据散点图判断,在推广期内,y=a+bx与y=c·dx(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y(十人次)关于活动推出天数x的回归方程类型?(说明理由)
(2)根据(1)的判断结果及表中的数据,求y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.
参考数据:
iyi | ivi | 100.54 | ||
62.14 | 1.54 | 2 535 | 50.12 | 3.47 |
其中vi=lg yi;=i.
参考公式:
对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线=+u的斜率和截距的最小二乘估计公式分别为:
=,=-.
解析:(1)根据散点图判断,y=c·dx适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型(理由略,合理即可).
(2)将y=c·dx两边同时取常用对数得lg y=lg (c·dx)=lg c+lg dx.
设lg y=v,∴v=lg c+lg dx.
∵=4,=1.54,=140,
∴lg d====0.25,
把样本点的中心(4,1.54)代入v=lg c+lg dx,得lg c=0.54,
∴=0.54+0.25x,∴lg y=0.54+0.25x,
∴y关于x的回归方程为=100.54+0.25x=100.54×(100.25)x=3.47×100.25x,
把x=8代入,得=3.47×102=347,
故活动推出第8天使用扫码支付的人次约为347.
2023年高考数学一轮复习课时规范练56变量间的相关关系统计案例含解析新人教A版理: 这是一份2023年高考数学一轮复习课时规范练56变量间的相关关系统计案例含解析新人教A版理,共7页。试卷主要包含了相关变量的样本数据如下表,,5x+2,3时,x一定是8,已知下列说法等内容,欢迎下载使用。
高考数学一轮复习考点规范练56变量间的相关关系统计案例含解析新人教A版理: 这是一份高考数学一轮复习考点规范练56变量间的相关关系统计案例含解析新人教A版理,共10页。试卷主要包含了两个随机变量x,y的取值如下表,8)的残差为0等内容,欢迎下载使用。
广西专用高考数学一轮复习考点规范练57变量间的相关关系统计案例含解析新人教A版理: 这是一份广西专用高考数学一轮复习考点规范练57变量间的相关关系统计案例含解析新人教A版理,共12页。试卷主要包含了822>10等内容,欢迎下载使用。