2020版高考数学一轮复习课时作业61《 变量间的相关关系、统计案例》(含解析) 练习
展开课时作业61 变量间的相关关系、统计案例
一、选择题
1.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且=2.347x-6.423;
②y与x负相关且=-3.476x+5.648;
③y与x正相关且=5.437x+8.493;
④y与x正相关且=-4.326x-4.578.
其中一定不正确的结论的序号是( D )
A.①② B.②③
C.③④ D.①④
解析:正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故不正确的为①④.
2.下列说法错误的是( B )
A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好
解析:根据相关关系的概念知A正确;当r>0时,r越大,相关性越强,当r<0时,r越大,相当性越弱,故B不正确;对于一组数据的拟合程度的好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好,二是R2越大,拟合效果越好,所以R2为0.98的模型比R2为0.80的模型拟合的效果好,C、D正确,故选B.
3.为了解某商品销售量y(件)与其单价x(元)的关系,统计了(x,y)的10组值,并画成散点图如图,则其回归方程可能是( B )
A.=-10x-198 B.=-10x+198
C.=10x+198 D.=10x-198
解析:由图象可知回归直线方程的斜率小于零,截距大于零,故选B.
4.若一函数模型为y=ax2+bx+c(a≠0),为将y转化为t的回归直线方程,需作变换t=( C )
A.x2 B.(x+a)2
C.2 D.以上都不对
解析:y关于t的回归直线方程,实际上就是y关于t的一次函数.因为y=a2+,所以可知选项C正确.
5.(2019·湖北七市联考)广告投入对商品的销售额有较大影响,某电商对连续5个年度的广告费和销售额进行统计,得到统计数据如表(单位:万元)
广告费 | 2 | 3 | 4 | 5 | 6 |
销售额 | 29 | 41 | 50 | 59 | 71 |
由表可得回归方程为=10.2x+,据此模拟,预测广告费为10万元时的销售额约为( C )
A.101.2 B.108.8
C.111.2 D.118.2
解析:由题意得:=4,=50,∴50=4×10.2+,解得=9.2,∴回归直线方程为=10.2x+9.2,∴当x=10时,=10.2×10+9.2=111.2,故选C.
6.某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y与x具有线性相关关系,且回归方程为=0.6x+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为( D )
A.66% B.67%
C.79% D.84%
解析:因为y与x具有线性相关关系,满足回归方程=0.6x+1.2,该城市职工人均工资为x=5,所以可以估计该城市的职工人均消费水平y=0.6×5+1.2=4.2,所以可以估计该城市人均消费额占人均工资收入的百分比为=84%.
7.(2019·江西九校联考)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.
| 非一线 | 一线 | 总计 |
愿生 | 45 | 20 | 65 |
不愿生 | 13 | 22 | 35 |
总计 | 58 | 42 | 100 |
由K2=,
得K2=≈9.616.
参照下表,
P(K2≥k0) | 0.050 | 0.010 | 0.001 |
k0 | 3.841 | 6.635 | 10.828 |
下列说法中,正确的结论是( C )
A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”
C.有99%以上的把握认为“生育意愿与城市级别有关”
D.有99%以上的把握认为“生育意愿与城市级别无关”
解析:∵K2≈9.616>6.635,∴有99%以上的把握认为“生育意愿与城市级别有关”.
二、填空题
8.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下对照表:
气温(℃) | 18 | 13 | 10 | -1 |
用电量(度) | 24 | 34 | 38 | 64 |
由表中数据得线性回归直线方程=x+中的=-2,预测当气温为-4 ℃时,用电量为68度.
解析:回归直线过点(,),
根据题意得==10,
==40,将(10,40)代入=-2x+,解得=60,则=-2x+60,当x=-4时,=(-2)×(-4)+60=68,即当气温为-4 ℃时,用电量约为68度.
9.(2019·安徽蚌埠段考)为了研究工人的日平均工作量是否与年龄有关,从某工厂抽取了100名工人,且规定日平均生产件数不少于80件者为“生产能手”,列出的2×2列联表如下:
| 生产能手 | 非生产能手 | 总计 |
25周岁以上 | 25 | 35 | 60 |
25周岁以下 | 10 | 30 | 40 |
总计 | 35 | 65 | 100 |
有90%以上的把握认为“工人是否为‘生产能手’与工人的年龄有关”.
解析:由2×2列联表可知,K2=
≈2.93,
因为2.93>2.706,所以有90%以上的把握认为“工人是否为‘生产能手’与工人的年龄有关”.
三、解答题
10.某公司为了了解广告投入对销售收益的影响,在若干地区各投入万元广告费用,并将各地的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从0开始计数的.
(1)根据频率分布直方图计算图中各小长方形的宽度;
(2)估计该公司投入万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值);
(3)该公司按照类似的研究方法,测得另外一些数据,并整理得到下表:
广告投入x(单位:万元) | 1 | 2 | 3 | 4 | 5 |
销售收益y(单位:万元) | 2 | 3 | 2 |
| 7 |
表中的数据显示,x与y之间存在线性相关关系,请将(2)中的结果填入空白栏,并计算y关于x的线性回归方程.
解:(1)设各小长方形的宽度为m,由频率分布直方图中各小长方形面积总和为1,可知(0.08+0.1+0.14+0.12+0.04+0.02)·m=0.5m=1,故m=2.
(2)由(1)知,各分组依次是[0,2),[2,4),[4,6),[6,8),[8,10),[10,12],其中点值分别为1,3,5,7,9,11,对应的频率分别为0.16,0.20, 0.28, 0.24,0.08,0.04,
故可估计平均值为1×0.16+3×0.2+5×0.28+7×0.24+9×0.08+11×0.04=5.
(3)空白栏中填5.
由题意可知,==3,
==3.8,iyi=1×2+2×3+3×2+4×5+5×7=69,
=12+22+32+42+52=55.
根据公式可求得===1.2,=3.8-1.2×3=0.2,即线性回归方程为=1.2x+0.2.
11.已知某产品连续4个月的广告费用为xi(i=1,2,3,4)千元,销售额为yi(i=1,2,3,4)万元,经过对这些数据的处理,得到如下数据信息:①x1+x2+x3+x4=18,y1+y2+y3+y4=14;②广告费用x和销售额y之间具有较强的线性相关关系;③回归直线方程=x+中的=0.8(用最小二乘法求得).那么,当广告费用为6千元时,可预测销售额约为( B )
A.3.5万元 B.4.7万元
C.4.9万元 D.6.5万元
解析:依题意得=4.5,=3.5,由回归直线必过样本中心点得a=3.5-0.8×4.5=-0.1.当x=6时,=0.8×6-0.1=4.7.
12.近代统计学的发展起源于二十世纪初,它是在概率论的基础上发展起来的,统计性质的工作则可以追溯到远古的“结绳记事”和《二十四史》中大量的关于我国人口、钱粮、水文、天文、地震等资料的记录.近几年,雾霾来袭,对某市该年11月份的天气情况进行统计,结果如下表:
表一
日期 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
天气 | 晴 | 霾 | 霾 | 阴 | 霾 | 霾 | 阴 | 霾 | 霾 | 霾 |
日期 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
天气 | 阴 | 晴 | 霾 | 霾 | 霾 | 霾 | 霾 | 霾 | 阴 | 晴 |
日期 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 |
天气 | 霾 | 霾 | 晴 | 霾 | 晴 | 霾 | 霾 | 霾 | 晴 | 霾 |
对于此种情况,该市政府为减少雾霾于次年采取了全年限行的政策.下表是一个调查机构对比以上两年11月份(该年不限行30天、次年限行30天,共60天)的调查结果:
表二
| 不限行 | 限行 | 总计 |
没有雾霾 | a |
|
|
有雾霾 | b |
|
|
总计 | 30 | 30 | 60 |
(1)请由表一中数据求a,b的值,并估计在该年11月份任取一天是晴天的概率;
(2)请用统计学原理计算,若没有90%的把握认为雾霾与限行有关系,则限行时有多少天没有雾霾?
P(K2≥k0) | 0.100 | 0.050 | 0.010 | 0.001 |
k0 | 2.706 | 3.841 | 6.635 | 10.828 |
(表中数据使用时四舍五入取整数)
解:(a)a=10,b=20,所求概率P==.
(2)设限行时有x天没有雾霾,则有雾霾的天数为30-x,由题意得K2的观测值
k=≤3,代入数据化简得21x2-440x+1 500≤0,x∈[0,30],x∈N*,即(7x-30)(3x-50)≤0,解得≤x≤,
所以5≤x≤16,且x∈N*,
所以若没有90%的把握认为雾霾与限行有关系,则限行时有5~16天没有雾霾.
13.(2019·山西八校联考)某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(万元)和销售量y(万台)的数据如下:
年份 | 2011 | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 |
广告费 支出x | 1 | 2 | 4 | 6 | 11 | 13 | 19 |
销售量y | 1.9 | 3.2 | 4.0 | 4.4 | 5.2 | 5.3 | 5.4 |
(1)若用线性回归模型拟合y与x的关系,求出y关于x的线性回归方程;
(2)若用y=c+d模型拟合y与x的关系,可得回归方程=1.63+0.99,经计算线性回归模型和该模型的R2分别约为0.75和0.88,请用R2说明选择哪个回归模型更好;
(3)已知利润z与x,y的关系为z=200y-x.根据(2)的结果回答下列问题:
①广告费x=20时,销售量及利润的预报值是多少?
②广告费x为何值时,利润的预报值最大?(精确到0.01)
参考公式:回归直线=+x的斜率和截距的最小二乘估计分别为==,=- .
参考数据:≈2.24.
解:(1)∵=8,=4.2,iyi=279.4,=708,
∴===0.17,
=- =4.2-0.17×8=2.84,
∴y关于x的线性回归方程为=0.17x+2.84.
(2)∵0.75<0.88且R2越大,反映残差平方和越小,模型的拟合效果越好,∴选用=1.63+0.99更好.
(3)由(2)知,
①当x=20时,销售量的预报值=1.63+0.99≈6.07(万台),利润的预报值z=200×(1.63+0.99)-20≈1 193.04(万元).
②z=200(1.63+0.99)-x=-x+198+326=-()2+198+326=-(-99)2+10 127,
∴当=99,即x=9 801时,利润的预报值最大,故广告费为9 801万元时,利润的预报值最大.