2018年高考考点完全题数学(理)考点通关练习题 第八章 概率与统计 67 word版含答案
展开考点测试67 变量间的相关关系与统计案例
一、基础小题
1.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )
A.=-2x+100 B.=2x+100
C.=-2x-100 D.=2x-100
答案 A
解析 B、D为正相关,C中值恒为负,不符合题意.
2.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x/万元 | 4 | 2 | 3 | 5 |
销售额y/万元 | 49 | 26 | 39 | 54 |
根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
答案 B
解析 ∵=-=-9.4×=9.1,∴回归方程为=9.4x+9.1.令x=6,得=9.4×6+9.1=65.5(万元).
3.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点的中心(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
答案 D
解析 由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确.又线性回归方程必过样本点中心(,),因此B正确.由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故C正确.当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此D不正确.
4.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
A.-1 B.0 C. D.1
答案 D
解析 样本点都在直线上时,其数据的估计值与真实值是相等的,即yi=i,代入相关系数公式r==1.
5. 设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )
A.直线l过点(,)
B.x和y的相关系数为直线l的斜率
C.x和y的相关系数在0到1之间
D.当n为偶数时,分布在l两侧的样本点的个数一定相同
答案 A
解析 因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以B、C错误;D中n为偶数时,分布在l两侧的样本点的个数可以不相同,所以D错误;根据线性回归直线一定经过样本点中心可知A正确.
6.在一次对性别与说谎是否相关的调查中,得到如下数据:
| 说谎 | 不说谎 | 合计 |
男 | 6 | 7 | 13 |
女 | 8 | 9 | 17 |
合计 | 14 | 16 | 30 |
根据表中数据,得到如下结论中正确的一项是( )
A.在此次调查中有95%的把握认为是否说谎与性别有关
B.在此次调查中有99%的把握认为是否说谎与性别有关
C.在此次调查中有99.5%的把握认为是否说谎与性别有关
D.在此次调查中没有充分的证据显示说谎与性别有关
答案 D
解析 由于K2=≈0.0024,由于K2很小,因此,在此次调查中没有充分的证据显示说谎与性别有关.故选D.
7. 如图所示,有5组(x,y)数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.
答案 D
解析 由散点图知呈带状区域时有较强的线性相关关系,故去掉D.
8.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:
| 又发作过心脏病 | 未发作过心脏病 | 合计 |
心脏搭桥手术 | 39 | 157 | 196 |
血管清障手术 | 29 | 167 | 196 |
合计 | 68 | 324 | 392 |
试根据上述数据计算K2=________.
根据表中所给的数据,能否在犯错误的概率不超过0.15的前提下认为这两种手术对病人又发作过心脏病的影响有差别?
________________________________________________________________________.
答案 1.779 不能作出这两种手术对病人又发作心脏病的影响有差别的结论
解析 根据列联表中的数据,
可以求得K2=≈1.779,而K2<2.072,
所以我们不能在犯错误的概率不超过0.15的前提下,作出这两种手术对病人又发作心脏病的影响有差别的结论.
二、高考小题
9.根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )
A.逐年比较,2008年减少二氧化硫排放量的效果最显著
B.2007年我国治理二氧化硫排放显现成效
C.2006年以来我国二氧化硫年排放量呈减少趋势
D.2006年以来我国二氧化硫年排放量与年份正相关
答案 D
解析 由柱形图,知2006年以来我国二氧化硫年排放量呈减少趋势,故其排放量与年份负相关,故D错误.
10.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元) | 8.2 | 8.6 | 10.0 | 11.3 | 11.9 |
支出y(万元) | 6.2 | 7.5 | 8.0 | 8.5 | 9.8 |
根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为( )
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
答案 B
解析 ∵==10,
==8,
∴=-0.76=8-0.76×10=0.4,
∴=0.76x+0.4.
当x=15时,=0.76×15+0.4=11.8.
11.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )
表1
成绩 性别 | 不及格 | 及格 | 总计 |
男 | 6 | 14 | 20 |
女 | 10 | 22 | 32 |
总计 | 16 | 36 | 52 |
表2
视力 性别 | 好 | 差 | 总计 |
男 | 4 | 16 | 20 |
女 | 12 | 20 | 32 |
总计 | 16 | 36 | 52 |
表3
智商 性别 | 偏高 | 正常 | 总计 |
男 | 8 | 12 | 20 |
女 | 8 | 24 | 32 |
总计 | 16 | 36 | 52 |
表4
阅读量 性别 | 丰富 | 不丰富 | 总计 |
男 | 14 | 6 | 20 |
女 | 2 | 30 | 32 |
总计 | 16 | 36 | 52 |
A.成绩 B.视力 C.智商 D.阅读量
答案 D
解析 根据K2=,代入题中数据计算得
表1:K2=≈0.009;
表2:K2=≈1.769;
表3:K2=≈1.3;
表4:K2=≈23.48.
∵D选项K2最大,
∴阅读量与性别有关联的可能性最大,故选D.
12.根据如下样本数据
x | 3 | 4 | 5 | 6 | 7 | 8 |
y | 4.0 | 2.5 | -0.5 | 0.5 | -2.0 | -3.0 |
得到的回归方程为=bx+a,则( )
A.a>0,b>0 B.a>0,b<0
C.a<0,b>0 D.a<0,b<0
答案 B
解析 把样本数据中的x,y分别当作点的横、纵坐标,在平面直角坐标系xOy中作出散点图,由图可知b<0,a>0.故选B.
13.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是( )
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
答案 A
解析 由变量x与y正相关知C、D均错,又回归直线经过样本中心(3,3.5),代入验证得A正确,B错误.故选A.
三、模拟小题
14.已知x,y的取值如表所示:
x | 2 | 3 | 4 |
y | 6 | 4 | 5 |
如果y与x线性相关,且线性回归方程为=x+,则的值为( )
A.- B. C.- D.
答案 A
解析 将=3,=5代入到=x+中,得=-.故选A.
15.对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i=1,2,…,8),其回归直线方程是=x+,且x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=6,则实数的值是( )
A. B. C. D.
答案 B
解析 依题意可知样本中心点为,则=×+a,解得=.
16.下列说法错误的是( )
A.在回归模型中,预报变量y的值不能由解释变量x唯一确定
B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好
答案 B
解析 对于A,在回归模型中,预报变量y的值由解释变量x和随机误差e共同确定,即x只能解释部分y的变化,∴A正确;对于B,线性回归分析中,相关系数r的绝对值越接近1,两个变量的线性相关性越强,反之,线性相关性越弱,∴B错误;对于C,在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,C正确;对于D,在回归分析中,用相关指数R2来刻画回归的效果时,R2取值越大,说明模型拟合的效果越好,∴R2为0.98的模型比R2为0.80的模型拟合的效果好,D正确.故选B.
17.为了检验某套眼保健操预防学生近视的作用,把500名做该套眼保健操的学生与另外500名未做该套眼保健操的学生的视力情况作记录并比较,提出假设H0:“这套眼保健操不能起到预防近视的作用”,利用2×2列联表计算所得的K2≈3.918.经查对临界值表知P(K2≥3.841)≈0.05.对此,四名同学得出了以下结论:
①有95%的把握认为“这套眼保健操能起到预防近视的作用”;②若某人未做该套眼保健操,那么他有95%的可能得近视;③这套眼保健操预防近视的有效率为95%;④这套眼保健操预防近视的有效率为5%.
其中所有正确结论的序号是________.
答案 ①
解析 根据查对临界值表知P(K2≥3.841)≈0.05,故有95%的把握认为“这套眼保健操能起到预防近视的作用”,即①正确;95%仅是指“这套眼保健操能起到预防近视的作用”的可信程度,所以②③④错误.
18.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,计算得i=80,i=20,iyi=184,=720.已知家庭的月储蓄y关于月收入x的线性回归方程为=x+,则变量x与y________(填“正相关”或“负相关”);若该居民区某家庭月收入为7千元,预测该家庭的月储蓄是________千元.
答案 正相关 1.7
解析 由题意,知n=10,=i=8,=i=2,∴==0.3,=2-0.3×8=-0.4,
∴=0.3x-0.4,∵0.3>0,∴变量x与y正相关.当x=7时,=0.3×7-0.4=1.7(千元).
一、高考大题
1.下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
参考数据:yi=9.32,tiyi=40.17, =0.55,≈2.646.
参考公式:相关系数r=,
回归方程=+t中斜率和截距的最小二乘估计公式分别为:
=,=- .
解 (1)由折线图中数据和附注中参考数据得
=4, (ti-)2=28, =0.55,
(ti-)(yi-)=tiyi-yi
=40.17-4×9.32=2.89,
r≈≈0.99.
因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.
(2)由=≈1.331及(1)得==≈0.103,
=-=1.331-0.103×4≈0.92.
所以y关于t的回归方程为=0.92+0.10t.
将2016年对应的t=9代入回归方程得
=0.92+0.10×9=1.82.
所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.
2.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
(xi-)2 | (wi-)2 | (xi-)(yi-) | (wi-)(yi-) | |||
46.6 | 563 | 6.8 | 289.8 | 1.6 | 1469 | 108.8 |
表中wi=,=wi.
(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:
①年宣传费x=49时,年销售量及年利润的预报值是多少?
②年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为
=,=- .
解 (1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.
(2) 令w=,先建立y关于w的线性回归方程.
由于===68,
=-=563-68×6.8=100.6,
所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68.
(3)①由(2),知当x=49时,年销售量y的预报值
=100.6+68=576.6,
年利润z的预报值
=576.6×0.2-49=66.32.
②根据(2)的结果,知年利润z的预报值
=0.2×(100.6+68)-x=-x+13.6+20.12,
所以当==6.8,即x=46.24时,取得最大值,
故年宣传费为46.24千元时,年利润的预报值最大.
二、模拟大题
3.班主任对班级22名学生进行了作业量多少的调查,数据如下:在喜欢玩电脑游戏的12人中,有10人认为作业多,2人认为作业不多;在不喜欢玩电脑游戏的10人中,有3人认为作业多,7人认为作业不多.
(1)根据以上数据建立一个2×2列联表;
(2)试问喜欢玩电脑游戏与认为作业多少是否有关系.
参考公式:K2=,其中n=a+b+c+d.
参考数据:
P(K2≥k0) | 0.050 | 0.010 | 0.001 |
k0 | 3.841 | 6.635 | 10.828 |
解 (1)根据题中所给数据,得到如下列联表:
| 认为作业多 | 认为作业不多 | 总计 |
喜欢玩 电脑游戏 | 10 | 2 | 12 |
不喜欢玩 电脑游戏 | 3 | 7 | 10 |
总计 | 13 | 9 | 22 |
(2)K2=≈6.418,
∵3.841<6.418,
∴有95%的把握认为喜欢玩电脑游戏与认为作业多少有关.
4.2016年1月1日起全国统一实施全面两孩政策,为了解适龄民众对放开生育二胎政策的态度,某市选取70后和80后作为调查对象,随机调查了100位,得到数据如下表:
| 生二胎 | 不生二胎 | 合计 |
70后 | 30 | 15 | 45 |
80后 | 45 | 10 | 55 |
合计 | 75 | 25 | 100 |
(1)以这100个人的样本数据估计该市的总体数据,且以频率估计概率,若从该市70后公民中随机抽取3位,记其中生二胎的人数为X,求随机变量X的分布列和数学期望;
(2)根据调查的数据,是否有90%以上的把握认为“生二胎与年龄有关”,并说明理由.
参考公式:K2=,其中n=a+b+c+d
参考数据:
P(K2≥k) | 0.15 | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 |
k | 2.072 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 |
解 (1)由已知得70后“生二胎”的概率为,
并且X~B,
所以P(X=k)=Ck3-k(k=0,1,2,3),
其分布列如下:
X | 0 | 1 | 2 | 3 |
P |
所以E(X)=3×=2.
(2)K2=
=
=≈3.030>2.706,
所以有90%以上的把握认为“生二胎与年龄有关”.
5.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表:
时间 | 周一 | 周二 | 周三 | 周四 | 周五 |
车流量x(万辆) | 100 | 102 | 108 | 114 | 116 |
浓度y(微克/立方米) | 78 | 80 | 84 | 88 | 90 |
(1)根据上表数据,用最小二乘法求出y与x的线性回归方程;
(2)若周六同一时段车流量是200万辆,试根据(1)求出的线性回归方程,预测此时PM2.5的浓度为多少?
参考公式:=,=-·.
解 (1)由条件可知=i==108,
=i==84,
(xi-)(yi-)=(-8)×(-6)+(-6)×(-4)+0×0+6×4+8×6=144,
(xi-)2=(-8)2+(-6)2+02+62+82=200,
===0.72,
=-=84-0.72×108=6.24,
故y关于x的线性回归方程为=0.72x+6.24.
(2)当x=200时,=0.72×200+6.24=150.24.
所以可以预测此时PM2.5的浓度约为150.24微克/立方米.
6.某单位共有10名员工,他们某年的收入如下表:
员工编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
年薪(万元) | 3 | 3.5 | 4 | 5 | 5.5 | 6.5 | 7 | 7.5 | 8 | 50 |
(1)求该单位员工当年年薪的平均值和中位数;
(2)从该单位中任取2人,此2人中年薪高于5万的人数记为ξ,求ξ的分布列和期望;
(3)已知员工年薪与工作年限成正线性相关关系,若某员工工作第一年至第四年的年薪分别为3万元、4.2万元、5.6万元、7.2万元,预测该员工第五年的年薪为多少.
附:线性回归方程=x+中系数计算公式=,=-,其中,表示样本均值.
解 (1)平均值为10万元,中位数为6万元.
(2)年薪高于5万的有6人,低于或等于5万的有4人,所以从该单位中任取2人,此2人中年薪高于5万的人数记为ξ,ξ的可能取值为0,1,2.
P(ξ=0)==,P(ξ=1)==,
P(ξ=2)==,
所以ξ的分布列为:
ξ | 0 | 1 | 2 |
P |
E(ξ)=0×+1×+2×=.
(3)设xi,yi(i=1,2,3,4)分别表示工作年限及相应年薪,则=2.5,=5,
(xi-)2=2.25+0.25+0.25+2.25=5,
(xi-)(yi-)=-1.5×(-2)+(-0.5)×(-0.8)+0.5×0.6+1.5×2.2=7,
===1.4,
=-=5-1.4×2.5=1.5,
所以线性回归方程为=1.4x+1.5.
当x=5时,=8.5.
故可预测该员工第五年的年薪为8.5万元.
2018年高考考点完全题数学(理)考点通关练习题 第八章 概率与统计 66 word版含答案: 这是一份2018年高考考点完全题数学(理)考点通关练习题 第八章 概率与统计 66 word版含答案,共15页。试卷主要包含了基础小题,高考小题,模拟小题等内容,欢迎下载使用。
2018年高考考点完全题数学(理)考点通关练习题 第八章 概率与统计 61 word版含答案: 这是一份2018年高考考点完全题数学(理)考点通关练习题 第八章 概率与统计 61 word版含答案,共15页。试卷主要包含了基础小题,高考小题,模拟小题等内容,欢迎下载使用。
2018年高考考点完全题数学(理)考点通关练习题 第八章 概率与统计 57 word版含答案: 这是一份2018年高考考点完全题数学(理)考点通关练习题 第八章 概率与统计 57 word版含答案,共8页。试卷主要包含了基础小题,三行的字母只有1种排法.,模拟小题等内容,欢迎下载使用。