


2018年高考考点完全题数学(理)考点通关练习题 第八章 概率与统计 67 word版含答案
展开
这是一份2018年高考考点完全题数学(理)考点通关练习题 第八章 概率与统计 67 word版含答案,共16页。试卷主要包含了基础小题,高考小题,模拟小题等内容,欢迎下载使用。
考点测试67 变量间的相关关系与统计案例一、基础小题1.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是( )A.=-2x+100 B.=2x+100C.=-2x-100 D.=2x-100答案 A解析 B、D为正相关,C中值恒为负,不符合题意.2.某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元4235销售额y/万元49263954根据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( )A.63.6万元 B.65.5万元C.67.7万元 D.72.0万元答案 B 解析 ∵=-=-9.4×=9.1,∴回归方程为=9.4x+9.1.令x=6,得=9.4×6+9.1=65.5(万元).3.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不正确的是( )A.y与x具有正的线性相关关系B.回归直线过样本点的中心(,)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg答案 D解析 由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确.又线性回归方程必过样本点中心(,),因此B正确.由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故C正确.当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此D不正确.4.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )A.-1 B.0 C. D.1答案 D解析 样本点都在直线上时,其数据的估计值与真实值是相等的,即yi=i,代入相关系数公式r==1.5. 设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )A.直线l过点(,)B.x和y的相关系数为直线l的斜率C.x和y的相关系数在0到1之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同答案 A解析 因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以B、C错误;D中n为偶数时,分布在l两侧的样本点的个数可以不相同,所以D错误;根据线性回归直线一定经过样本点中心可知A正确.6.在一次对性别与说谎是否相关的调查中,得到如下数据: 说谎不说谎合计男6713女8917合计141630根据表中数据,得到如下结论中正确的一项是( )A.在此次调查中有95%的把握认为是否说谎与性别有关B.在此次调查中有99%的把握认为是否说谎与性别有关C.在此次调查中有99.5%的把握认为是否说谎与性别有关D.在此次调查中没有充分的证据显示说谎与性别有关答案 D解析 由于K2=≈0.0024,由于K2很小,因此,在此次调查中没有充分的证据显示说谎与性别有关.故选D.7. 如图所示,有5组(x,y)数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.答案 D解析 由散点图知呈带状区域时有较强的线性相关关系,故去掉D.8.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示: 又发作过心脏病未发作过心脏病合计心脏搭桥手术39157196血管清障手术29167196合计68324392试根据上述数据计算K2=________.根据表中所给的数据,能否在犯错误的概率不超过0.15的前提下认为这两种手术对病人又发作过心脏病的影响有差别?________________________________________________________________________.答案 1.779 不能作出这两种手术对病人又发作心脏病的影响有差别的结论解析 根据列联表中的数据,可以求得K2=≈1.779,而K2<2.072,所以我们不能在犯错误的概率不超过0.15的前提下,作出这两种手术对病人又发作心脏病的影响有差别的结论.二、高考小题9.根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关答案 D解析 由柱形图,知2006年以来我国二氧化硫年排放量呈减少趋势,故其排放量与年份负相关,故D错误.10.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为( )A.11.4万元 B.11.8万元C.12.0万元 D.12.2万元答案 B解析 ∵==10,==8,∴=-0.76=8-0.76×10=0.4,∴=0.76x+0.4.当x=15时,=0.76×15+0.4=11.8.11.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1 成绩性别 不及格及格总计男61420女102232总计163652 表2 视力性别 好差总计男41620女122032总计163652 表3 智商性别 偏高正常总计男81220女82432总计163652 表4 阅读量性别 丰富不丰富总计男14620女23032总计163652 A.成绩 B.视力 C.智商 D.阅读量答案 D解析 根据K2=,代入题中数据计算得表1:K2=≈0.009;表2:K2=≈1.769;表3:K2=≈1.3;表4:K2=≈23.48.∵D选项K2最大,∴阅读量与性别有关联的可能性最大,故选D.12.根据如下样本数据x345678y4.02.5-0.50.5-2.0-3.0得到的回归方程为=bx+a,则( )A.a>0,b>0 B.a>0,b<0C.a<0,b>0 D.a<0,b<0答案 B解析 把样本数据中的x,y分别当作点的横、纵坐标,在平面直角坐标系xOy中作出散点图,由图可知b<0,a>0.故选B.13.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能是( )A.=0.4x+2.3 B.=2x-2.4C.=-2x+9.5 D.=-0.3x+4.4答案 A解析 由变量x与y正相关知C、D均错,又回归直线经过样本中心(3,3.5),代入验证得A正确,B错误.故选A.三、模拟小题14.已知x,y的取值如表所示:x234y645如果y与x线性相关,且线性回归方程为=x+,则的值为( )A.- B. C.- D.答案 A解析 将=3,=5代入到=x+中,得=-.故选A.15.对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i=1,2,…,8),其回归直线方程是=x+,且x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=6,则实数的值是( )A. B. C. D.答案 B解析 依题意可知样本中心点为,则=×+a,解得=.16.下列说法错误的是( )A.在回归模型中,预报变量y的值不能由解释变量x唯一确定B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好答案 B解析 对于A,在回归模型中,预报变量y的值由解释变量x和随机误差e共同确定,即x只能解释部分y的变化,∴A正确;对于B,线性回归分析中,相关系数r的绝对值越接近1,两个变量的线性相关性越强,反之,线性相关性越弱,∴B错误;对于C,在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,C正确;对于D,在回归分析中,用相关指数R2来刻画回归的效果时,R2取值越大,说明模型拟合的效果越好,∴R2为0.98的模型比R2为0.80的模型拟合的效果好,D正确.故选B.17.为了检验某套眼保健操预防学生近视的作用,把500名做该套眼保健操的学生与另外500名未做该套眼保健操的学生的视力情况作记录并比较,提出假设H0:“这套眼保健操不能起到预防近视的作用”,利用2×2列联表计算所得的K2≈3.918.经查对临界值表知P(K2≥3.841)≈0.05.对此,四名同学得出了以下结论:①有95%的把握认为“这套眼保健操能起到预防近视的作用”;②若某人未做该套眼保健操,那么他有95%的可能得近视;③这套眼保健操预防近视的有效率为95%;④这套眼保健操预防近视的有效率为5%.其中所有正确结论的序号是________.答案 ①解析 根据查对临界值表知P(K2≥3.841)≈0.05,故有95%的把握认为“这套眼保健操能起到预防近视的作用”,即①正确;95%仅是指“这套眼保健操能起到预防近视的作用”的可信程度,所以②③④错误.18.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,计算得i=80,i=20,iyi=184,=720.已知家庭的月储蓄y关于月收入x的线性回归方程为=x+,则变量x与y________(填“正相关”或“负相关”);若该居民区某家庭月收入为7千元,预测该家庭的月储蓄是________千元.答案 正相关 1.7解析 由题意,知n=10,=i=8,=i=2,∴==0.3,=2-0.3×8=-0.4,∴=0.3x-0.4,∵0.3>0,∴变量x与y正相关.当x=7时,=0.3×7-0.4=1.7(千元).一、高考大题1.下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:yi=9.32,tiyi=40.17, =0.55,≈2.646.参考公式:相关系数r=,回归方程=+t中斜率和截距的最小二乘估计公式分别为:=,=- .解 (1)由折线图中数据和附注中参考数据得=4, (ti-)2=28, =0.55, (ti-)(yi-)=tiyi-yi=40.17-4×9.32=2.89,r≈≈0.99.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.(2)由=≈1.331及(1)得==≈0.103,=-=1.331-0.103×4≈0.92.所以y关于t的回归方程为=0.92+0.10t.将2016年对应的t=9代入回归方程得=0.92+0.10×9=1.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.2.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值. (xi-)2 (wi-)2 (xi-)(yi-) (wi-)(yi-)46.65636.8289.81.61469108.8 表中wi=,=wi.(1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:①年宣传费x=49时,年销售量及年利润的预报值是多少?②年宣传费x为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为=,=- .解 (1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.(2) 令w=,先建立y关于w的线性回归方程.由于===68,=-=563-68×6.8=100.6,所以y关于w的线性回归方程为=100.6+68w,因此y关于x的回归方程为=100.6+68.(3)①由(2),知当x=49时,年销售量y的预报值=100.6+68=576.6,年利润z的预报值=576.6×0.2-49=66.32.②根据(2)的结果,知年利润z的预报值=0.2×(100.6+68)-x=-x+13.6+20.12,所以当==6.8,即x=46.24时,取得最大值,故年宣传费为46.24千元时,年利润的预报值最大.二、模拟大题3.班主任对班级22名学生进行了作业量多少的调查,数据如下:在喜欢玩电脑游戏的12人中,有10人认为作业多,2人认为作业不多;在不喜欢玩电脑游戏的10人中,有3人认为作业多,7人认为作业不多.(1)根据以上数据建立一个2×2列联表;(2)试问喜欢玩电脑游戏与认为作业多少是否有关系.参考公式:K2=,其中n=a+b+c+d.参考数据:P(K2≥k0)0.0500.0100.001k03.8416.63510.828解 (1)根据题中所给数据,得到如下列联表: 认为作业多认为作业不多总计喜欢玩电脑游戏10212不喜欢玩电脑游戏3710总计13922 (2)K2=≈6.418,∵3.841<6.418,∴有95%的把握认为喜欢玩电脑游戏与认为作业多少有关.4.2016年1月1日起全国统一实施全面两孩政策,为了解适龄民众对放开生育二胎政策的态度,某市选取70后和80后作为调查对象,随机调查了100位,得到数据如下表: 生二胎不生二胎合计70后30154580后451055合计7525100(1)以这100个人的样本数据估计该市的总体数据,且以频率估计概率,若从该市70后公民中随机抽取3位,记其中生二胎的人数为X,求随机变量X的分布列和数学期望;(2)根据调查的数据,是否有90%以上的把握认为“生二胎与年龄有关”,并说明理由.参考公式:K2=,其中n=a+b+c+d参考数据:P(K2≥k)0.150.100.050.0250.0100.005k2.0722.7063.8415.0246.6357.879解 (1)由已知得70后“生二胎”的概率为,并且X~B,所以P(X=k)=Ck3-k(k=0,1,2,3),其分布列如下:X0123P所以E(X)=3×=2.(2)K2===≈3.030>2.706,所以有90%以上的把握认为“生二胎与年龄有关”.5.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表:时间周一周二周三周四周五车流量x(万辆)100102108114116浓度y(微克/立方米)7880848890(1)根据上表数据,用最小二乘法求出y与x的线性回归方程;(2)若周六同一时段车流量是200万辆,试根据(1)求出的线性回归方程,预测此时PM2.5的浓度为多少?参考公式:=,=-·.解 (1)由条件可知=i==108,=i==84,(xi-)(yi-)=(-8)×(-6)+(-6)×(-4)+0×0+6×4+8×6=144,(xi-)2=(-8)2+(-6)2+02+62+82=200,===0.72,=-=84-0.72×108=6.24,故y关于x的线性回归方程为=0.72x+6.24.(2)当x=200时,=0.72×200+6.24=150.24.所以可以预测此时PM2.5的浓度约为150.24微克/立方米.6.某单位共有10名员工,他们某年的收入如下表: 员工编号12345678910年薪(万元)33.5455.56.577.5850(1)求该单位员工当年年薪的平均值和中位数;(2)从该单位中任取2人,此2人中年薪高于5万的人数记为ξ,求ξ的分布列和期望;(3)已知员工年薪与工作年限成正线性相关关系,若某员工工作第一年至第四年的年薪分别为3万元、4.2万元、5.6万元、7.2万元,预测该员工第五年的年薪为多少.附:线性回归方程=x+中系数计算公式=,=-,其中,表示样本均值.解 (1)平均值为10万元,中位数为6万元.(2)年薪高于5万的有6人,低于或等于5万的有4人,所以从该单位中任取2人,此2人中年薪高于5万的人数记为ξ,ξ的可能取值为0,1,2.P(ξ=0)==,P(ξ=1)==,P(ξ=2)==,所以ξ的分布列为:ξ012PE(ξ)=0×+1×+2×=.(3)设xi,yi(i=1,2,3,4)分别表示工作年限及相应年薪,则=2.5,=5,(xi-)2=2.25+0.25+0.25+2.25=5,(xi-)(yi-)=-1.5×(-2)+(-0.5)×(-0.8)+0.5×0.6+1.5×2.2=7,===1.4,=-=5-1.4×2.5=1.5,所以线性回归方程为=1.4x+1.5.当x=5时,=8.5.故可预测该员工第五年的年薪为8.5万元.
相关试卷
这是一份2018年高考考点完全题数学(理)考点通关练习题 第八章 概率与统计 66 word版含答案,共15页。试卷主要包含了基础小题,高考小题,模拟小题等内容,欢迎下载使用。
这是一份2018年高考考点完全题数学(理)考点通关练习题 第八章 概率与统计 61 word版含答案,共15页。试卷主要包含了基础小题,高考小题,模拟小题等内容,欢迎下载使用。
这是一份2018年高考考点完全题数学(理)考点通关练习题 第八章 概率与统计 57 word版含答案,共8页。试卷主要包含了基础小题,三行的字母只有1种排法.,模拟小题等内容,欢迎下载使用。