所属成套资源:人教版新课标A数学选修1-2:同步练习
数学选修1-2第一章 统计案例综合与测试课后练习题
展开
这是一份数学选修1-2第一章 统计案例综合与测试课后练习题,共14页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
www.ks5u.com阶段质量检测(一) 一、选择题(本大题共10小题,每小题5分,共50分)1.对于自变量x和因变量y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫做( )A.函数关系 B.线性关系C.相关关系 D.回归关系解析:选C 由相关关系的概念可知,C正确.2.在一线性回归模型中,计算其相关指数R2=0.96,下面哪种说法不够妥当( )A.该线性回归方程的拟合效果较好B.解释变量对于预报变量变化的贡献率约为96%C.随机误差对预报变量的影响约占4%D.有96%的样本点在回归直线上解析:选D 由相关指数R2表示的意义可知A、B、C三种说法都很妥当,相关指数R2=0.96,其值较大,说明残差平方和较小,绝大部分样本点分布在回归直线附近,不一定有96%的样本点在回归直线上,故选D.3.(湖北高考改编)根据如下样本数据得到的回归方程为=x+,则( )x345678y4.02.5-0.50.5-2.0-3.0A.>0,<0 B.>0,>0C.<0,<0 D.<0,>0解析:选A 作出散点图如下:观察图象可知,回归直线=x+的斜率<0,当x=0时,=>0,故>0,<0. 4.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x1234用水量y4.5432.5 由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程是=-0.7x+,则=( )A.10.5 B.5.15C.5.2 D.5.25解析:选D 样本点的中心为(2.5,3.5),将其代入线性回归方程可解得=5.25.5.下面的等高条形图可以说明的问题是( )A.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的B.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同C.此等高条形图看不出两种手术有什么不同的地方D.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的把握解析:选D 由等高条形图可知选项D正确.6.根据一位母亲记录儿子3~9岁的身高数据,建立儿子身高(单位:cm)对年龄(单位:岁)的线性回归方程为=7.19x+73.93,若用此方程预测儿子10岁时的身高,有关叙述正确的是( )A.身高一定为145.83 cmB.身高大于145.83 cmC.身高小于145.83 cmD.身高在145.83 cm左右解析:选D 用线性回归方程预测的不是精确值,而是估计值.当x=10时,y=145.83,只能说身高在145.83 cm左右.7.在2×2列联表中,下列哪两个比值相差越大,两个分类变量有关系的可能性就越大( )A.与 B.与C.与 D.与解析:选A 当ad与bc相差越大,两个分类变量有关系的可能性越大,此时与相差越大.8.如图,5个(x,y)数据,去掉D(3,10)后,下列说法错误的是( )A.相关系数r变大B.残差平方和变大C.相关指数R2变大D.解释变量x与预报变量y的相关性变强解析:选B 由散点图知,去掉D后,x与y的相关性变强,且为正相关,所以r变大,R2变大,残差平方和变小.9.已知变量x,y之间具有线性相关关系,其回归方程为=-3+x,若i=17,i=4,则的值为( )A.2 B.1C.-2 D.-1解析:选A 依题意知,==1.7,==0.4,而直线=-3+x一定经过点(,),所以-3+×1.7=0.4,解得=2.10.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于97.5%,则c等于( )A.3 B.4C.5 D.6解析:选A 列2×2列联表如下: x1x2总计y1102131y2cd35总计10+c21+d66故K2的观测值k=≥5.024.把选项A、B、C、D代入验证可知选A.二、填空题(本大题共4小题,每小题5分,共20分)11.给出下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系;⑤学生与他(她)的学号之间的关系.其中有相关关系的是________(填序号).解析:利用相关关系的概念判断.①是不确定关系.②曲线上的点与该点坐标是一种对应关系,即每一个点对应一个坐标,是确定关系.⑤学生与其学号也是确定的对应关系.答案:①③④12.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线方程是________.解析:设回归直线的方程为=x+.回归直线的斜率的估计值是1.23,即=1.23.又回归直线过样本点的中心(4,5),所以5=1.23×4+,解得=0.08,故回归直线的方程为=1.23x+0.08.答案:=1.23x+0.0813.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表.由表中数据得线性回归方程=x+,其中=-2.现预测当气温为-4℃时,用电量的度数约为________. 用电量y/度24343864气温x/℃181310-1解析:由题意可知=×(18+13+10-1)=10,=×(24+34+38+64)=40,=-2.又回归直线=-2x+过点(10,40),故=60,所以当x=-4时,=-2×(-4)+60=68.答案:6814.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得k≈3.918,经查对临界值表P(K2≥3.841)≈0.05.对此,四名同学做出了以下的判断:p:有95%的把握认为“这种血清能起到预防感冒的作用”;q:若某人未使用该血清,那么他在一年中有95%的可能性得感冒;r:这种血清预防感冒的有效率为95%;s:这种血清预防感冒的有效率为5%.则下列命题中,正确的是________(填序号).①p∧(綈q); ②(綈p)∧q;③(綈p∧綈q)∧(r∨s); ④(p∨綈r)∧(綈q∨s).解析:查对临界值表知P(K2≥3.841)≈0.05,故有95%的把握认为“这种血清能起到预防感冒的作用”;95%仅是指“血清能起到预防感冒的作用”的可信程度,但也有“在100个使用血清的人中一个患感冒的人也没有”的可能,故p真,其余都假.结合复合命题的真假可知,选①④.答案:①④三、解答题(本大题共4小题,共50分.解答时应写出文字说明、证明过程或演算步骤)15.(本小题满分12分)某地区在调查一种传染病与饮用水的关系时得到如下数据:饮用干净水得病5人,不得病50人;饮用不干净水得病9人,不得病22人.画出列联表,并说明能否在犯错误的概率不超过0.10的前提下认为这种疾病与饮用水有关.解:依题意得2×2列联表: 得病不得病合计干净水55055不干净水92231总计147286此时,由题中数据可得K2的观测值k=≈5.785,由于5.785>2.706,故在犯错误的概率不超过0.10的前提下认为这种传染病与饮用不干净水有关系.16.(本小题满分12分)某同学6次考试的数学、语文成绩在班中的排名x,y如下表:x765321y13119642 对上述数据用线性回归方程=x+来拟合y与x之间的关系.解:由于=4,=7.5,(xi-)(yi-)=50,(xi-)2=28,那么==≈1.786,=-=7.5-1.786×4=0.356.此时可得=1.786x+0.356.17.(本小题满分12分)有两个分类变量x与y,其一组观测值如下面的2×2列联表所示: y1y2x1a20-ax215-a30+a 其中a,15-a均为大于5的整数,则a取何值时,在犯错误的概率不超过0.1的前提下认为x与y之间有关系?解:查表可知,要使在犯错误的概率不超过0.1的前提下认为x与y之间有关系,则k≥2.706,而k===.由k≥2.706得a≥7.19或a≤2.04.又a>5且15-a>5,a∈Z,即a=8或9, 故a为8或9时,在犯错误的概率不超过0.1的前提下认为x与y之间有关系.18.(本小题满分14分)在关于人的脂肪含量(百分比)和年龄的关系的研究中,研究人员获得了一组数据如下表:年龄x23273941454950脂肪 含量y9.517.821.225.927.526.328.2年龄x53545657586061脂肪 含量y29.630.231.430.833.535.234.6(1)作出散点图,并判断y与x是否线性相关,若线性相关,求线性回归方程;(2)求相关指数R2,并说明其含义;(3)给出37岁时人的脂肪含量的预测值.解:(1)散点图如图所示.由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系.设线性回归方程为=x+,则由计算器算得≈0.576,≈-0.448,所以线性回归方程为=0.576x-0.448.(2)残差平方和: = (yi-i)2≈37.20,总偏差平方和: (yi-)2≈644.99,R2=1-≈0.942,表明年龄解释了94.2%的脂肪含量变化.(3)当x=37时,=0.576×37-0.448≈20.9,故37岁时人的脂肪含量约为20.9%.
(时间90分钟,满分120分)一、选择题(本大题共10小题,每小题5分,共50分)1.在画两个变量的散点图时,下面叙述正确的是( )A.预报变量在x轴上,解释变量在y轴上B.解释变量在x轴上,预报变量在y轴上C.可以选择两个变量中任意一个变量在x轴上D.可以选择两个变量中任意一个变量在y轴上解析:选B 在散点图中,预报变量在y轴上,解释变量在x轴上.2.在回归分析中,残差图中的纵坐标为( )A.残差 B.样本编号 C. D.(n)解析:选A 残差是真实值与预报值的差,残差分析就是对这些残差画出残差图进行分析,在残差图中,横坐标代表编号,纵坐标代表残差.3.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是( )x45678910y14181920232528A.线性函数模型 B.二次函数模型C.指数函数模型 D.对数函数模型解析:选A 画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.4.利用独立性检验来考虑两个分类变量X与Y是否有关系时,通过查阅下表来确定“X和Y有关系”的可信度.如果k>5.024,那么就有把握认为“X和Y有关系”的百分比为( )P(K2>k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828A.25% B.95%C.5% D.97.5%解析:选D ∵k>5.024,而在观测值表中对应于5.024的是0.025,∴有1-0.025=97.5%的把握认为“X和Y有关系”,故选D.5.如图所示,图中有5组数据,去掉________(填字母代号)组数据后,剩下的4组数据的线性相关性最大 ( )A.E B.CC.D D.A解析:选A ∵A,B,C,D四点分布在一条直线附近且贴近某一直线,E点离得远,∴去掉E点剩下的4组数据的线性相关性最大.故答案为A.6.在一次实验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的回归直线方程为( )A.=2x+1 B.=x+2C.=x+1 D.=x-1解析:选C ∵==2.5,==3.5,∴这组数据的样本中心点是(2.5,3.5),把样本中心点代入四个选项中,只有=x+1成立,故选C.7.为判定喜欢黑色的人是否易患抑郁症,对91名大学生进行调查,得到如下2×2列联表: 患抑郁症未患抑郁症合计喜欢黑色153247不喜欢黑色143044合计296291附表:P(K2≥k0)0.0500.0100.001k03.8416.63510.828则下列说法正确的是( )A.在犯错误的概率不超过0.01的前提下认为喜欢黑色与患抑郁症有关系B.在犯错误的概率不超过0.05的前提下认为喜欢黑色与患抑郁症有关系C.在犯错误的概率不超过0.1的前提下认为喜欢黑色与患抑郁症有关系D.不能认为喜欢黑色与患抑郁症有关系解析:选D 经计算K2≈9.8×10-5≤3.841,故没有理由认为喜欢黑色与患抑郁症有关.8.为了评价某个电视栏目改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算得K2≈0.99.根据这一数据分析,下列说法正确的是 ( )A.有99%的人认为该栏目优秀B.有99%的人认为该栏目是否优秀与改革无关C.有99%的把握认为该栏目是否优秀与改革有关系D.没有充分理由认为该栏目是否优秀与改革有关系解析:选D 只有K2>6.635才能有99%的把握认为该栏目是否优秀与改革有关系,而即使K2>6.635也只是对“该栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论.故选D.9.若残差平方和是325,总偏差平方和是923,则随机误差对预报变量变化的贡献率为( )A.64.8% B.60%C.35.2% D.40%解析:选C 相关指数R2表示解释变量对预报变量变化的贡献率,故随机误差对预报变量变化的贡献率为×100%=×100%≈35.2%.10.下面是调查某地区男、女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图可以看出( )A.性别与喜欢理科无关B.女生中喜欢理科的百分比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的百分比为60%解析:选C 由等高条形图可知,女生中喜欢理科的百分比约为1-0.8=0.2=20%,男生中喜欢理科的百分比约为1-0.4=0.6=60%,因此男生比女生喜欢理科的可能性大些.二、填空题(本大题共4小题,每小题5分,共20分)11.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:以x+1代x,得=0.254(x+1)+0.321,与=0.254x+0.321相减可得,年饮食支出平均增加0.254万元.答案:0.25412.在线性回归方程y=a+bx中,b为回归系数,下列关于b的说法中正确的是________(填序号).①b为回归直线的斜率;②b>0,表示随x增加,y值增加,b<0,表示随x增加,y值减少;③b是唯一确定的值;④回归系数b的统计意义是当x每增加(或减少)一个单位,y平均改变b个单位.解析:b是由总体的一个样本,利用一定的方法得到的,选择不同的样本或不同的计算方法得到的b是不同的,故③错.答案:①②④13.独立性检验显示:有90%的把握认为性别与是否喜爱喝酒有关.下列说法中正确的是________(填序号).①在100个男性中约有90个人爱喝酒;②如果某人爱喝酒,那么此人为男性的可能性为90%;③认为性别与是否喜爱喝酒有关判断出错的可能性为10%;④有90%的把握认为10个男性中有9个人爱喝酒.解析:根据独立性检验的概念可知③正确,其他说法均错误.答案:③14.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程=3-5x,变量x增加1个单位时,y平均增加5个单位;③线性回归方程=x+必过(,);④在一个2×2列联表中,由计算得K2=13.079,则在犯错误的概率不超过0.001的前提下认为这两个变量间有关系.其中错误的个数是________.本题可以参考独立性检验临界值表:P(K2≥k0)0.50.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828解析:①将一组数据中的每个数据都加上或减去同一个常数后,因为D(X+b)=D(X),其稳定性不变,所以方差恒不变;②设有一个回归方程=3-5x,变量x增加1个单位时,y平均减少5个单位,而不是增加5个单位;③线性回归方程=x+必过(,);④在一个2×2列联表中,由计算得K2=13.079,13.079>10.828,且P(K2>10.828)=0.001,所以在犯错误的概率不超过0.001的前提下认为这两个变量间有关系.因此,①③④正确,②错误,故只有1个错误的说法.答案:1三、解答题(本大题共4小题,共50分.解答时应写出文字说明、证明过程或演算步骤)15. (本小题满分12分)在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外的27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外的33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2列联表;(2)能否在犯错误的概率不超过0.025的前提下认为性别与休闲方式有关系?解:(1)2×2列联表为: 看电视运动总计女432770男213354总计6460124(2)由列联表中的数据,计算K2的观测值k=≈6.201.因为6.201>5.024,因此在犯错误的概率不超过0.025的前提下认为性别与休闲方式有关系.16.(本小题满分12分)某种产品的广告费用支出x万元与销售额y万元之间有如下的对应数据:x24568y2030505070(1)根据上表提供的数据,求出y关于x的回归直线方程;(2)据此估计广告费用为10万元时所得的销售收入.(x=145,xiyi=1 270)解:(1)==5,==44,===8.5,=-=44-8.5×5=1.5,∴回归直线方程为=8.5x+1.5.(2)当x=10时,预报y的值为=8.5×10+1.5=86.5(万元).所以所得的销售收入约为86.5万元.17.(本小题满分12分)某高校共有学生15 000人,其中男生10 500人,女生4 500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率. (3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别的列联表,并判断能否在犯错误的概率不超过0.05的前提下认为“该校学生的每周平均体育运动时间与性别有关”.附: K2=P(K2≥k0)0.100.050.0100.005k02.7063.8416.6357.879解:(1)300×=90,所以应收集90位女生的样本数据.(2)由频率分布直方图得1-2×(0.100+0.025)=0.75,所以估计该校学生每周平均体育运动时间超过4小时的概率为0.75.(3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的.所以每周平均体育运动时间与性别的列联表如下:每周平均体育运动时间与性别的列联表 男生女生总计每周平均体育运动时间不超过4小时453075每周平均体育运动时间超过4小时16560225总计21090300结合列联表可算得K2的观测值k==≈4.762>3.841.所以在犯错误的概率不超过0.05的前提下认为“该校学生的每周平均体育运动时间与性别有关”.18.(本小题满分14分)以下资料是一位销售经理收集到的年销售额y(千元)和销售经验x(年)的关系:销售经验x/年13446810101113年销售额y/千元809792102103111119123117136(1)根据这些数据画出散点图并作直线=78+4.2x,计算 (yi-i)2;(2)依据这些数据求回归直线方程并据此计算 (yi-i)2;(3)比较(1)(2)中的残差平方和 (yi-i)2的大小.解:(1)散点图与直线=78+4.2x的图形如图,对x=1,3,…,13,有i=82.2,90.6,94.8,94.8,103.2,111.6,120,120,124.2,132.6, (yi-i)2=179.28.(2)=xi=7,xiyi=8 128,x=632,=yi=108,∴=4,=-=108-4×7=80,故=80+4x,对x=1,3,…,13,有i=84,92,96,96,104,112,120,120,124,132, (yi-i)2=170.(3)比较可知,(2)中求出的 (yi-i)2较小.
相关试卷
这是一份高中数学人教版新课标A选修4-1一 圆周角定理课后练习题,共9页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
这是一份2020-2021学年一 圆周角定理达标测试,共8页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
这是一份高中数学第四章 框图综合与测试课时作业,共15页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。