2023年新教材高考数学一轮复习课时规范练47统计模型含解析新人教B版
展开课时规范练47 统计模型
基础巩固组
1.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )
A.r2<r4<0<r3<r1
B.r4<r2<0<r1<r3
C.r4<r2<0<r3<r1
D.r2<r4<0<r1<r3
2.有一组数据统计了2013年至2020年中国高铁每年的运营里程,它反映了中国高铁近几年的飞速发展,甲同学用一元线性回归模型y=bx+a来拟合,并算得相关系数r1=0.70,乙同学用指数函数模型y=cedx来拟合,并算得转化为回归直线方程所对应的相关系数r2=0.99,则 ( )
A.一元线性回归模型拟合效果更好
B.指数函数模型拟合效果更好
C.两种模型拟合效果都不好
D.不能确定哪个模型拟合效果更好
3.根据如下样本数据:
x | 3 | 4 | 5 | 6 | 7 | 8 |
y | 4.0 | 2.5 | -0.5 | 0.5 | -2.0 | -3.0 |
得到的回归直线方程为x+,则( )
A.>0,<0 B.>0,>0
C.<0,<0 D.<0,>0
4.为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”,得到如下的列联表:
性别 | 做不到“光盘” | 能做到“光盘” |
男 | 45 | 10 |
女 | 30 | 15 |
附:
α=P(χ2≥k) | 0.10 | 0.05 | 0.025 |
k | 2.706 | 3.841 | 5.024 |
χ2=,n=a+b+c+d.
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过1%的前提下认为“该市居民能否做到‘光盘’与性别有关”
B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”
C.有90%的把握认为“该市居民能否做到‘光盘’与性别有关”
D.有90%的把握认为“该市居民能否做到‘光盘’与性别无关”
5.(2021安徽合肥一模)某商场2020年部分月份销售金额如下表:
月份x | 2 | 4 | 6 | 8 | 10 |
销售金额y/万元 | 64 | 132 | a | 286 | 368 |
若用最小二乘法求得回归直线方程为=38.1x-17.6,则a=( )
A.198.2 B.205
C.211 D.213.5
6.(多选)给出以下四个说法,其中正确的说法是( )
A.残差分布的带状区域的宽度越窄,R2越小
B.在刻画模型的拟合效果时,R2越大,说明拟合的效果越好
C.在回归直线方程=0.2x+12中,当解释变量x每增加一个单位时,响应变量平均增加0.2个单位
D.对分类变量X与Y,若它们的随机变量χ2的取值越小,则推断X与Y有关联时犯错误的概率越小
7.(多选)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如图所示的列联表.经计算χ2≈4.762,则可以推断出( )
性别 | 满意 | 不满意 |
男 | 30 | 20 |
女 | 40 | 10 |
α=P(χ2≥k) | 0.10 | 0.05 | 0.01 |
k | 2.706 | 3.841 | 6.635 |
A.该学校男生对食堂服务满意的概率的估计值为
B.调研结果显示,该学校男生比女生对食堂服务更满意
C.有95%的把握认为男、女生对该食堂服务的评价有差异
D.有99%的把握认为男、女生对该食堂服务的评价有差异
8.已知变量y与x线性相关,若=5,=50,且y关于x的回归直线的斜率为6.5,则y关于x的回归直线方程是 .
综合提升组
9.某校团委对“学生性别和喜欢某热门软件是否有关联”进行了一次调查,其中被调查的女生人数是男生人数的,男生喜欢该软件的人数占男生人数的,女生喜欢该软件的人数占女生人数的.若有95%的把握认为是否喜欢该软件和性别有关,则男生至少有( )
α=P(χ2≥k) | 0.05 | 0.01 |
k | 3.841 | 6.635 |
A.12人
B.6人
C.10人
D.18人
10.(多选)(2021河北衡水月考)下图是某小区2019年12月至2020年12月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码1~13分别对应2019年12月~2020年12月)
根据散点图选择y=a+b和y=c+dln x两个模型进行拟合,经过数据处理得到的两个回归方程分别为=0.936 9+0.028 5=0.955 4+0.030 6ln x,并得到以下一些统计量的值:
回归直线方程 | =0.936 9+0.028 5 | =0.955 4+0.030 6ln x |
R2 | 0.923 | 0.973 |
则下列说法正确的是( )
(注:是样本数据中x的平均数,是样本数据中y的平均数)
A.当月在售二手房均价y与月份代码x负相关
B.由=0.936 9+0.028 5预测2021年3月在售二手房均价约为1.050 9万元/平方米
C.曲线=0.936 9+0.028 5=0.955 4+0.030 6ln x都经过点()
D.模型=0.955 4+0.030 6ln x的拟合效果比模型=0.936 9+0.028 5的好
11.(多选)某校计划在课外活动中新增攀岩项目,为了解学生喜欢攀岩和性别是否有关联,面向学生开展了一次随机调查,其中参加调查的男生、女生人数相同,并绘制如下等高堆积条形图,则( )
参考公式:χ2=,n=a+b+c+d
α=P(χ2≥k) | 0.05 | 0.01 |
k | 3.841 | 6.635 |
A.参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多
B.参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多
C.若参与调查的男女生人数均为100人,则有99%把握认为喜欢攀岩和性别有关
D.无论参与调查的男女生人数为多少,都有99%的把握认为喜欢攀岩和性别有关
12.蟋蟀鸣叫的频率y(单位:次/分钟)与气温x(单位:℃)存在着较强的线性相关关系.某地研究人员根据当地的气温和蟋蟀鸣叫的频率得到了如下数据:
x/℃ | 21 | 22 | 23 | 24 | 25 | 26 | 27 |
y/(次/分钟) | 24 | 28 | 31 | 39 | 43 | 47 | 54 |
利用上表中的数据求得回归直线方程为x+,若利用该方程知,当该地的气温为30 ℃时,蟋蟀每分钟鸣叫次数的预测值为68,则的值为 .
13.某公司为了解某产品的研发费x(单位:万元)对销售量v(单位:百件)的影响,收集了该公司以往的5组数据,发现用模型y=aekx(e为自然对数的底数)拟合比较合适.令z=ln y得到z=bx+4.06.经计算,x,z对应的数据如表所示:
x | 5 | 8 | 12 | 15 | 20 |
z=lny | 4.5 | 5.2 | 5.5 | 5.8 | 6.5 |
则aek= .
14.(2021全国甲,理17)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
产品质量 | 一级品 | 二级品 | 总计 |
甲机床 | 150 | 50 | 200 |
乙机床 | 120 | 80 | 200 |
总计 | 270 | 130 | 400 |
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
附:χ2=.
α=P(χ2≥k) | 0.05 | 0.01 | 0.001 |
k | 3.841 | 6.635 | 10.828 |
创新应用组
15.BMI指数是用体重公斤数除以身高米数的平方得出的数字,是国际上常用的衡量人体胖瘦程度以及是否健康的一个标准.对于高中男体育特长生而言,当BMI数值大于或等于20.5时,我们说体重较重,当BMI数值小于20.5时,我们说体重较轻,身高大于或等于170 cm我们说身高较高,身高小于170 cm我们说身高较矮.
(1)已知某高中共有32名男体育特长生,其身高与BMI指数的数据如散点图所示,请根据所得信息,完成下述列联表,并判断是否有95%的把握认为男体育特长生的身高对BMI指数有影响.
体重情况 | 身高较矮 | 身高较高 | 总计 |
体重较轻 |
|
|
|
体重较重 |
|
|
|
总计 |
|
|
|
(2)①从上述32名男体育特长生中随机选取8名,其身高和体重的数据如表所示:
编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
身高x/cm | 166 | 167 | 160 | 173 | 178 | 169 | 158 | 173 |
体重y/kg | 57 | 58 | 53 | 61 | 66 | 57 | 50 | 66 |
利用最小二乘法求得回归直线方程为=0.8x-75.9.利用已经求得的回归直线方程,请完善下列残差表,并求R2(保留两位有效数字).
编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
体重y/kg | 57 | 58 | 53 | 61 | 66 | 57 | 50 | 66 |
残差/kg | 0.1 | 0.3 | 0.9 | -1.5 | -0.5 | -2.3 | -0.5 |
|
②通过残差分析,对于残差的绝对值最大的那组数据,需要确认在数据的采集中是否有人为的错误,已知通过重新采集发现,该组数据的体重应该为58 kg.小明重新根据最小二乘法算出=0.675x+,请在小明所算的基础上求出男体育特长生的身高与体重的回归直线方程.
参考数据:
(0.1)2+(0.3)2+(0.9)2+(-1.5)2+(-0.5)2+(-2.3)2+(-0.5)2=8.95,=168,
=226,0.675×168=113.4.
参考公式:R2=1-=yi-xi-,χ2=,n=a+b+c+d.
α=P(χ2≥k) | 0.10 | 0.05 | 0.01 | 0.005 |
k | 2.706 | 3.841 | 6.635 | 7.879 |
课时规范练47 统计模型
1.A 解析:由给出的四组数据的散点图可以看出,r1,r3大于0,r2,r4小于0,
题图1和题图2的点相对更加集中,所以r1接近于1,r2接近于-1,
由此可得r2<r4<0<r3<r1.
故选A.
2.B 解析:因为相关系数的绝对值越接近1拟合效果越好,
由题意得r2的绝对值更接近1,
所以指数函数模型拟合效果更好.
故选B.
3.A 解析:由图表中的数据可得,变量y随着x的增大而减小,则<0.
=5.5,
=0.25.
又回归直线方程为x+,且经过点(5.5,0.25),可得>0,
故选A.
4.C 解析:由题意可知χ2=≈3.03.又因为查表可得P(χ2≥2.706)=0.1,由于3.03>2.706,所以有90%的把握认为“该市居民能否做到‘光盘’与性别有关”.故选C.
5.B 解析:由表格数据知=6,,则=38.1×6-17.6,解得a=205.故选B.
6.BC 解析:回归分析时,残差图中残差分布的带状区域的宽度越窄,说明拟合精度越高,R2越大,故A错误;R2来刻画模型的拟合效果,R2越大,说明模型的拟合效果越好,故B正确;在回归直线方程=0.2x+12中,当解释变量x每增加一个单位时,响应变量平均增加0.2个单位,故C正确;对分类变量X与Y,它们的随机变量χ2的取值越小,推断X与Y有关时犯错误的概率越大,故D错误.故选BC.
7.AC 解析:对于选项A,该学校男生对食堂服务满意的概率的估计值为,故A正确;对于选项B,该学校女生对食堂服务满意的概率的估计值为,故B错误;因为χ2≈4.762>3.841,所以有95%的把握认为男、女生对该食堂服务的评价有差异,故C正确,D错误.
8.=6.5x+17.5 解析:设y关于x的回归直线方程为x+,
∵=5,=50,
y关于x的回归直线的斜率为6.5,
∴=50-6.5×5=17.5.
∴y关于x的回归直线方程为=6.5x+17.5.
9.A 解析:设男生人数为x,则女生人数为,则列联表如下:
性别 | 喜欢该软件 | 不喜欢该软件 | 总计 |
男生 | x | ||
女生 | |||
总计 | x |
若有95%的把握认为是否喜欢该软件和性别有关,又查表可得P(χ2≥3.841)=0.05,则χ2≥3.841,
即χ2=≥3.841,解得x≥10.242.又因为为整数,所以男生至少有12人.
故选A.
10.BD 解析:对于A,散点从左下到右上分布,所以当月在售二手房均价y与月份代码x正相关,故A错误;
对于B,令x=16,得=0.936 9+0.028 5=1.050 9,
所以可以预测2021年3月在售二手房均价约为1.050 9万元/平方米,故B正确;
对于C,非线性回归方程的曲线不一定经过(),故C错误;
对于D,R2越大,拟合效果越好,由于0.923<0.973,故D正确.
故选BD.
11.AC 解析:由题意设参加调查的男生、女生人数均为m,则
性别 | 喜欢攀岩 | 不喜欢攀岩 | 总计 |
男生 | 0.8m | 0.2m | m |
女生 | 0.3m | 0.7m | m |
总计 | 1.1m | 0.9m | 2m |
所以参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多,参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数少,故A正确,B错误;计算得
χ2=,
当m=100时,χ2=≈50.505>6.635,所以若参与调查的男生、女生人数均为100,则有99%的把握认为学生喜欢攀岩和性别有关,故C正确,D错误.故选AC.
12.5 解析:由题得(21+22+23+24+25+26+27)=24,
(24+28+31+39+43+47+54)=38,
所以38=24. ①
又68=30, ②
联立①②得=5.
13.e4.18 解析:=12,
=5.5,
所以5.5=×12+4.06,解得=0.12,所以=0.12x+4.06.所以=e0.12x+4.06=e4.06·e0.12x,
所以aek=e4.06·e0.12=e4.18.
14.解(1)由表格数据得甲机床生产的产品中一级品的频率为=75%;
乙机床生产的产品中一级品的频率为=60%.
(2)由题意可知
χ2=
=≈10.256.
又因为查表可得P(χ2≥6.635)=0.01,由于10.256>6.635,所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异.
15.解(1)
体重情况 | 身高较矮 | 身高较高 | 总计 |
体重较轻 | 6 | 15 | 21 |
体重较重 | 6 | 5 | 11 |
总计 | 12 | 20 | 32 |
经计算得到χ2=≈2.1<3.841,所以没有95%的把握认为男体育特长生身高对BMI指数有影响.
(2)①对编号为8的数据=66-0.8×173+75.9=3.5,完成残差表如下所示:
编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
体重y/kg | 57 | 58 | 53 | 61 | 66 | 57 | 50 | 66 |
残差/kg | 0.1 | 0.3 | 0.9 | -1.5 | -0.5 | -2.3 | -0.5 | 3.5 |
=(0.1)2+(0.3)2+(0.9)2+(-1.5)2+(-0.5)2+(-2.3)2+(-0.5)2+(3.5)2=21.2,R2=1-=1-≈0.91.
②由①可知,第八组数据的体重应为58.由已知=168,又因为(57+58+53+61+66+57+50+58)=57.5,代入=0.675x+可得=57.5-0.675×168=-55.9,所以重新采集数据后,男体育特长生的身高与体重的回归直线方程为=0.675x-55.9.
2023年新教材高考数学一轮复习课时规范练46统计含解析新人教B版: 这是一份2023年新教材高考数学一轮复习课时规范练46统计含解析新人教B版,共9页。试卷主要包含了03,请问每天应该进多少千克苹果?等内容,欢迎下载使用。
2023年新教材高考数学一轮复习课时规范练42椭圆含解析新人教B版: 这是一份2023年新教材高考数学一轮复习课时规范练42椭圆含解析新人教B版,共7页。试卷主要包含了已知F1,F2分别为椭圆E,已知F1,F2是椭圆C等内容,欢迎下载使用。
2023年新教材高考数学一轮复习课时规范练43双曲线含解析新人教B版: 这是一份2023年新教材高考数学一轮复习课时规范练43双曲线含解析新人教B版,共7页。试卷主要包含了双曲线C,已知曲线C,已知双曲线C,已知F1,F2分别是双曲线C等内容,欢迎下载使用。