所属成套资源:高考数学一轮复习
人教版高中数学高考一轮复习训练--统计与统计案例
展开
这是一份人教版高中数学高考一轮复习训练--统计与统计案例,共11页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
章末目标检测卷十 统计与统计案例
(时间:120分钟 满分:150分)
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.某校为了解高中学生的阅读情况,从该校1 800名高一学生中,采用分层随机抽样的方法抽取一个容量为200的样本进行调查,其中女生有88人,则该校高一男生有( )
A.1 098人 B.1 008人 C.1 000人 D.918人
2.已知一个2×2列联表如下,则表中a,b的值分别为( )
X
Y
合计
y1
y2
x1
b
21
e
x2
c
25
33
合计
a
d
106
A.96,94 B.60,52 C.52,54 D.50,52
3.某学校开展研究性学习活动,某同学获得一组统计数据如下表:
x
1.99
3
4
5.1
6.12
y
1.5
4.04
7.5
12
18.01
对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是( )
A.y=2x-2 B.y=12x
C.y=log2x D.y=12(x2-1)
4.某校从高一年级参加某次考试的学生中抽出60名学生,统计其成绩,得到频率分布直方图如图所示,由此估计此次考试成绩的中位数、众数分别为( )
A.73.3分,75分 B.73.3分,80分
C.70分,70分 D.70分,75分
5.恩格尔系数是食品支出总额占个人消费支出总额的比重.据某机构统计分析,城市职工购买食品的人均月支出y(单位:千元)与人均月消费支出x(单位:千元)具有线性相关关系,且经验回归方程为y^=0.4x+1.2.若某城市职工的人均月消费支出为5(单位:千元),则该城市职工的月恩格尔系数约为( )
A.60% B.64% C.58% D.55%
6.从某校高一新生中随机抽取一个容量为20的身高样本,数据(单位:cm)从小到大排序如下:
152,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170,171,x,174,175.
若样本数据的第90百分位数是173,则x的值为( )
A.171 B.172 C.173 D.174
7.某班级有50名学生,其中有30名男生和20名女生.随机询问了该班5名男生和5名女生在某次数学测验中的成绩,5名男生的成绩分别为86,94,88,92,90,5名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( )
A.这种抽样方法是一种比例分配的分层随机抽样
B.这种抽样方法是一种简单随机抽样
C.这5名男生成绩的方差大于这5名女生成绩的方差
D.该班男生成绩的平均数小于该班女生成绩的平均数
8.两个变量x,y的取值如下表:
x
0
1
3
4
y
2.2
4.3
4.8
6.7
若x,y具有线性相关关系,且y^=b^x+2.6,则下列四个结论错误的是( )
A.x与y正相关
B.当x=6时,y的估计值为8.3
C.x每增加1个单位,y大约增加0.95个单位
D.样本点(3,4.8)的残差为0.56
二、选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,有选错的得0分,部分选对的得3分.
9.下列关于独立性检验的说法中,正确的是( )
A.独立性检验依据小概率原理
B.独立性检验得到的结论一定正确
C.样本不同,独立性检验的结论可能有差异
D.独立性检验不是判定两类事物是否相关的唯一方法
10.某学校为了调查学生在一周生活方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)元的学生有60人,则下列说法正确的是( )
A.样本中支出在[50,60)元的频率为0.03
B.样本中支出不少于40元的人数为132
C.n的值为200
D.若该校有2 000名学生,则一定有600人的支出在[50,60)元
11.甲、乙两名射击运动员在某次测试中各射击20次,两人测试成绩的条形图如图所示,则( )
甲
乙
A.甲运动员测试成绩的中位数等于乙运动员测试成绩的中位数
B.甲运动员测试成绩的众数大于乙运动员测试成绩的众数
C.甲运动员测试成绩的平均数大于乙运动员测试成绩的平均数
D.甲运动员测试成绩的方差小于乙运动员测试成绩的方差
12.已知变量x与y线性相关,由样本数据点(xi,yi),i=1,2,…,n,求得的经验回归方程为y^=1.5x+0.5,x=3.现发现其中两个数据点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得的经验回归直线的斜率为1.2,则( )
A.变量x与y正相关
B.去除两个误差较大的数据点后的经验回归方程为y^=1.2x+1.4
C.去除两个误差较大的数据点后y的估计值增加速度变快
D.去除两个误差较大的数据点后,当x=4时,y的估计值为6.2
三、填空题:本题共4小题,每小题5分,共20分.
13.某校高一、高二、高三分别有学生1 600名、1 200名、800名.为了解该校高中学生的牙齿健康情况,按各年级的学生数进行比例分配的分层随机抽样.若高三抽取20名学生,则高一、高二共需抽取的学生数为 .
14.若已知某组数据的频率分布直方图如图所示,则估计该组数据的第60百分位数为 .
15.对具有线性相关关系的变量x,y,测得部分数据如表:
x
2
4
5
6
8
y
20
40
60
70
80
根据上表,利用最小二乘法得它们的经验回归方程为y^=10.5x+a^,据此模型预测,当x=10时, y^= .
16.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为 .
四、解答题:本题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤.
17.(10分)甲、乙两名射击运动员在相同条件下各打靶10次,每次打靶所得环数的折线统计图如图所示.
根据统计图,完成下表,并从下列角度对这次结果进行分析.
运动员
命中9环及以上的次数
平均数
中位数
方差
甲
乙
(1)从命中9环及以上的次数的角度分析谁的成绩好些;
(2)从平均数和中位数的角度分析谁的成绩好些;
(3)从方差的角度分析谁的成绩更稳定;
(4)从两人命中环数的走势的角度分析谁更有潜力.
18.(12分)近年来,社会各界越来越关注环境保护问题.某气象检测点连续100天监控空气质量指数(AQI),将这100天的AQI数据分为五组,各组对应的区间为[0,50],(50,100],(100,150],(150,200],(200,250],并绘制出不完整的频率分布直方图如图所示.
(1)请将频率分布直方图补充完整;
(2)已知AQI在区间[0,50]上的空气质量等级为优,在区间(50,100]上的空气质量等级为良,分别求这100天中空气质量等级为优与空气质量等级为良的天数;
(3)若这100天中,AQI在区间[0,100]上的天数与AQI在区间[m,250]上的天数相等,估计m的值.
19.(12分)(2020全国Ⅲ,理18改编)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
空气质量等级
锻炼人次
[0,200]
(200,400]
(400,600]
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,依据小概率值α=0.05的独立性检验,能否认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
空气质量
锻炼人次
人次≤400
人次>400
空气质量好
空气质量不好
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),
α
0.05
0.01
0.001
xα
3.841
6.635
10.828
.
20.
(12分)某市居民用水拟实行阶梯水价.每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到频率分布直方图如图所示.
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.
21.(12分)PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表:
时间
周一
周二
周三
周四
周五
车流量x/万辆
100
102
108
114
116
浓度y/(微克/立方米)
78
80
84
88
90
(1)根据上表数据,用最小二乘法求出y与x的经验回归方程;
(2)若周六同一时段车流量是200万辆,试根据(1)求出的经验回归方程,预测此时PM2.5的浓度为多少.
参考公式:b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2,a^=y−b^x.
22.(12分)某中学为研究学生的身体素质与课外体育锻炼时间的关系,对该校200名学生的日均课外体育锻炼时间(单位:min)进行调查,将收集到的数据分成[0,10),[10,20),[20,30),[30,40),[40,50),[50,60]六组,并作出频率分布直方图如图所示.将日均课外体育锻炼时间不低于40 min的学生评价为“课外体育达标”.
(1)请根据频率分布直方图中的数据填写下面的2×2列联表,并依据α=0.01的独立性检验,能否认为“课外体育达标”与性别有关?
性别
课外体育是否达标
合计
课外体育不达标
课外体育达标
男
60
女
110
合计
(2)现从“课外体育达标”学生中按分层随机抽样抽取5人,再从这5名学生中随机抽取2人参加体育知识问卷调查,求抽取的这2人课外体育锻炼时间都在[40,50)内的概率.
附参考公式与数据:
χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
章末目标检测卷十 统计与统计案例
1.B 设该校高一男生有x人,由题意可得x1 800=200-88200,解得x=1 008.
2.B 由已知得c=33-25=8,d=21+25=46,则a=106-46=60,b=60-8=52.
3.D
4.A 由频率分布直方图可知前三组的频率为(0.005+0.015+0.020)×10=0.40.5,所以样本的中位数在区间[70,80)内,所以样本的中位数为70+0.5-0.40.03≈73.3(分).
由题意可知样本的众数为70+802=75(分).
故估计此次考试成绩的中位数为73.3分,众数为75分.
5.B 当x=5时,y^=0.4×5+1.2=3.2,故该城市职工的月恩格尔系数约为3.25=0.64=64%.
6.B 因为20×90%=18,所以第90百分位数是第18个和第19个数据的平均数,即12(x+174)=173,所以x=172.
7.C 若抽样方法是比例分配的分层随机抽样,则男生、女生应分别抽取6人、4人,所以A错;由题目看不出是简单随机抽样,所以B错;这5名男生成绩的平均数x1=86+94+88+92+905=90,这5名女生成绩的平均数x2=88+93+93+88+935=91,
故这5名男生成绩的方差为15×[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8,这5名女生成绩的方差为15×[(88-91)2×2+(93-91)2×3]=6,所以这5名男生成绩的方差大于这5名女生成绩的方差,但该班男生成绩的平均数不一定小于女生成绩的平均数,所以D错.
8.D 由表格中的数据可知选项A正确.
∵x=14×(0+1+3+4)=2,y=14×(2.2+4.3+4.8+6.7)=4.5,∴4.5=2b^+2.6,解得b^=0.95.
∴y^=0.95x+2.6,可知选项C正确.
当x=6时,y^=0.95×6+2.6=8.3,故选项B正确.
当x=3时,y^=0.95×3+2.6=5.45,残差为4.8-5.45=-0.65,故选项D错误.
9.ACD
10.BC 由频率分布直方图,得样本中支出在[50,60)元的频率为1-(0.01+0.024+0.036)×10=0.3,则n=600.3=200.
所以样本中支出不少于40元的人数为(0.36+0.3)×200=132.
若该校有2 000名学生,则支出在[50,60)元的人数约为2 000×0.3=600.故选BC.
11.AD 由题图可得甲运动员测试成绩的中位数为8,众数为8,平均数为7×3+8×8+9×5+10×420=8.5,方差为(7-8.5)2×3+(8-8.5)2×8+(9-8.5)2×5+(10-8.5)2×420=1920;
乙运动员测试成绩的中位数为8,众数为8,平均数为7×4+8×7+9×4+10×520=8.5,
方差为(7-8.5)2×4+(8-8.5)2×7+(9-8.5)2×4+(10-8.5)2×520=2320.
所以甲运动员测试成绩的中位数等于乙运动员测试成绩的中位数,A正确;甲运动员测试成绩的众数等于乙运动员测试成绩的众数,B错误;甲运动员测试成绩的平均数等于乙运动员测试成绩的平均数,C错误;甲运动员测试成绩的方差小于乙运动员测试成绩的方差,D正确.
12.ABD 因为1.5>1.2>0,所以变量x与y正相关,且去除两个误差较大的数据点后,y的估计值增加速度变慢.
依题意,未去除两个误差较大的数据点时,y=1.5x+0.5=1.5×3+0.5=5.
设去除后剩余数据点的中心为(x',y'),经验回归方程为y^=1.2x+a^,则(n-2)x'=nx-(1.2+4.8)=3(n-2),(n-2)y'=ny-(2.2+7.8)=5(n-2),所以x'=3,y'=5,所以a^=y'-1.2x'=1.4.
所以去除两个误差较大的数据点后的经验回归方程为y^=1.2x+1.4,此时当x=4时,y的估计值为1.2×4+1.4=6.2.
故选ABD.
13.70 三个年级的学生数之比为4∶3∶2,高三抽取了20人,则高一、高二应分别抽取40人,30人,故高一、高二共抽取70人.
14.16.12 由频率分布直方图得,从左到右的第一、二、三、四、五、六小组的频率分别是0.02,0.18,0.36,0.34,0.06,0.04.
第一、二、三小组的频率之和是0.02+0.18+0.36=0.56,第一、二、三、四小组的频率之和是0.56+0.34=0.90,所以该组数据的第60百分位数在第四组[16,17)内,由16+1×0.60-0.560.90-0.56≈16.12,可以估计该组数据的第60百分位数为16.12.
15.106.5 根据表中数据,计算得x=15×(2+4+5+6+8)=5,y=15×(20+40+60+70+80)=54,代入经验回归方程y^=10.5x+a^中,求得a^=54-10.5×5=1.5,
故经验回归方程为y^=10.5x+1.5,
据此模型预测,当x=10时,y^=10.5×10+1.5=106.5.
16.10 设5个班级中参加的人数分别为x1,x2,x3,x4,x5,由题意知x1+x2+x3+x4+x55=7,(x1-7)2+(x2-7)2+(x3-7)2+(x4-7)2+(x5-7)2=5×4=20.
因为x1,x2,x3,x4,x5均为整数且互不相同,五个整数的平方和为20,所以必有0+1+1+9+9=20.
由|x-7|=3,得x=10或x=4,由|x-7|=1,得x=8或x=6.
故样本数据分别为4,6,7,8,10,故最大值为10.
17.解 依题意,完成表格如下.
运动员
命中9环及以上的次数
平均数
中位数
方差
甲
1
7
7
1.2
乙
3
7
7.5
5.4
(1)因为乙命中9环及以上的次数比甲多,所以乙的成绩好些.
(2)因为甲、乙的平均数相同,甲的中位数小于乙的中位数,所以乙的成绩好些.
(3)因为甲的方差小于乙的方差,所以甲的成绩更稳定.
(4)因为甲的环数在平均数上下波动,而乙的环数整体呈上升趋势,且从第4次开始,乙的环数不低于甲的环数,所以乙更有潜力.
18.解 (1)由频率分布直方图可知AQI在区间(100,150]上的频率为1-(0.004+0.008+0.002+0.001)×50=0.25.
补全频率分布直方图如图所示.
(2)依题意,这100天中空气质量等级为优的天数为0.004×50×100=20,空气质量等级为良的天数为0.008×50×100=40.
(3)依题意,AQI在区间[0,100]上的频率等于AQI在区间[m,250]上的频率.
因为AQI在区间[0,100]上的频率为(0.004+0.008)×50=0.6,在区间(100,250]上的频率为1-0.6=0.4,所以503.841=xα.
根据小概率值α=0.05的独立性检验,推断H0不成立,即认为一天中到该公园锻炼的人次与该市当天的空气质量有关,此推断犯错误的概率不大于0.05.
20.解 (1)由用水量的频率分布直方图知,该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.
所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3.
(2)由用水量的频率分布直方图及题意(注意:实行阶梯水价),得居民该月用水费用的数据分组与频率分布表:
组号
1
2
3
4
5
6
7
8
分组
[2,4]
(4,6]
(6,8]
(8,10]
(10,12]
(12,17]
(17,22]
(22,27]
频率
0.1
0.15
0.2
0.25
0.15
0.05
0.05
0.05
根据题意,该市居民该月的人均水费估计为
4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).
21.解 (1)由条件可知,x=15∑i=15xi=5405=108,y=15∑i=15yi=4205=84,
∑i=15(xi-x)(yi-y)=(-8)×(-6)+(-6)×(-4)+0×0+6×4+8×6=144,
∑i=15(xi-x)2=(-8)2+(-6)2+02+62+82=200,b^=∑i=15(xi-x)(yi-y)∑i=15(xi-x)2=144200=0.72,
a^=y−b^x=84-0.72×108=6.24,
故y关于x的经验回归方程为y^=0.72x+6.24.
(2)当x=200时,y^=0.72×200+6.24=150.24.
故可以预测此时PM2.5的浓度为150.24微克/立方米.
22.解 (1)根据频率分布直方图,得“课外体育达标”的学生数为200×(0.020+0.005)×10=50.
由2×2列联表可知“课外体育达标”的男生人数为30,女生人数为20.
补全2×2列联表如下:
性别
课外体育是否达标
合计
课外体育不达标
课外体育达标
男
60
30
90
女
90
20
110
合计
150
50
200
零假设为H0:“课外体育达标”与性别无关.
计算χ2=200×(60×20-90×30)290×110×150×50≈6.061
相关试卷
这是一份新高考数学一轮复习提升训练8.5 统计案例(精练)(含解析),共22页。
这是一份新高考数学一轮复习提升训练8.5 统计案例(精讲)(含解析),共18页。试卷主要包含了独立性检验,线性回归方程,非线性回归方程等内容,欢迎下载使用。
这是一份高中数学高考复习 第18讲统计与统计案例 练习,共18页。试卷主要包含了下列说法正确的是等内容,欢迎下载使用。