2024年高考数学一轮复习(新高考方案)课时跟踪检测(七十二) 随机抽样与样本估计总体
展开课时跟踪检测(七十二) 随机抽样与样本估计总体
一、全员必做题
1.(2023·南通高三期末)某校高三年级的700名学生中,男生有385名,女生有315名.从中抽取一个容量为60的样本,则抽取男生和女生的人数分别为( )
A.31,29 B.32,28
C.33,27 D.34,26
解析:选C 设样本中的男生和女生的人数分别为m,n,由分层随机抽样可得==,解得故选C.
2.(2023·深圳模拟)某市卫健委为了解防疫期间志愿者的服务时长(单位:小时),对参加过防疫的志愿者随机抽样调查,将样本中个体的服务时长进行整理,得到如图所示的频率分布直方图.据此估计,7.2万名参加过防疫的志愿者中服务时长超过32小时的约有( )
A.3.3万人 B.3.4万人
C.3.8万人 D.3.9万人
解析:选A 依题意样本中服务时长超过32小时的个体频率为1-4×(0.005+0.04+0.09)=0.46;由样本估计总体,可得总体中服务时长超过32小时的个体数为7.2×0.46=3.312≈3.3(万人).故选A.
3.(多选)某市教体局对全市高三年级的学生身高进行抽样调查,随机抽取了100名学生,他们的身高都处在A,B,C,D,E五个层次内,根据抽样结果得到统计图表,则下面叙述正确的是( )
A.样本中女生人数多于男生人数
B.样本中B层人数最多
C.样本中E层男生人数为6
D.样本中D层男生人数多于女生人数
解析:选ABC 样本中女生人数为9+24+15+9+3=60,男生人数为100-60=40,A正确;样本中A层人数为9+40×10%=13;样本中B层人数为24+40×30%=36;样本中C层人数为15+40×25%=25;样本中D层人数为9+40×20%=17;样本中E层人数为3+40×15%=9,B正确;样本中E层男生人数为40×15%=6,C正确;样本中D层男生人数为40×20%=8,女生人数为9,女生人数多于男生人数,D错误.
4.(多选)某运动队共有8名运动员,教练为直观了解运动员的训练效果,统计了近几个月测试成绩的平均分和标准差,得到如下统计图,则( )
A.1号和2号运动员比较,1号竞技水平较高,且2号成绩较稳定
B.3号和4号运动员比较,3号竞技水平较高,且4号成绩较稳定
C.5号和6号运动员的竞技水平都低于整体平均水平,且6号成绩波动较大
D.7号和8号运动员的竞技水平都低于整体平均水平,且8号成绩波动较大
解析:选AD 对于A,由统计图可知,1号运动员成绩的平均分和标准差均高于2号运动员,∴1号竞技水平较高,2号成绩较稳定,A正确;对于B,由统计图可知,3号运动员成绩的平均分和4号运动员成绩的平均分相同,∴两名运动员的竞技水平相同,B错误;对于C,由统计图可知,5号运动员成绩的标准差高于6号运动员成绩的标准差,∴5号运动员的成绩波动较大,C错误;对于D,由统计图可知,7号和8号运动员成绩的平均分均低于整体平均分,8号运动员成绩的标准差高于7号运动员成绩的标准差,∴7号和8号运动员的竞技水平都低于整体平均水平,8号成绩波动较大,D正确.故选A、D.
5.(多选)某公司为了解用户对其产品的满意度,从甲、乙两地区分别随机调查了100个用户,根据用户对产品的满意度评分,分别得到甲地区和乙地区用户满意度评分的频率分布直方图,如图所示.若甲地区和乙地区用户满意度评分的中位数分别为m1,m2,平均数分别为s1,s2,则下面正确的是( )
A.m1>m2 B.m1<m2
C.s1<s2 D.s1>s2
解析:选BC 由题中频率分布直方图得,甲地区[40,60)的频率为(0.015+0.020)×10=0.35,[60,70)的频率为0.025×10=0.25,所以甲地区用户满意度评分的中位数m1=60+×10=66,甲地区的平均数s1=45×0.015×10+55×0.020×10+65×0.025×10+75×0.020×10+85×0.010×10+95×0.010×10=67.乙地区[50,70)的频率为(0.005+0.020)×10=0.25,[70,80)的频率为0.035×10=0.35,所以乙地区用户满意度评分的中位数m2=70+×10≈77.1,乙地区的平均数s2=55×0.005×10+65×0.020×10+75×0.035×10+85×0.025×10+95×0.015×10=77.5,所以m1<m2,s1<s2.故选B、C.
6.(2023·镇江高三开学考试)数据:1,2,2,3,4,5,6,6,7,8,其中位数为m,第60百分位数为a,则m+a=________.
解析:中位数m==4.5,因为10×60%=6,所以第60百分位数a==5.5,所以m+a=10.
答案:10
7.(2023·湘潭高三开学考试)某灯泡厂对编号为 1,2,…,15 的十五个灯泡进行使用寿命试验, 得到奇数号灯泡的平均使用寿命(单位:小时)为1 580,方差为15 000, 偶数号灯泡的平均使用寿命为1 580, 方差为12 000,则这十五个灯泡的使用寿命的方差为________.
解析:由题意,十五个灯泡的平均使用寿命为=1 580,所以方差s2=(xi-x)2=×(8×15 000+7×12 000)=13 600.
答案:13 600
8.某校高一年级开设了丰富多彩的校本课程,现从甲、乙两个班随机抽取了5名学生校本课程的学分,统计如表:
甲 | 8 | 11 | 14 | 15 | 22 |
乙 | 6 | 7 | 10 | 23 | 24 |
用s,s分别表示甲、乙两班抽取的5名学生学分的方差,计算两个班学分的方差,则s=________,并由此可判断成绩更稳定的班级是________班.
解析:甲班学生学分的平均数1=×(8+11+14+15+22)=14,所以甲班学生学分的方差s=×[(8-14)2+(11-14)2+(14-14)2+(15-14)2+(22-14)2]=22.乙班学生学分的平均数2=×(6+7+10+23+24)=14,所以乙班学生学分的方差s=×[(6-14)2+(7-14)2+(10-14)2+(23-14)2+(24-14)2]=62.由此可判断成绩更稳定的班级是甲班.
答案:62 甲
9.(2023·南京模拟)为了比较两种复合材料制造的轴承(分别称为类型Ⅰ轴承和类型Ⅱ轴承)的使用寿命,检验了两种类型轴承各30个,它们的使用寿命(单位:百万圈)如下表:
根据上述表中的数据回答下列问题:
(1)对于类型Ⅰ轴承,应该用平均数还是中位数度量其寿命分布的中心?请说明理由;
(2)若需要使用寿命尽可能大的轴承,从中位数或平均数的角度判断:应选哪种轴承?请说明理由;
(3)若需要使用寿命的波动性尽可能小的轴承,应选哪种轴承?请说明理由.
解:(1)从表中可以看出大多数的数据集中在[11.2,13.8]区间内,在这个区间的数据有20个,中位数为12,6.2,6.4有严重的偏离,所以使用中位数度量寿命分布的中心.
(2)由题表可知,类型Ⅰ轴承的使用寿命按由小到大排序,排在15,16位的是11.8,12.2,故中位数为12;类型Ⅱ轴承的使用寿命按由小到大排序,排在15,16位的是10.4,10.6,故中位数为10.5;因为12>10.5,所以应选类型Ⅰ轴承.
(3)从类型Ⅰ的表格中,极差=14.5-6.2=8.3,多数的数据集中在[11.2,13.8] 区间内,6.2,6.4,8.3,8.6严重偏离分布中心,即波动较大,标准差必定较大,从类型Ⅱ的表格中,极差=13.4-8.4=5,较小,数据的分布集中均匀,标准差必定较小,故应选类型Ⅱ轴承.
10.在实施“乡村振兴”的进程中,某地政府引领广大农户发展特色农业,种植优良品种柑橘.现在实验基地中种植了相同数量的A,B两种柑橘.为了比较A,B两个柑橘品种的优劣,在柑橘成熟后随机选取A,B两种柑橘各100株,并根据株产量X(单位:kg)绘制了如图所示的频率分布直方图(数据分组为[65,70),[70,75),[75,80),[80,85),[85,90),[90,95]):
(1)求a,b的值;
(2)将频率当做概率,在所有柑橘中随机抽取一株,求其株产量不低于80 kg的概率;
(3)求两种柑橘株产量平均数的估计值(同一组数据中的平均数用该组区间的中点值代表),并从产量角度分析,哪个品种的柑橘更好?请说明理由.
解:(1)由频率分布直方图可得(0.01×2+0.03+0.05+0.06+a)×5=1,解得a=0.04,(0.01×2+0.03+b+0.05+0.06)×5=1,解得b=0.04.(2)A品种柑橘株产量不低于80 kg的频率为(0.04+0.05+0.06)×5=0.75,
B品种柑橘株产量不低于80 kg的频率为(0.03+0.01+0.01)×5=0.25,
故200株柑橘中产量不低于80 kg的频率为=0.5,
所以在所有柑橘中随机抽取一株,其株产量不低于80 kg的概率为0.5.
(3)设A品种柑橘株产量平均数的估计值为MA,
MA=(0.01×67.5+0.01×72.5+0.03×77.5+0.04×82.5+0.05×92.5+0.06×87.5)×5=84.5,
设B品种柑橘株产量平均数的估计值为MB,
MB=(0.01×92.5+0.01×87.5+0.03×82.5+0.04×77.5+0.05×67.5+0.06×72.5)×5=75.5,
A品种的柑橘更好.理由如下:
①A的平均产量大于B的平均产量.
②由频率分布直方图可知,A品种柑橘株产量在80 kg及以上的占比为75%,B品种柑橘株产量在80 kg及以上的占比为25% ,故A品种的柑橘更好.
二、重点选做题
1.已知样本x1,x2,…,xn的平均数为;样本y1,y2,…,ym的平均数为(≠),若样本x1,x2,…,xn,y1,y2,…,ym的平均数=a+(1-a),其中0<a<,则n,m(n,m∈N*)的大小关系为( )
A.n=m B.n≥m
C.n<m D.n>m
解析:选C 由样本x1,x2,…,xn的平均数为,样本y1,y2,…,ym的平均数为,样本x1,x2,…,xn,y1,y2,…,ym的平均数=a+(1-a),其中0<a<,得=+=a+(1-a),∴a=.又0<a<,故1-a>a,∴>,∴m>n.
2.(2023·沧州模拟)(多选)全市高三年级第二次统考结束后,李老师为了了解本班学生的本次数学考试情况,将全班50名学生的数学成绩绘制成频率分布直方图.已知该班级学生的数学成绩全部介于65分到145分之间(满分150分),将数学成绩按如下方式分成八组:第一组[65,75),第二组[75,85),…,第八组[135,145].按上述分组方法得到的频率分布直方图的一部分如图,则下列结论正确的是( )
A.第七组的频率为0.008
B.该班级数学成绩的中位数的估计值为101分
C.该班级数学成绩的平均分的估计值大于95分
D.该班级数学成绩的标准差的估计值大于6
解析:选BCD 对于A,利用频率之和为1,可得第七组的频率为1-(0.004+0.012+0.016+0.030+0.020+0.006+0.004)×10=0.08,选项A错误;对于B,成绩在第一组到第八组的人数分别为2,6,8,15,10,3,4,2,所以中位数在第四组[95,105)内.设中位数为x,因为(0.004+0.012+0.016)×10=0.32<0.5,所以0.32+0.030×(x-95)=0.5,解得x=101,所以该班级数学成绩的中位数的估计值为101分,选项B正确;对于C,该班级数学成绩的平均分的估计值为70×0.04+80×0.12+90×0.16+100×0.3+110×0.2+120×0.06+130×0.08+140×0.04=102(分),选项C正确;对于D,×[2×(70-102)2+6×(80-102)2+…]>×2×(70-102)2=40.96>36,所以标准差的估计值大于6,选项D正确.故选B、C、D.
3.(多选)为了解决传统的3D人脸识别方法中存在的不精确问题,科学家提出了一种基于视频分块聚类的格拉斯曼流形自动识别系统.规定:某区域内的m个点Pi(xi,yi,zi)的深度zi的均值μ=i,标准偏差为σ=,深度zi∉[μ-3σ,μ+3σ]的点视为孤立点,下表给出了某区域内的8个点的数据,则( )
Pi | P1 | P2 | P3 | P4 | P5 | P6 | P7 | P8 |
xi | 15.1 | 15.2 | 15.3 | 15.4 | 15.5 | 15.4 | 15.4 | 13.4 |
yi | 15.1 | 14.2 | 14.3 | 14.4 | 14.5 | 15.4 | 14.4 | 15.4 |
zi | 20 | 12 | 13 | 15 | 16 | 14 | 12 | 18 |
A.σ= B.μ=15
C.P1不是孤立点 D.P2和P7是孤立点
解析:选BC 由题可得μ=×(20+12+13+15+16+14+12+18)=15,B正确;
σ===,A错误;μ-3σ=15-,μ+3σ=15+,则[μ-3σ,μ+3σ]=,20∈[μ-3σ,μ+3σ],12∈[μ-3σ,μ+3σ],所以P1,P2,P7都不是孤立点,C正确,D错误.故选B、C.
4.(2023·重庆南开中学模拟)某食堂为了了解同学在高峰期打饭的时间,故安排一名食堂阿姨随机收集了在食堂某窗口打饭的100位同学的相关数据(假设同学们打饭所用时间均为下表列出时间之一),如表所示.
学生数(人) | x | 25 | y | 10 |
打饭时间(秒/人) | 10 | 15 | 20 | 25 |
已知这100位同学的打饭时间从小排到大的第65百分位数为17.5秒.
(1)确定x,y的值;
(2)若各学生的结算相互独立,记X为该窗口开始打饭至20秒末已经打饭结束的学生人数,求X的分布列及数学期望.(注:将频率视为概率)
解:(1)因为第65百分位数为17.5=,所以所以x=40,y=25.
(2)由已知得打饭时间为10秒的概率为=0.4,
打饭时间为15秒的概率为=0.25,
打饭时间为20秒的概率为=0.25,
打饭时间为25秒的概率为=0.1,
由题可知X的可能取值为0,1,2,
∴P(X=0)=0.1,P(X=1)=0.25+0.25+[0.4×(1-0.4)]=0.74,P(X=2)=0.4×0.4=0.16,
∴X的分布列为
X | 0 | 1 | 2 |
P | 0.1 | 0.74 | 0.16 |
∴E(X)=0.1×0+0.74×1+0.16×2=1.06.
2024版新教材高考数学全程一轮总复习课时作业六十随机抽样用样本估计总体: 这是一份2024版新教材高考数学全程一轮总复习课时作业六十随机抽样用样本估计总体,共9页。试卷主要包含了单项选择题,多项选择题,填空题,解答题等内容,欢迎下载使用。
备战2024高考一轮复习数学(理) 课时验收评价(六十四) 随机抽样与用样本估计总体: 这是一份备战2024高考一轮复习数学(理) 课时验收评价(六十四) 随机抽样与用样本估计总体,共7页。试卷主要包含了点全面广强基训练,重点难点培优训练等内容,欢迎下载使用。
2024年(新高考)高考数学一轮复习突破练习11.1《随机抽样、用样本估计总体》(含详解): 这是一份2024年(新高考)高考数学一轮复习突破练习11.1《随机抽样、用样本估计总体》(含详解),共7页。试卷主要包含了选择题,填空题等内容,欢迎下载使用。