新高考数学一轮复习基础巩固6.1 抽样方法及特征数(精练)(含解析)
展开
这是一份新高考数学一轮复习基础巩固6.1 抽样方法及特征数(精练)(含解析),共15页。
6.1 抽样方法及特征数(精练)(基础版)
题组一 抽样方法
1(2022·江西·二模(理))某工厂利用随机数表对生产的300个零件进行抽样测试,先将300个零件进行编号001,002,…,299,300.从中抽取30个样本,根据提供随机数表的第5行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第3个样本编号是( )
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.072 B.134 C.007 D.253
【答案】A
【解析】从表中第5行第6列开始向右读取数据,依次为:253(第1个),313(大于300,不取),457(大于300,不取),860(大于300,不取),736(大于300,不取),253(与253重复,不取),007(第2个),328(大于300,不取),623(大于300,不取),457(大于300,不取),889(大于300,不取),072(第3个).
故得到的第3个样本编号是072.故选:A.
2.(2022·江西省丰城中学模拟预测(理))某学校教务部门为了解高三理科学生数学的学习情况,利用随机数表对理科的800名学生进行抽样测试,先将800个学生进行编号001,002,…,799,800.从中抽取80个样本,根据提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是( )
33 21 18 34 29 78 64 56 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 42
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.007 B.328 C.253 D.623
【答案】B
【解析】根据题意,从开始,3位3位的数,分别是:253,313,457,860,736,253,007,328,
其中不在编号内,舍去,第二个重复,舍去,得到的前6个样本编号是:253,313,457, 736, 007,328,所以得到的第6个样本编号是.故选:B
3.(2022·云南·昆明一中高三阶段练习(文))在一次羽毛球男子单打比赛中,运动员甲、乙进入了决赛.比赛规则是三局两胜制.根据以往战绩,每局比赛甲获胜概率为0.4,乙获胜概率为0.6.利用计算机模拟实验,产生内的整数随机数,当出现随机数1或2时,表示一局比赛甲获胜,现计算机产生15组随机数为:423,231,344,114,534,123,354,535,425,232,233,351,122,153,533,据此估计甲获得冠军的概率为( )
A. B. C. D.
【答案】C
【解析】由计算机产生的组数据中,甲获得冠军的数据有,,,,,共组,
据此估计甲获得冠军的概率为,故选:C.
4.(2023·全国·高三专题练习)某社区卫生室为了了解该社区居民的身体健康状况,对该社区1100名男性居民和900名女性居民按性别采用等比例分层随机抽样的方法进行抽样调查,抽取了一个容量为100的样本,则应从男性居民中抽取的人数为( )
A.45 B.50 C.55 D.60
【答案】C
【解析】应从男性居民中抽取的人数为;故选:C.
5.(2022·上海黄浦·二模)某高中为了了解学生收看空中课堂的具体情况,利用分层抽样的方法从高中三个年级的学生中随机抽取了名进行问卷调查,其中从高一年级的学生中抽取了名,从高二年级的学生中抽取了名,若高三年级共有学生名,则该高中共有学生____________名.
【答案】
【解析】依题意可得样本中高三年级抽取了名学生,
所以该高中共有学生名学生;故答案为:
题组二 特征数
1.(2022·江苏·南京市天印高级中学模拟预测)在发生某公共卫生事件期间,我国有关机构规定:该事件在一段时间没有发生规模群体感染的标志为“连续天每天新增加疑似病例不超过人”.根据过去天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地总体均值为,中位数为
B.乙地总体平均数为,总体方差大于;
C.丙地总体均值为,总体方差为
D.丁地中位数为,众数为
【答案】C
【解析】0,0,0,0,4,4,4,4,4,10,满足甲地条件,所以不符合标志
0,0,0,0,0,0,0,0,0,10,满足乙地条件,所以不符合标志
丙地,若存在某一天新增加疑似病例超过7,则方差为
,与总体方差为3矛盾,故假设不成立,所以C符合标志
3,3,3,3,3,3,3,3,3,10,满足丁地条件,所以不符合标志
故选:C
2.(2023·全国·高三专题练习)“学习强国”APP是以深入学习、宣传习近平新时代中国特色社会主义思想,立足全体党员,面向全社会的优质学习平台.为了解甲、乙两人的平台学习情况,统计了他们最近7天的学习积分,制成如图所示的茎叶图,若中间一列的数字表示积分的十位数,两边的数字表示积分的个位数,则在这7天中,下列结论正确的为( )
A.甲、乙两人积分的极差相等
B.甲、乙两人积分的平均数不相等
C.甲、乙两人积分的中位数相等
D.甲积分的方差大于乙积分的方差
【答案】B
【解析】甲的极差为,乙的极差为,极差不相等,A错误;
甲的平均数为,乙的平均数为,平均数不相等,B正确;
甲的中位数为44,乙的中位数为43,中位数不相等,C错误;
由茎叶图知,甲数据较乙数据更集中,故甲的方差小于乙,D错误.
故选:B.
3.(2022·湖北·荆州中学模拟预测)酒后驾驶是严重危害交通安全的行为,某交通管理部门对辖区内四个地区(甲、乙、丙、丁)的酒驾治理情况进行检查督导,若“连续8天,每天查获的酒驾人数不超过10”,则认为“该地区酒驾治理达标”,根据连续8天检查所得数据的数字特征推断,酒驾治理一定达标的地区是( )
A.甲地:均值为7,方差为2 B.乙地:众数为3,中位数为2
C.丙地,均值为4,中位数为5 D.丁地:极差为,中位数为8
【答案】A
【解析】不妨设8天中,每天查获的酒驾人数从小到大为
且其中
选项A,若不达标,则,由均值为7可知,则其余七个数中至少有一个数不等于7,由方差定义可知,,这与方差为2矛盾,从而甲地一定达标,故A正确
选项B:由众数和中位数的定义可知,当,,,时,乙地不达标,故B错误
选项C:若不达标,则,由均值为7可知,因为中位数是5,所以
又因为均值为4,故,从而,
且,则,,,满足题意,从而丙地有可能不达标,故C错误
选项D:由极差和中位数的定义可知,当,
时,丁地不达标,故D错误
故选:A
4.(2022·四川成都·高三阶段练习(文))若数据9,,6,5的平均数为7,则数据17,,11,9的平均数和方差分别为( )
A.13,5 B.14,5 C.13,10 D.14,10
【答案】C
【解析】依题意得,解得,于是,故的平均数是,方差为:.故选:C.
5.(2022·河南·郑州四中高三阶段练习(文))运动员甲10次射击成绩(单位:环)如下:7,8,9,7,4,8,9,9,7,2,则下列关于这组数据说法不正确的是( ).
A.众数为7和9 B.平均数为7
C.中位数为7 D.方差为
【答案】C
【解析】由题意,这组数据中7和9都出现3次,其余数出现次数没超过3次,
故众数为7和9,A正确;
计算平均数为 ,故B正确;
将10次射击成绩从小到大排列为:2,4,7, 7, 7,8,8,9,9,9,
则中位数为 ,故C错误;方差为,
故D正确,故选:C
6.(2022·全国·高三专题练习)甲乙两工厂生产某种产品,抽取连续5个月的产品生产产量(单位:件)情况如下:甲:80、70、100、50、90;乙:60、70、80、55、95,则下列说法中正确的是( )
A.甲平均产量高,甲产量稳定 B.甲平均产量高,乙产量稳定
C.乙平均产量高,甲产量稳定 D.乙平均产量高,乙产量稳定
【答案】B
【解析】对于甲:可得平均数
方差
同理对于乙:可得平均数,方差
∵
∴甲平均产量高,乙产量稳定
故选:B.
7.(2023·全国·高三专题练习)在2022北京冬奥会单板滑雪U型场地技巧比赛中,6名评委给选手打出了6个各不相同的原始分,经过“去掉其中一个最高分和一个最低分”处理后,得到4个有效分.则经处理后的4个有效分与6个原始分相比,一定会变小的数字特征是( )
A.平均数 B.中位数 C.众数 D.方差
【答案】D
【解析】去掉最大值与最小值这组数的平均值大小不确定,中位数不变,众数大小不确定,
根据方差的定义,去掉最高分,最低分后,剩余四个数据的波动性小于原来六个数据的波动性,故方差一定会变小.故选:D
8.(2023·全国·高三专题练习)在发生某公共卫生事件期间,有专业机构认为该事件在一段事件内没有发生大规模群体感染的标志是“连续日,每天新增疑似病例不超过人”.过去日,甲、乙、丙、丁四地新增疑似病例数据信息如下:
甲地:总体平均数为,中位数为;
乙地:总体平均数为,总体方差大于;
丙地:中位数为,众数为;
丁地:总体平均数为,总体方差为.
则甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是( )
A.甲地 B.乙地 C.丙地 D.丁地
【答案】D
【解析】对于甲地,若连续日的数据为,则满足平均数为,中位数为,但不符合没有发生大规模群体感染的标志,A错误;
对于乙地,若连续日的数据为,则满足平均数为,方差大于,但不符合没有发生大规模群体感染的标志,B错误;
对于丙地,若连续日的数据为,则满足中位数为,众数为,但不符合没有发生大规模群体感染的标志,C错误;
对于丁地,若总体平均数为,假设有一天数据为人,则方差,不可能总体方差为,则不可能有一天数据超过人,符合没有发生大规模群体感染的标志,D正确.
故选:D.
9.(2023·全国·高三专题练习)有一组样本数据,.若样本的平均数,则( )
A.样本的众数为2 B.样本的极差为2
C.样本的中位数为2 D.样本的方差大于1
【答案】C
【解析】对A,若该组样本数据为满足平均数,但众数为1,3,故A错误;
对BD,若该组样本数据为满足平均数,但极差为0,方差为0,故BD错误;
对C,满足题意的所有情况可能有①②③,中位数均为2,故C正确;
故选:C
10.(2023·全国·高三专题练习)研究与试验发展(research and development,R&D)指为增加知识存量(也包括有关人类、文化和社会的知识)以及设计已有知识的新应用而进行的创造性、系统性工作.国际上通常采用研究与试验发展(R&D)活动的规模和强度指标反映一国的科技实力和核心竞争力.据国家统计局公告,下图是2016-2021年全国R&D经费总量(指报告期为实施研究与试验发展(R&D)活动而实际发生的全部经费支出)及投入强度(R&D经费投入与国内生产总值(GDP)之比)情况统计图表,则下列四个说法,所有正确说法的序号是( )
①2016-2021年全国R&D经费支出数据中,中位数大于20000;
②2016-2021年全国R&D经费投入强度的平均值未达到2.30;
③2016-2021年全国R&D经费支出数据中,极差为0.34;
④2016-2021年全国R&D经费支出及投入强度均与年份成正相关.
A.①③ B.②④ C.①②④ D.①③④
【答案】C
【解析】由图可知,2016-2021年全国R&D经费支出的中位数为,①正确;
,②正确;③0.34为全国R&D经费投入强度的极差,故③不正确;④正确.故选:C
11.(2023·全国·高三专题练习)(多选)某市商品房调查机构随机抽取n名市民,针对其居住的户型结构和满意度进行了调查,如图1调查的所有市民中四居室共300户,所占比例为,二居室住户占.如图2是用分层抽样的方法从所有调查的市民的满意度问卷中,抽取10%的调查结果绘制成的统计图,则下列说法错误的是( )
A.样本容量为90 B.样本中三居室住户共抽取了35户
C.据样本可估计对四居室满意的住户有110户 D.样本中对二居室满意的有3户
【答案】BC
【解析】如图1调查的所有市民中四居室共300户,所占比例为,二居室住户占,
,二居室有户,三居室有450户,由图1和图2得:
在A中,样本容量为:,故A正确;
在B中,样本中三居室住户共抽取了户,故B错误;
在C中,根据样本可估计对四居室满意的住户有户,故C错误;
在D中,样本中对二居室满意的有户,故D正确.
故选:BC.
12.(2023·全国·高三专题练习)(多选)甲乙两名学生,六次数学测验成绩(百分制如图所示).下面说法正确的是( )
A.甲同学成绩的中位数大于乙同学成绩的中位数; B.甲同学的平均分比乙同学高;
C.甲同学成绩的极差是18; D.甲同学成绩方差小于乙同学成绩的方差.
【答案】CD
【解析】对于A,甲成绩的中位数是81,乙成绩的中位数是87.5,A不正确;
对于B,甲成绩的平均分为,
乙成绩的平均分为,B不正确;
对于C,甲成绩的极差是18,C正确;
对于D,甲成绩的方差为,
乙成绩的方差为,D正确.
故选:CD
题组三 抽样方法与特征数综合
1.(2023·全国·高三专题练习)在全民抗击新冠肺炎疫情期间,某市教育部门开展了“停课不停学”活动,为学生提供了多种网络课程资源.活动开展一个月后,某学校随机抽取了高二年级的学生若干进行网络问卷调查,统计学生每天的学习时间(单位:小时),将样本数据分成,,,,五组(全部数据都在内),并整理得到如图所示的频率分布直方图.
(1)已知该校高二年级共有800名学生,根据统计数据,估计该校高二年级每天学习时间不低于5小时的学生人数;
(2)利用统计数据,估计该校高二年级学生每天平均学习时间;
(3)若样本容量为40,用分层抽样的方法从样本中学习时间在和的学生中抽取6人,再从6人中随机抽取2人调查其学习时间安排情况,求所抽取的2人来自同一组的概率.
【答案】(1)(2)(3)
【解析】(1)根据统计数据估计该校高二年级每天学习时间不低于5小时的学生人数为.所以估计该校高二年级每天学习不低于5小时的人数为640人.
(2)样本中学生每天学习时间的各组频率分别为0.05,0.15,0.50,0.25,0.05.样本中学生每天平均学习时间为(小时).所以估计该校高二年级学生每天平均学习时间为5.6小时.
(3)由题意知样本中每天学习时间在的人数为,每天学习时间在的学生人数为,故用分层抽样的方法从两组抽取的人数分别为4人和2人,分别记作,,,和,,从中任取2人的基本事件有:,,,,,,,,,,,,,,,共15个;其中来自同一组的基本事件有:,,,,,,共7个,故所求概率.
2.(2022·全国·高三专题练习)为了备战下届奥运会,甲、乙两名运动员在相同条件下各射击次,得到如下数据:
甲射击次中靶环数分别为:、、、、、、、、、.
乙射击次中靶环数分别为:、、、、、、、、、.
射击队教练希望利用此次射击成绩为依据,挑选一名运动员参加奥运会,请你帮助教练分析两个运动员的成绩,并作出判断.
【答案】答案见解析
【解析】运动员甲的平均成绩为(环),
运动员乙的平均成绩为(环),
运动员甲成绩的方差为,
运动员乙成绩的方差为,
比较如下:
平均数
方差
命中环及环以上的次数
甲
乙
①因为两名运动员射击成绩的平均数相同,且,则甲的成绩比乙稳定;
②因为两名运动员射击成绩的平均数相同,命中环及环以上的次数甲比乙少,
所以,乙成绩比甲好些.
③甲成绩在平均数上下波动,而乙处于上升势头,从第三次以后就没有比甲少的情况发生,乙更有潜力.
3.(2022·河南·开封市东信学校模拟预测(文))灵活就业的岗位主要集中在近些年兴起的主播、自媒体、配音,还有电竞、电商这些新兴产业上.只要有网络、有电脑,随时随地都可以办公.这些岗位出现的背后都离不开互联网的加速发展和短视频时代的大背景.甲、乙两人同时竞聘某公司的主播岗位,其10种表现得分如下表:
甲
8
9
7
9
7
6
10
10
8
6
乙
10
9
8
6
8
7
9
7
8
a
(1)若甲和乙所得平均分相等,求a的值;
(2)在(1)的条件下,从10种表现得分中,任取一种,求甲的评分大于乙的评分的概率;
(3)在(1)的条件下,判断甲、乙两人哪个的表现更稳定.
【答案】(1)(2)(3)乙表现更稳定
【解析】(1)根据题中所给数据,甲的得分平均数为,
,解得;
(2)∵10种表现评分中,甲的得分高于乙的有3种,
∴“从10种表现得分中,任取一种,甲的评分大于乙的评分的概率为;
(3),
,
由,得乙的表现更稳定.
4.(2022·黑龙江·哈九中三模(文))某经销商采购了一批水果,根据某些评价指标进行打分,现从中随机抽取20筐(每筐1kg),得分数据如下:17,23,29,31,34,40,46,50,51,51,58,62,62,68,71,78,79,80,85,95.根据以往的大数据认定:得分在区间,,,内的分别对应四级、三级、二级、一级.
(1)试求这20筐水果得分的平均数.
(2)用样本估计总体,经销商参考以下两种销售方案进行销售;
方案1:将得分的平均数换算为等级,按换算后的等级出售;
方案2:分等级出售.
不同等级水果的售价如下表所示:
等级
一级
二级
三级
四级
售价(万元/吨)
2
1.8
1.4
1.2
请从经销商的角度,根据售价分析采用哪种销售方案较好,并说明理由.
【答案】(1)(2)采用方案1较好;理由见解析
【解析】(1)这20筐水果得分的平均数为
(2)方案1:由于得分的平均数,
所以可以估计这批水果的销售单价为1.8万元/吨.
方案2:设这批水果售价的平均值为万元/吨,由已知数据得,
得分在内的有17,23,共2个,所以估计四级水果所占比例为,
得分在内的有29,31,34,40,46,50,共6个,所以估计三级水果所占比例为,
得分在内的有51,51,58,62,62,68,71,共7个,所以估计二级水果所占比例为,
得分在内的有78,79,80,85,95,共5个,所以估计一级水果所占比例为,
则(万元/吨).
所以从经销商的角度考虑,采用方案1的售价较高,所以采用方案1较好.
5.(2022·四川省泸县第二中学)为了更好地刺激经济复苏,增加就业岗位,多地政府出台支持“地摊经济”的举措.某市城管委对所在城市约6000个流动商贩进行调查统计,发现所售商品多为小吃、衣帽、果蔬、玩具、饰品等,各类商贩所占比例如图.
(1)该市城管委为了更好地服务百姓,打算从流动商贩经营点中随机抽取100个进行政策问询.如果按照分层抽样的方式随机抽取,请问应抽取小吃类、果蔬类商贩各多少家?
(2)为了更好地了解商户的收入情况,工作人员还对某果蔬经营点最近40天的日收入进行了统计(单位:元),所得频率分布直方图如下.
(ⅰ)请根据频率分布直方图估计该果蔬经营点的日平均收入(同一组中的数据用该组区间的中点值为代表);
(ⅱ)若从该果蔬经营点的日收入超过200元的天数中随机抽取两天,求这两天的日收入至多有一天超过250元的概率.
【答案】(1)小吃类商贩家,果蔬类商贩家(2)(ⅰ)元(ⅱ)
【解析】(1)由题意知,小吃类所占比例为,
按照分层抽样的方式随机抽取,应抽取小吃类商贩(家),
果蔬类商贩(家).
(2)(ⅰ)该果蔬经营点的日平均收入为
元.
(ⅱ)该果蔬经营点的日收入超过200元的天数为:,天,其中超过250元的有2天,记日收入超过250元的2天为,,其余4天为,,,随机抽取两天的所有可能情况为:,,,,,,,,,,,,,,共15种,
其中至多有一天超过250元的对立事件为:共1种.
所以这两天的日收入至少有一天超过250元的概率为.
6.(2023·全国·高三专题练习)在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到以上(含)的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙以往的比赛成绩,并整理得到如下数据(单位:m):
甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,9.35,9.30,9.25;
乙:9.78,9.56,9.51,9.36,9.32,9.23;
丙:9.85,9.65,9.20,9.16.
假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.
(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;
(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E(X);
(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)
【答案】(1)0.4(2)(3)丙
【解析】(1)由频率估计概率可得甲获得优秀的概率为0.4,乙获得优秀的概率为0.5,丙获得优秀的概率为0.5,故答案为0.4
(2)设甲获得优秀为事件A1,乙获得优秀为事件A2,丙获得优秀为事件A3
,
,
,
.
∴X的分布列为
X
0
1
2
3
P
∴
(3)丙夺冠概率估计值最大.
因为铅球比赛无论比赛几次就取最高成绩.比赛一次,丙获得9.85的概率为,甲获得9.80的概率为,乙获得9.78的概率为.并且丙的最高成绩是所有成绩中最高的,比赛次数越多,对丙越有利.
相关试卷
这是一份2024年新高考专用数学第一轮复习讲义一隅三反基础版 6.1 抽样方法及特征数(精练)(基础版)(原卷版+解析版),共24页。
这是一份2024年新高考专用数学第一轮复习讲义一隅三反基础版 6.1 抽样方法及特征数(精讲)(基础版)(原卷版+解析版),共20页。试卷主要包含了抽样方法,特征数,抽样方法与特征数综合等内容,欢迎下载使用。
这是一份新高考数学一轮复习基础巩固6.6 分布列基础(精练)(含解析),共28页。