2020_2021学年高中数学课时分层作业13用样本的数字特征估计总体的数字特征新人教A版必修3 练习
展开课时分层作业(十三) 用样本的数字特征估计总体的数字特征
(建议用时:60分钟)
一、选择题
1.下列说法中正确的个数为( )
①数据的极差越小,样本数据分布越集中、稳定;
②数据的平均数越小,样本数据分布越集中、稳定;
③数据的标准差越小,样本数据分布越集中、稳定;
④数据的方差越小,样本数据分布越集中、稳定.
A.1 B.2
C.3 D.4
C [由数据的极差、标准差、方差的定义可知,它们都可以影响样本数据的分布和稳定性,而数据的平均数则与之无关,故②不正确,①③④正确.]
2.16位参加百米半决赛同学的成绩各不相同,按成绩取前8位进入决赛.如果小刘知道了自己的成绩后,要判断能否进入决赛,则其他15位同学成绩的下列数据中,能使他得出结论的是( )
A.平均数 B.众数 C.中位数 D.方差
C [判断是不是能进入决赛,只要判断是不是前8位,所以只要知道其他15位同学的成绩中是不是有8位高于他,也就是把其他15位同学的成绩排列后看第8位的成绩即可,小刘的成绩高于这个成绩就能进入决赛,低于这个成绩就不能进入决赛,第8位的成绩就是这15位同学成绩的中位数.]
3.在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减8后所得数据,则A,B两样本的下列数字特征对应相同的是( )
A.平均数 B.标准差
C.众数 D.中位数
B [A样本数据为42,43,46,52,42,50,其平均数为=,众数为42,中位数为=,由题可得,B样本数据为34,35,38,44,34,42,其平均数为=,众数为34,中位数为=,所以A,B两样本的下列数字特征:平均数、众数、中位数都不同.故选B.]
4.对某小区100户居民的月均用水量进行统计,得到样本的频率分布直方图如图所示,则估计此样本的众数、中位数分别为( )
A.2.25,2.5 B.2.25,2.02
C.2,2.5 D.2.5,2.25
B [众数是指样本中出现频率最高的数,在频率分布直方图中通常取该组区间的中点,所以众数为=2.25.中位数是频率为0.5的分界点,由频率分布直方图,可知前4组的频率和为(0.08+0.16+0.30+0.44)×0.5=0.49,因此中位数出现在第5组,设中位数为x,则(x-2)×0.5=0.01,解得x=2.02,故选B.]
5.某班有50名学生,男女人数不相等.随机询问了该班5名男生和5名女生的某次数学测试成绩,用茎叶图记录如图所示,则下列说法一定正确的是( )
A.这5名男生成绩的标准差大于这5名女生成绩的标准差
B.这5名男生成绩的中位数大于这5名女生成绩的中位数
C.该班男生成绩的平均数大于该班女生成绩的平均数
D.这种抽样方法是一种分层抽样
A [5名男生成绩的平均数为=90,
5名女生成绩的平均数为=91,
这5名男生成绩的方差为×[(-4)2+(-2)2+02+22+42]=8,女生成绩的方差为×[(-3)2+(-3)2+22+22+22]=6,男生方差大于女生方差,所以男生标准差大于女生标准差,所以A对;
这5名男生成绩的中位数是90, 5名女生成绩的中位数为93,所以B错;
该班男生和女生成绩的平均数可通过样本估计,但不能通过样本计算得到平均数准确值,所以C错;若抽样方法是分层抽样,因为男生女生不等,所以分别抽取的人数不等,所以D错.故选A.]
二、填空题
6.如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,
则甲、乙两人这几场比赛得分的中位数之和是________.
64 [由茎叶图知,甲的中位数为28,乙的中位数为36,所以甲、乙二人得分的中位数之和为64.]
7.一组数据的平均数是28,方差是4,若将这组数据中的每一个数据都加上20,得到一组新数据,则所得新数据的平均数是________,方差是________.
48 4 [设该组数据为x1,x2,…,xn;则新数据为x1+20,x2+20,…,xn+20.
因为==28,
所以′==20+28=48.
因为s2=[(x1-)2+(x2-)2+…+(xn-)2],
所以s′2={[x1+20-(+20)]2+[x2+20-(+20)]2+…+[xn+20-(+20)]2}=s2=4.]
8.已知一组数据按从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么数据的众数是________,平均数是________.
6 5 [∵中位数为5,∴=5,即x=6.
∴该组数据的众数为6,平均数为=5.]
三、解答题
9.某工厂人员及月工资构成如下:
人员 | 经理 | 管理 人员 | 高级 技工 | 工人 | 学徒 | 合计 |
月工 资(元) | 22 000 | 2 500 | 2 200 | 2 000 | 1 000 | 29 700 |
人数 | 1 | 6 | 5 | 10 | 1 | 23 |
合计 | 22 000 | 15 000 | 11 000 | 20 000 | 1 000 | 69 000 |
(1)指出这个表格中月工资的众数、中位数、平均数;
(2)这个表格中,平均数能客观地反映该工厂的月工资水平吗?为什么?
[解] (1)由表格可知,众数为2 000元.
把23个数据按从小到大(或从大到小)的顺序排列,排在中间的数应是第12个数,其值为2 200,故中位数为2 200元.
平均数为69 000÷23=3 000(元).
(2)虽然平均数为3 000元,但由表格中所列出的数据可见,只有经理的工资在平均数以上,其余人的工资都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.
10.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:
甲 | 27 | 38 | 30 | 37 | 35 | 31 |
乙 | 33 | 29 | 38 | 34 | 28 | 36 |
(1)画出茎叶图,由茎叶图你能获得哪些信息?
(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、极差、方差,并判断选谁参加比赛比较合适?
[解] (1)画茎叶图如下:中间数为数据的十位数.
从茎叶图上看,甲、乙的得分情况都是分布均匀的,只是乙更好一些.乙发挥比较稳定,总体情况比甲好.
(2)甲==33.
乙==33.
s=[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]≈15.67.
s=[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]≈12.67.
甲的极差为11,乙的极差为10.
综合比较以上数据可知,选乙参加比赛较合适.
1.甲、乙两人在相同的条件下投篮5轮,每轮甲、乙各投篮10次,投篮命中次数的情况如图所示(实线为甲的折线图,虚线为乙的折线图),则以下说法错误的是( )
A.甲投篮命中次数的众数比乙的小
B.甲投篮命中次数的平均数比乙的小
C.甲投篮命中次数的中位数比乙的大
D.甲投篮命中的成绩比乙的稳定
B [由折线图可知,甲投篮5轮,命中的次数分别为5,8,6,8,8,乙投篮5轮,命中的次数分别为3,7,9,5,9,
则甲投篮命中次数的众数为8,乙投篮命中次数的众数为9,所以A正确;
甲投篮命中次数的平均数为7,乙投篮命中次数的平均数为6.6,所以B不正确;
甲投篮命中次数的中位数为8,乙投篮命中次数的中位数为7,所以C正确;
甲投篮命中次数的数据集中在平均数的左右,方差较小,乙投篮命中次数的数据比较分散,方差较大,所以甲的成绩更稳定一些,所以D正确.故选B.]
2. 在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有引起大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:总体均值为3,中位数为4
B.乙地:总体均值为1,总体方差大于0
C.丙地:中位数为2,众数为3
D.丁地:总体均值为2,总体方差为3
D [根据信息可知,连续10天内,每天新增的疑似病例不能超过7人,选项A中,中位数为4,可能存在大于7的数;同理,在选项C中也有可能;选项B中的总体方差大于0,叙述不明确,如果方差太大,也有可能存在大于7的数;选项D中,根据方差公式,如果有大于7的数存在,那么方差不可能为3.故选D.]
3.某市有15个旅游景点,经计算,2019国庆黄金周期间各个景点的旅游人数平均为20万,标准差为s,后来经核实,发现甲、乙两处景点统计的人数有误,甲景点实际为20万,被误统计为15万,乙景点实际为18万,被误统计成23万;更正后重新计算,得到标准差为s1,则s与s1的大小关系为( )
A.s=s1 B.s<s1
C.s>s1 D.不能确定
C [由已知,两次统计所得的旅游人数总数没有变,即两次统计的各景点旅游人数的平均数是相同的,设为,
则s=,
s1=.
若比较s与s1的大小,只需比较(15-)2+(23-)2与(20-)2+(18-)2的大小即可.而(15-)2+(23-)2=754-76+22,(20-)2+(18-)2=724-76+22,所以(15-)2+(23-)2>(20-)2+(18-)2.从而s>s1.]
4.若40个数据的平方和是56,平均数是,则这组数据的方差是________,标准差是________.
0.9 [设这40个数据为xi(i=1,2,…,40),平均数为.
则s2=×[(x1-)2+(x2-)2+…+(x40-)2]
=[x+x+…+x+402-2(x1+x2+…+x40)]
=
=×
=0.9.
∴s===.]
5.某地区100位居民的人均月用水量(单位:t)的分组及各组的频数如下:
[0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22;
[2,2.5),25;[2.5,3),14;[3,3.5),6;[3.5,4),4;
[4,4.5],2.
(1)列出样本的频率分布表;
(2)画出频率分布直方图,并根据直方图估计这组数据的平均数、中位数、众数;
(3)当地政府制定了人均月用水量为3t的标准,若超出标准加倍收费,当地政府说,85%以上的居民不超过这个标准,这个解释对吗?为什么?
[解] (1)频率分布表
分组 | 频数 | 频率 |
[0,0.5) | 4 | 0.04 |
[0.5,1) | 8 | 0.08 |
[1,1.5) | 15 | 0.15 |
[1.5,2) | 22 | 0.22 |
[2,2.5) | 25 | 0.25 |
[2.5,3) | 14 | 0.14 |
[3,3.5) | 6 | 0.06 |
[3.5,4) | 4 | 0.04 |
[4,4.5] | 2 | 0.02 |
合计 | 100 | 1 |
(2)频率分布直方图如图:
众数:2.25,中位数:2.02,平均数:2.02.
(3)人均月用水量在3t以上的居民所占的比例为6%+4%+2%=12%,即大约有12%的居民月用水量在3t以上,88%的居民月用水量在3t以下,因此政府的解释是正确的.