人教A版 (2019)必修 第二册9.2 用样本估计总体课后作业题
展开典例精讲
考点一 总体取值规律的估计
【例1-1】(2023·河北)从某中学抽取100名学生进行周课余锻炼时长(单位:min)的调查,发现他们的锻炼时长都在50~350min之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示,则直方图中x的值为( )
A.0.0040B.0.0044C.0.0048D.0.0052
【例1-2】(2022·高一课时练习)考查某校高三年级男同学的身高,随机地抽取50名男同学,测得他们的身高(单位:cm)如下表所示:
(1)这组数据的极差为______,数据160的频数为______,数据171的频率为______;
(2)填写下面的频率分布表:
(3)画出该校高三年级男同学身高的频率分布直方图.
【一隅三反】
1.(2022河南南阳·高一校考阶段练习)采用简单随机抽样抽到一个容量为的样本数据,分组后,各组的频数如下表:
已知样本数据在区间内的频率为,则样本数据在区间内的频率为( )
A.B.C.D.
2.(2023春·天津滨海新)随着若卡塔尔世界杯的举办,全民对足球的热爱程度有所提高,组委会在某场比赛结束后,随机抽取了若干名球迷对足球“喜爱度”进行调查评分,把喜爱程度较高的按年龄分成5组,其中第一组:,第二组:,第三组:,第四组:,第五组:,得到如图所示的频率分布直方图,已知第一组与第二组共有32人,第三组中女性球迷有4人,则第三组中男性球迷人数为( )
A.16B.18C.20D.24
3(2022·高一课时练习)某校从高三学生中选取了50名学生参加数学质量检测,成绩(单位:分)分组及各组的频数如下:,2;,3;,10;,15;,12;,8.
(1)列出频率分布表;
(2)画出频率直方图及频率折线图.
4.(2022·高二课时练习)有一个容量为100的样本,数据的分组及各组的频数如下:,6;,16;,18;,22;,20;,10;,8.
(1)列出样本的频率分布表;
(2)绘制频率分布直方图和频率折线图.
考点二 统计图的解读
【例2-1】(2023·河南平顶山·叶县高级中学校联考模拟预测)年月某市星级酒店经营数据统计分析如下图(“同比”指与去年同期相比):
下列说法错误的是( )
A.整体来看,年月该市星级酒店平均房价相对上一年有所提高
B.年月该市星级酒店平均房价的平均数超过元
C.年月这个月中,该市星级酒店在月份的平均房价创下个月来的最高纪录
D.年月该市星级酒店平均房价约为元
【例2-2】(2023·全国·高一专题练习)某高中为促进学生的全面发展,秋季学期合唱团、朗诵会、脱口秀、街舞社、音乐社等五个社团面向1200名高一年级同学招新,每名同学依据自己兴趣爱好最多可参加其中一个,各个社团的人数比例的饼状图如图所示,其中参加音乐社社团的同学有15名,参加脱口秀社团的有20名,则( )
A.高一年级同学参加街舞社社团的同学有120名
B.脱口秀社团的人数占这五个社团总人数的
C.高一年级参加这五个社团总人数占全年级人数的
D.高一年级同学参加这五个社团的总人数为200名
【一隅三反】
1.(2023四川绵阳·)某企业不断自主创新提升技术水平,积极调整企业旗下的甲、乙、丙、丁、戊等种系列产品的结构比例,近年来取得了显著效果.据悉该企业年种系列产品年总收入是年的倍,其中种系列产品的年收入构成比例如图所示.则下列说法错误的是( )
A.年甲系列产品收入比年的多
B.年乙和丙系列产品收入之和比年的企业年总收入还多
C.年丁系列产品收入是年丁系列产品收入的
D.年戊系列产品收入是年戊系列产品收入的倍
2.(2023·四川南充)如图是甲、乙两人高考前次数学模拟成绩的折线图,则下列说法错误的是 ( )
A.甲的数学成绩最后次逐渐升高
B.甲有次考试成绩比乙高
C.甲数学成绩的极差小于乙数学成绩的极差
D.甲的数学成绩在分以上的次数多于乙的数学成绩在分以上的次数
3.(2023·全国·高一专题练习)下图为2012年─2021年我国电子信息制造业企业和工业企业利润总额增速情况折线图,根据该图,下列结论正确的是( )
A.2012年─2021年电子信息制造业企业利润总额逐年递增
B.2012年─2021年工业企业利润总额逐年递增
C.2012年─2017年电子信息制造业企业利润总额均较上一年实现增长,且其增速均快于当年工业企业利润总额增速
D.2012年─2021年工业企业利润总额增速的均值大于电子信息制造业企业利润总额增速的均值
考点三 总体百分位数的估计
【例3-1】(2023·河北)若一组数据为3,4,5,5,6,6,7,8,9,10,则这组数据的75%分位数为( )
A.7.5B.8C.8.5D.9
【例3-2】(2023天津南开)某班60名学生期中考试物理成绩的频率分布直方图如图所示,其中成绩分组区间是,,,,,则该成绩的第70百分位数约为( )
A.73.6B.75.5C.76.2D.78.3
【一隅三反】
1.(2022秋·湖北)高二某班参加了“中国神舟十三号载人飞船航空知识答题”竞赛,10位评委的打分如下:5,6,6,7,7,8,9,9,10,10,则( )
A.该组数据第60百分位数为8B.该组数据第60百分位数为8.5
C.该组数据中位数为7和8D.该组数据中位数为8
2.(2022山东青岛)已知一组数据:1,2,2,3,3,3,4,4,4,4,5,5,5,5,5,6,6,6,6,6,6,则其第70百分位数为( )
A.3B.4C.5D.6
3.(2023·全国·高一专题练习)数据的第63百分位数是,则实数的取值范围是__________.
考点四 总体集中趋势的估计
【例4】(2023·福建)(多选)某大学共有12 000名学生,为了了解学生课外图书阅读情况,该校随机地从全校学生中抽取1000名,统计他们年度阅读书籍的数量,并制成如图所示的频率分布直方图,由此来估计全体学生年度阅读书籍的情况,下列说法中不正确的是(注:同一组数据用该组区间的中点值作为代表)( )
A.该校学生年度阅读书籍本数的中位数为6
B.该校学生年度阅读书籍本数的众数为10
C.该校学生年度阅读书籍本数的平均数为6.88
D.该校学生年度读书不低于8本的人数约为3600
【一隅三反】
1.(20232山东青岛)(多选)某社会调查机构就某地居民的年运动时间情况调查了人,并根据所得数据画了样本的频率分布直方图(如下图).则( )
A.
B.再用分层抽样方法抽出人作进一步调查,则在段应抽出人数是
C.估计该地居民年运动时间的中位数在段内
D.估计该地居民年运动时间的平均数为
2(2022河北省)为了更好地锻炼身体,某人记录了自己4月份(共30天)每天行走的步数,将每天行走的步数(单位:千步)进行如下分组:,,,,,,并作出如图所示的频率分布直方图.
(1)由频率分布直方图估计此人每天行走步数(单位:千步)的众数是( )
A.10B.12.5C.15D.17.5
(2)若按此锻炼习惯,估计此人未来30天中行走不少于2万步的天数是( )
A.3B.5C.6D.10
(3)若同一组数据以这组区间的中点值作代表,估计此人该月平均每天行走的步数(单位:千步)是( )
A.13.5B.14.5C.15.5D.16.5
3.(2023山东东营·高一统考期末)十名工人某天生产同一零件,生产的件数分别是:15,17,14,10,15,17,17,16,14,12,设其中位数为a,众数为b,第一四分位数为c,则a,b,c大小关系为( )
A.B.
C.D.
考点五 总体离散程度的估计
【例5-1】(2023·广东·高三统考学业考试)甲和乙射箭,两人比赛的分数结果如下:
求甲和乙分数的平均数和方差,并说明甲和乙发挥的情况.
【例5-2】(2023·全国·高一专题练习)(多选)有一组样本数据,由这组数据得到新样本数据,则下列结论正确的是( )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
【例5-3】(2023福建龙岩)(多选)某校为调查学生身高情况,按比例分配的分层随机抽样抽取一个容量为50的样本,已知其中男生23人,平均数为170.6,方差为12.59;女生27人,平均数160.6,方差为38.62. 下列说法正确的是( )
A.这个样本的平均数为165.2B.这个样本的方差为51.4862
C.该校女生身高分布比男生集中D.该校男生的身高都比女生高
【一隅三反】
1.(2022秋·宁夏银川·高一校考期末)若数据的平均数为2,方差为3,则下列说法不正确的是( )
A.数据,,…,的平均数为20 B.
C.数据,,…,的标准差为 D.
2.(2023·高一单元测试)某班40人随机分成两组,第一组18人,第二组22人,两组学生在某次数学测验中的成绩如下:
求全班的平均成绩和标准差.(精确到0.01)
3.(2022·高一单元测试)在一次高三年级统一考试中,数学试卷有一道满分10分的选做题,学生可以从,两道题目中任选一题作答.某校有800名高三学生参加了本次考试,为了了解该校学生解答该选做题的得分情况,计划从800名考生的选做题成绩中随机抽取一个容量为10的样本,为此将800名考生选做题的成绩按照随机顺序依次编号为.
(1)若采用随机数法抽样,并按照以下随机数表,以第2行的第18列的数字9为起点,从左向右依次读取数据,每次读取三位随机数,一行读数用完之后接下一行左端,写出样本编号;
(2)求出(1)中抽取的样本编号对应的数的极差与中位数;
(3)若采用分层抽样,按照学生选择A题目或题目,将成绩分为两层,且样本中A题目的成绩有8个,平均数为7,方差为4;样本中题目的成绩有2个,平均数为8,方差为1.用样本估计800名考生的选做题得分的平均数与方差.171
170
165
169
167
167
170
161
164
167
171
163
163
169
166
168
168
165
160
168
158
160
163
167
173
168
169
170
160
164
171
169
167
159
151
168
170
174
160
168
176
157
162
166
158
164
180
179
169
169
身高
频数
频率
分组
频数
甲
乙
分组
平均成绩
标准差
第一组
90
6
第二组
80
4
9.2 用样本估计总体(精讲)思维导图
典例精讲
考点一 总体取值规律的估计
【例1-1】(2023·河北)从某中学抽取100名学生进行周课余锻炼时长(单位:min)的调查,发现他们的锻炼时长都在50~350min之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示,则直方图中x的值为( )
A.0.0040B.0.0044C.0.0048D.0.0052
【答案】B
【解析】因为各组数据频率之和即所有矩形面积之和为,
则,解得.故选:B.
【例1-2】(2022·高一课时练习)考查某校高三年级男同学的身高,随机地抽取50名男同学,测得他们的身高(单位:cm)如下表所示:
(1)这组数据的极差为______,数据160的频数为______,数据171的频率为______;
(2)填写下面的频率分布表:
(3)画出该校高三年级男同学身高的频率分布直方图.
【答案】(1)29,4,0.06
(2)填表见解析
(3)直方图见解析
【解析】(1)因为最高身高为180,最低身高为151,所以极差为:180-151=29;
因为身高为160的人数为4,所以频数为4;
因为身高为171的人数为3,所以频率为;
(2)填表如下:
(3)由频率分布表,可得频率分布直方图,如下:
【一隅三反】
1.(2022河南南阳·高一校考阶段练习)采用简单随机抽样抽到一个容量为的样本数据,分组后,各组的频数如下表:
已知样本数据在区间内的频率为,则样本数据在区间内的频率为( )
A.B.C.D.
【答案】D
【解析】由题意得,=0.35,解得x=4,则y=20-2-3-4-5-2=4,故所求频率为=0.20.故选:D
2.(2023春·天津滨海新)随着若卡塔尔世界杯的举办,全民对足球的热爱程度有所提高,组委会在某场比赛结束后,随机抽取了若干名球迷对足球“喜爱度”进行调查评分,把喜爱程度较高的按年龄分成5组,其中第一组:,第二组:,第三组:,第四组:,第五组:,得到如图所示的频率分布直方图,已知第一组与第二组共有32人,第三组中女性球迷有4人,则第三组中男性球迷人数为( )
A.16B.18C.20D.24
【答案】C
【解析】由题意结合频率分布直方图可得,第一组与第二组的频率之和为,第三组频率为.
因为第一组与第二组共有32人,所以样本容量,
所以,第三组人数为,所以第三组中男性球迷人数为.故选:C.
3(2022·高一课时练习)某校从高三学生中选取了50名学生参加数学质量检测,成绩(单位:分)分组及各组的频数如下:,2;,3;,10;,15;,12;,8.
(1)列出频率分布表;
(2)画出频率直方图及频率折线图.
【答案】(1)表见解析(2)图见解析
【解析】(1)频率分布表如下:
(2)频率直方图及频率折线图如图所示.
4.(2022·高二课时练习)有一个容量为100的样本,数据的分组及各组的频数如下:,6;,16;,18;,22;,20;,10;,8.
(1)列出样本的频率分布表;
(2)绘制频率分布直方图和频率折线图.
【答案】(1)见解析
(2)见解析
【解析】(1)根据已知数据,各段的频数依次为:6,16,18,22,20,10,8.
所以各段的频率依次为:0.06,0.16,0.18,0.22,020,0.10,0.08,
得到频率分布表如下:
(2)各段的频率/组距的值依次为:
,,,,,,,
∴频率直方图和折线图如图所示:
考点二 统计图的解读
【例2-1】(2023·河南平顶山·叶县高级中学校联考模拟预测)年月某市星级酒店经营数据统计分析如下图(“同比”指与去年同期相比):
下列说法错误的是( )
A.整体来看,年月该市星级酒店平均房价相对上一年有所提高
B.年月该市星级酒店平均房价的平均数超过元
C.年月这个月中,该市星级酒店在月份的平均房价创下个月来的最高纪录
D.年月该市星级酒店平均房价约为元
【答案】D
【解析】对于A选项,由图可知,仅有月同比增速为,其余个月同比增速均为正数,故A正确;
对于B选项,由图可知个数据的平均数为
,故B正确;
对于C选项,由图可知这个月的数据中,第个月的最大,故C正确;
对于D选项,由,得年月该市星级酒店平均房价大于元,故D错误.故选:D.
【例2-2】(2023·全国·高一专题练习)某高中为促进学生的全面发展,秋季学期合唱团、朗诵会、脱口秀、街舞社、音乐社等五个社团面向1200名高一年级同学招新,每名同学依据自己兴趣爱好最多可参加其中一个,各个社团的人数比例的饼状图如图所示,其中参加音乐社社团的同学有15名,参加脱口秀社团的有20名,则( )
A.高一年级同学参加街舞社社团的同学有120名
B.脱口秀社团的人数占这五个社团总人数的
C.高一年级参加这五个社团总人数占全年级人数的
D.高一年级同学参加这五个社团的总人数为200名
【答案】B
【解析】参加音乐社社团或者脱口秀社团的同学共有35名,结合扇形图知:其占这五个社团总人数的,
所以高一加这五个社团总人数为名,故AD均错,
脱口秀社团的人数占这五个社团总比为,故B对,
参加这五个社团总人数占全年级人数的占比为,故C错.故选:B
【一隅三反】
1.(2023四川绵阳·)某企业不断自主创新提升技术水平,积极调整企业旗下的甲、乙、丙、丁、戊等种系列产品的结构比例,近年来取得了显著效果.据悉该企业年种系列产品年总收入是年的倍,其中种系列产品的年收入构成比例如图所示.则下列说法错误的是( )
A.年甲系列产品收入比年的多
B.年乙和丙系列产品收入之和比年的企业年总收入还多
C.年丁系列产品收入是年丁系列产品收入的
D.年戊系列产品收入是年戊系列产品收入的倍
【答案】C
【解析】对于A,年甲系列产品收入占了总收入的,年甲系列产品收入占了总收入的,而该企业年种系列产品年总收入是年的倍,故年甲系列产品收入比年的多,正确;
对于B,年乙和丙系列产品收入之和占了总收入的,该企业年种系列产品年总收入是年的倍,故年乙和丙系列产品收入之和比年的企业年总收入还多,正确;
对于C,年丁系列产品收入占了总收入的,年丁系列产品收入占了总收入的,而该企业年种系列产品年总收入是年的倍,故年丁系列产品收入是年丁系列产品收入的,错误;
对于D,年戊系列产品收入占了总收入的,年戊系列产品收入占了总收入的,而该企业年种系列产品年总收入是年的倍,故年戊系列产品收入是年戊系列产品收入的倍,正确;
故选:C
2.(2023·四川南充)如图是甲、乙两人高考前次数学模拟成绩的折线图,则下列说法错误的是 ( )
A.甲的数学成绩最后次逐渐升高
B.甲有次考试成绩比乙高
C.甲数学成绩的极差小于乙数学成绩的极差
D.甲的数学成绩在分以上的次数多于乙的数学成绩在分以上的次数
【答案】B
【解析】对于A,由折线图可知甲的最后三次数学成绩逐渐升高,A对;
对于B,甲有次考试成绩比乙高,B错;
对于C,由折线图可知,甲乙两人的数学成绩的最高成绩接近,
甲的最低成绩为分,乙的最低成绩为分,
因此甲数学成绩的极差小于乙数学成绩的极差,C对;
对于D, 甲的数学成绩在分以上的次数为次,乙的数学成绩在分以上的次数为次,D对.
故选:B.
3.(2023·全国·高一专题练习)下图为2012年─2021年我国电子信息制造业企业和工业企业利润总额增速情况折线图,根据该图,下列结论正确的是( )
A.2012年─2021年电子信息制造业企业利润总额逐年递增
B.2012年─2021年工业企业利润总额逐年递增
C.2012年─2017年电子信息制造业企业利润总额均较上一年实现增长,且其增速均快于当年工业企业利润总额增速
D.2012年─2021年工业企业利润总额增速的均值大于电子信息制造业企业利润总额增速的均值
【答案】C
【解析】对于A,2018年电子信息制造业企业利润总额增速为负数,从2017到2018利润总额下降,故A不正确;
对于B,2015年工业企业利润总额增速为负数,从2014到2015利润总额下降,2019年工业企业利润总额增速为负数,从2018到2019利润总额下降,故B不正确;
对于C,2012年─2017年电子信息制造业企业利润总额增速均为正数,所以利润总额均较上一年实现增长,且其增速均大于当年工业企业利润总额增速,故C正确;
对于D,2012年─2021年工业企业利润总额增速的均值为,2012年─2021年电子信息制造业企业利润总额增速的均值为,,故D不正确.
故选:C
考点三 总体百分位数的估计
【例3-1】(2023·河北)若一组数据为3,4,5,5,6,6,7,8,9,10,则这组数据的75%分位数为( )
A.7.5B.8C.8.5D.9
【答案】B
【解析】因为,所以这组数据的75%分位数为.故选:B.
【例3-2】(2023天津南开)某班60名学生期中考试物理成绩的频率分布直方图如图所示,其中成绩分组区间是,,,,,则该成绩的第70百分位数约为( )
A.73.6B.75.5C.76.2D.78.3
【答案】D
【解析】由题意可求得,则对应的频率为,
对应的频率为,,所以第70百分位数在之间;
即第70百分位数为.故选:D.
【一隅三反】
1.(2022秋·湖北)高二某班参加了“中国神舟十三号载人飞船航空知识答题”竞赛,10位评委的打分如下:5,6,6,7,7,8,9,9,10,10,则( )
A.该组数据第60百分位数为8B.该组数据第60百分位数为8.5
C.该组数据中位数为7和8D.该组数据中位数为8
【答案】B
【解析】这组数据从小到大排为:5,6,6,7,7,8,9,9,10,10
则,第60百分位数为,故A不符合,B符合;
中位数为:,故C,D均不符合.故选:B.
2.(2022山东青岛)已知一组数据:1,2,2,3,3,3,4,4,4,4,5,5,5,5,5,6,6,6,6,6,6,则其第70百分位数为( )
A.3B.4C.5D.6
【答案】C
【解析】第1步,按从小到大排列原始数据.
第2步,计算 .
第3步,因i不是整数,故取大于14.7的比邻整数为15,则第70百分位数为第15项数据5;
故选:C
3.(2023·全国·高一专题练习)数据的第63百分位数是,则实数的取值范围是__________.
【答案】
【解析】,故数据的第63百分位数是第个数据为,故.
故答案为:
考点四 总体集中趋势的估计
【例4】(2023·福建)(多选)某大学共有12 000名学生,为了了解学生课外图书阅读情况,该校随机地从全校学生中抽取1000名,统计他们年度阅读书籍的数量,并制成如图所示的频率分布直方图,由此来估计全体学生年度阅读书籍的情况,下列说法中不正确的是(注:同一组数据用该组区间的中点值作为代表)( )
A.该校学生年度阅读书籍本数的中位数为6
B.该校学生年度阅读书籍本数的众数为10
C.该校学生年度阅读书籍本数的平均数为6.88
D.该校学生年度读书不低于8本的人数约为3600
【答案】ABD
【解析】对于A:因为,所以中位数在内,
设中位数为,则,解得,故A错误.
对于B:由图可知,众数在内,且众数为,故B错误.
对于C:平均数为,故C正确.
对于D:由图可知,该校抽取的学生年度读书不低于8本的频率之和为,
所以该校学生年度读书不低于8本的人数约为,故D错误.
故选:ABD.
【一隅三反】
1.(20232山东青岛)(多选)某社会调查机构就某地居民的年运动时间情况调查了人,并根据所得数据画了样本的频率分布直方图(如下图).则( )
A.
B.再用分层抽样方法抽出人作进一步调查,则在段应抽出人数是
C.估计该地居民年运动时间的中位数在段内
D.估计该地居民年运动时间的平均数为
【答案】AC
【解析】对于A,由,得,
故A正确;
对于B,根据频率分布直方图可得,年活动时间在段的频率为,所以抽出人中该段人数为,故B不正确;
对于C,前两个小矩形面积之和为,
前三个小矩形面积之和为,
由中位数是小矩形面积之和累计为0.5的值,所以中位数在段内,故C正确;
对于D,该地居民年运动时间的平均数约为
,故D不正确.故选:AC
2(2022河北省)为了更好地锻炼身体,某人记录了自己4月份(共30天)每天行走的步数,将每天行走的步数(单位:千步)进行如下分组:,,,,,,并作出如图所示的频率分布直方图.
(1)由频率分布直方图估计此人每天行走步数(单位:千步)的众数是( )
A.10B.12.5C.15D.17.5
(2)若按此锻炼习惯,估计此人未来30天中行走不少于2万步的天数是( )
A.3B.5C.6D.10
(3)若同一组数据以这组区间的中点值作代表,估计此人该月平均每天行走的步数(单位:千步)是( )
A.13.5B.14.5C.15.5D.16.5
【答案】(1)B(2)C(3)B
【解析】(1)每天行走的步数在区间[0,5)内的频率为0.01×5=0.05,
在区间[5,10)内的频率为0.04×5=0.2,
在区间[10,15)内的频率为0.06×5=0.3,
在区间[15,20)内的频率为0.05×5=0.25,
在区间[20,25)内的频率为0.03×5=0.15,
在区间[25,30]内的频率为0.01×5=0.05.
因为每天行走的步数在区间[10,15)内的频率最大,
所以每天行走步数的众数在区间[10,15)内,
所以每天行走步数的众数是12.5.
故选:B.
(2)由(1)知,因为每天行走不少于2万步的频率为0.15+0.05=0.2,
所以估计此人未来30天中行走不少于2万步的天数是30×0.2=6.
故选:C.
(3)由(1)知,估计此人该月平均每天行走的步数为
2.5×0.05+7.5×0.2+12.5×0.3+17.5×0.25+22.5×0.15+27.5×0.05=14.5.
故选:B.
3.(2023山东东营·高一统考期末)十名工人某天生产同一零件,生产的件数分别是:15,17,14,10,15,17,17,16,14,12,设其中位数为a,众数为b,第一四分位数为c,则a,b,c大小关系为( )
A.B.
C.D.
【答案】B
【解析】对生产件数由小到大排序可得:10,12,14,14,15,15,16,17,17,17,所以中位数众数为17,,所以第一四分位数为第三个数,即14,所以,故选:B.
考点五 总体离散程度的估计
【例5-1】(2023·广东·高三统考学业考试)甲和乙射箭,两人比赛的分数结果如下:
求甲和乙分数的平均数和方差,并说明甲和乙发挥的情况.
【答案】答案见解析
【解析】甲分数的平均数为,
方差为,
乙分数的平均数为,
方差为,
所以,,,故甲乙分数的平均数相同,但甲比乙发挥更为稳定.
【例5-2】(2023·全国·高一专题练习)(多选)有一组样本数据,由这组数据得到新样本数据,则下列结论正确的是( )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
【答案】CD
【解析】数据的平均数为,
新数据的平均数为
,故A错误;
若数据的中位数为,
则新数据的中位数为,故B错误;
数据的标准差为
,
新数据的标准差为
,故C正确;
若数据中的最大数为最小数为,则极差为,
则数据的极差为,故D正确,
故选:CD.
【例5-3】(2023福建龙岩)(多选)某校为调查学生身高情况,按比例分配的分层随机抽样抽取一个容量为50的样本,已知其中男生23人,平均数为170.6,方差为12.59;女生27人,平均数160.6,方差为38.62. 下列说法正确的是( )
A.这个样本的平均数为165.2B.这个样本的方差为51.4862
C.该校女生身高分布比男生集中D.该校男生的身高都比女生高
【答案】AB
【解析】先求样本的平均数:
再求样本的方差:.所以A,B均正确;
因为,所以该校男生身高分布比女生集中,所以C不正确;
样本数据无法得出男生的身高都比女生高,所以D不正确.故选:AB.
【一隅三反】
1.(2022秋·宁夏银川·高一校考期末)若数据的平均数为2,方差为3,则下列说法不正确的是( )
A.数据,,…,的平均数为20B.
C.数据,,…,的标准差为D.
【答案】A
【解析】对于A,若数据的平均数为2,则数据,,,的平均数为,A错误;
对于B,数据的平均数为2,则 , B正确;
对于C,数据,,,的方差为,故标准差为,C正确;
对于D,由于,
数据的平均数为2,方差为3,则有,
变形可得,D正确.
故选:A
2.(2023·高一单元测试)某班40人随机分成两组,第一组18人,第二组22人,两组学生在某次数学测验中的成绩如下:
求全班的平均成绩和标准差.(精确到0.01)
【答案】平均数为84.5;标准差为7.05.
【解析】设第一组人数为,第二组人数为,第一组学生数学测试的平均成绩为,第二组学生数学测试的平均数为,全班所有学生的数学测试的平均成绩为,第一组学生数学测试的方差为,第二组学生数学测试的方差为,全班所有学生的数学测试的方差为,
则,
所以全班所有学生的数学测试的平均成绩
所以,
全班所有学生的数学测试的方差,
所以,
所以全班所有学生的数学测试的标准差为.
3.(2022·高一单元测试)在一次高三年级统一考试中,数学试卷有一道满分10分的选做题,学生可以从,两道题目中任选一题作答.某校有800名高三学生参加了本次考试,为了了解该校学生解答该选做题的得分情况,计划从800名考生的选做题成绩中随机抽取一个容量为10的样本,为此将800名考生选做题的成绩按照随机顺序依次编号为.
(1)若采用随机数法抽样,并按照以下随机数表,以第2行的第18列的数字9为起点,从左向右依次读取数据,每次读取三位随机数,一行读数用完之后接下一行左端,写出样本编号;
(2)求出(1)中抽取的样本编号对应的数的极差与中位数;
(3)若采用分层抽样,按照学生选择A题目或题目,将成绩分为两层,且样本中A题目的成绩有8个,平均数为7,方差为4;样本中题目的成绩有2个,平均数为8,方差为1.用样本估计800名考生的选做题得分的平均数与方差.
【答案】(1)617,162,506,512,770,687,554,647,547,332
(2)
(3)00名考生的选做题得分的平均数的估计值为7.2;800名考生的选做题得分的方差的估计值为3.56
【解析】(1)根据题意,读出的编号依次是:
964(超界),617,162,991(超界),506,512,916(超界),935(超界),805(超界),770,951(超界),512(重复),687,858(超界),554,876(超界),647,547,332.故抽取的样本编号为617,162,506,512,770,687,554,647,547,332;
(2)将(1)中有效的编号从小到大排列得
162,332,506,512,547,554,617,647,687,770.
所以(1)中抽取的样本编号对应的数的极差为,
中位数为;
(3)设A题目的8个成绩为:,B题目的2个成绩为.
则,;
,.
故800名考生的选做题得分的平均数的估计值为:,
800名考生的选做题得分的方差的估计值为:. 171
170
165
169
167
167
170
161
164
167
171
163
163
169
166
168
168
165
160
168
158
160
163
167
173
168
169
170
160
164
171
169
167
159
151
168
170
174
160
168
176
157
162
166
158
164
180
179
169
169
身高
频数
频率
身高
频数
频率
1
0.02
0
0
4
0.08
6
0.12
8
0.16
13
0.26
13
0.26
2
0.04
1
0.02
2
0.04
分组
频数
分组
频数
频率
2
0.04
3
0.06
10
0.20
15
0.30
12
0.24
8
0.16
合计
50
1
分组
频数
频率
6
0.06
16
0.16
18
0.18
22
0.22
20
0.20
10
0.10
8
0.08
合计
100
1
甲
乙
分组
平均成绩
标准差
第一组
90
6
第二组
80
4
高中数学人教A版 (2019)必修 第二册10.3 频率与概率达标测试: 这是一份高中数学人教A版 (2019)必修 第二册<a href="/sx/tb_c4000316_t7/?tag_id=28" target="_blank">10.3 频率与概率达标测试</a>,共18页。试卷主要包含了频率与概率概念的辨析,频率与概率的计算,随机模拟,综合运用等内容,欢迎下载使用。
高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体练习题: 这是一份高中数学人教A版 (2019)必修 第二册<a href="/sx/tb_c4000310_t7/?tag_id=28" target="_blank">9.2 用样本估计总体练习题</a>,共49页。
数学人教A版 (2019)9.1 随机抽样综合训练题: 这是一份数学人教A版 (2019)<a href="/sx/tb_c4000309_t7/?tag_id=28" target="_blank">9.1 随机抽样综合训练题</a>,共19页。试卷主要包含了概念的辨析,简单随机抽样,分层随机抽样,综合运用等内容,欢迎下载使用。