高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体精品习题
展开
这是一份高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体精品习题,文件包含人教A版高中数学必修第二册同步讲练测92用样本估计总体教师版docx、人教A版高中数学必修第二册同步讲练测92用样本估计总体教师版pdf、人教A版高中数学必修第二册同步讲练测92用样本估计总体原卷版docx、人教A版高中数学必修第二册同步讲练测92用样本估计总体原卷版pdf等4份试卷配套教学资源,其中试卷共135页, 欢迎下载使用。
(一)作频率分布直方图的步骤
1.求极差:极差为一组数据中最大值与最小值的差.
2.决定组距与组数
将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.
3.将数据分组
4.列频率分布表:各小组的频率=eq \f(小组频数,样本容量).
5.画频率分布直方图
纵轴表示eq \f(频率,组距),eq \f(频率,组距)实际上就是频率分布直方图中各小长方形的高度,
小长方形的面积=组距×eq \f(频率,组距)=频率.
(二)频率分布直方图的性质
1.因为小矩形的面积=组距×eq \f(频率,组距)=频率,所以各小矩形的面积表示相应各组的频率.
这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
2.在频率分布直方图中,各小矩形的面积之和等于1.
3.eq \f(频数,相应的频率)=样本容量.
二.常见统计图表的特点与区别
1.扇形图:用于直观描述各类数据占总数的比例,易于显示每组数据相对于总数的大小
2.条形图:主要用于直观描述不同类别或分组数据的频数和频率,适用于描述离散型数据。
3.直方图主要用于直观描述不同类别或分组数据的频数和频率,直方图适用于描述连续型数据.
4.折线图主要用于描述数据随时间的变化趋势.
三.总体百分位数的估计
1.百分位数定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.常用的百分位数
(1)四分位数:第25百分位数,第50百分位数,第75百分位数.
(2)其它常用的百分位数:第1百分位数,第5百分位数,第95百分位数,第99百分位数.
3.计算一组n个数据的第p百分位数的一般步骤如下:
第1步,按从小到大排列原始数据;
第2步,计算i=n×p%;
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
四.总体集中趋势的估计
(一)众数、中位数、平均数
1.众数:一组数据中出现次数最多的数.
2.中位数:
如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称xn+1为这组数的中位数;
如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称eq \f(xn+xn+1,2)为这组数的中位数.
3.平均数:如果n个数x1,x2,…,xn,那么eq \x\t(x)=eq \f(1,n)(x1+x2+…+xn)叫做这n个数的平均数.
(二)频率分布直方图中平均数、中位数、众数的求法
(1)众数:取最高小长方形底边中点的横坐标作为众数.
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交
点的横坐标称为中位数.
(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形
底边中点的横坐标之和.
五.总体离散程度的估计
1.假设一组数据为x1,x2,…xn,则这组数据的平均数=eq \f(x1+x2+…+xn,n),方差为
标准差
2.如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则称为总体方差,S=eq \r(S2)为总体标准差.
3.标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
4.分层随机抽样的方差
设样本中不同层的平均数分别为eq \x\t(x)1,eq \x\t(x)2,…,eq \x\t(x)n,方差分别为seq \\al(2,1),seq \\al(2,2),…,seq \\al(2,n),相应的权重分别为w1,w2,…,wn,则这个样本的方差为
知识简用
题型一 总体取值规律的估计
【例1-1】在2022年某地销售的汽车中随机选取1000台,对销售价格与销售数量进行统计,这1000台车辆的销售价格都不小于5万元,小于30万元,将销售价格分为五组:(单位:万元).统计后制成的频率分布直方图如图所示.在选取的1000台汽车中,销售价格在内的车辆台数为( )
A.800B.600C.700D.750
【答案】C
【解析】由频率分布直方图知,销售价格在内的频率是,
所以1000台汽车中,销售价格在内的车辆台数为.故选:C
【例1-2】从某小区抽取100户居民用户进行月用电调查,发现他们的用电量都在之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.在被调查的用户中,用电量落在区间内的户数为( )
A.45B.46C.54D.70
【答案】B
【解析】由题知,这些用户中,用电量落在区间内的频率为,
则用电量落在区间内的户数为.故选:B
【例1-3】党的二十大报告指出:“全面提高人才自主培养质量,着力造就拔尖创新人才,聚天下英才而用之.”某区域教育部门为提高学生的创新能力,组织了200名学生参与研究性学习,每人仅参加1个课题组,参加各课题组的人数占比的扇形统计图如图所示,则参加数学类的人数比参加理化类的人数多( )
A.16B.30C.32D.62
【答案】C
【解析】由扇形统计图可知参加数学类的人数为,参加理化类的人数为,
故参加数学类的人数比参加理化类的人数多,故选:C
【例1-4】下图是国家统计局发布的我国最近10年的人口出生率(单位:‰),根据下图,则( )
A.这10年的人口出生率逐年下降
B.这10年的人口出生率超过12‰的年数所占比例等于45%
C.这10年的人口出生率的80%分位数为13.57‰
D.这10年的人口出生率的平均数小于12‰
【答案】D
【解析】对于A:这10年的人口出生率有升有降,故A错误;
对于B:这10年的人口出生率超过12‰的年数所占比例等于50%,故B错误;
对于C:由于,则这10年的人口出生率的80%分位数为从小到大第8个和第9个数的平均数,故C错误;对于D:这10年的人口出生率的平均数为 小于12‰,故D正确;
故选:D.
题型二 总体百位分数的估计
【例2-1】某地有9个快递收件点,在某天接收到的快递个数分别为360,284,290,300,402,188,240,260,288,则这组数据的第72百分位数为( )
A.290B.295C.300D.330
【答案】C
【解析】将这组数据按照从小到大的顺序排列得188,240,260,284,288,290,300,360,402,
因为,所以这组数据的第72百分位数为300.故选:C
【例2-2】《中国居民膳食指南(2022)》数据显示,6岁至17岁儿童青少年超重肥胖率高达19.0%.为了解某地中学生的体重情况,某机构从该地中学生中随机抽取100名学生,测量他们的体重(单位:千克),根据测量数据,按分成六组,得到的频率分布直方图如图所示.根据调查的数据,估计该地中学生体重的第75百分位数是( )
A.55B.57.25C.58.75D.60
【答案】C
【解析】因为,所以该地中学生体重的第75百分位数在内,设第75百分位数为m,则,解得.故选:C
题型三 总体集中趋势的估计
【例3-1】军训时,甲、乙两名同学进行射击比赛,共比赛10场,每场比赛各射击四次,且用每场击中环数之和作为该场比赛的成绩.数学老师将甲、乙两名同学的10场比赛成绩绘成如图所示的茎叶图(成绩的十位数为“茎”,个位数为“叶”),并给出下列三个结论:
①甲的成绩的极差是29;②乙的成绩的中位数是18;③乙的成绩的众数是22.
则三个结论中,正确结论个数为( ).
A.3B.2C.1D.0
【答案】B
【解析】由茎叶图可知甲的成绩的极差是,故①正确;
乙的成绩按从小到大的顺序为,
所以乙的成绩的中位数是,众数是,故②错误,③正确.所以正确的个数为2个.故选:B.
【例3-2】某公司为了解用户对其产品的满意度,从使用该产品的用户中随机调查了100个用户,根据用户对产品的满意度评分,得到如图所示的用户满意度评分的频率分布直方图.若用户满意度评分的中位数、众数、平均数分别为a,b,c,则( )
A.B.C.D.
【答案】B
【解析】由频率分布直方图可知众数为65,即,由表可知,组距为10,
所以平均数为:,故,记中位数为,
则有:,解得:,即,所以.故选:B.
【例3-3】(多选)《国家学生体质健康标准》是国家学校教育工作的基础性指导文件和教育质量基本标准,它适用于全日制普通小学、初中、普通高中、中等职业学校、普通高等学校的学生.某高校组织名大一新生进行体质健康测试,现抽查200名大一新生的体测成绩,得到如图所示的频率分布直方图,其中分组区间为,,,,,.则下列说法正确的是( )
A.估计该样本的众数是
B.估计该样本的均值是
C.估计该样本的中位数是
D.若测试成绩达到分方可参加评奖,则有资格参加评奖的大一新生约为人
【答案】ACD
【解析】对于A项,由频率分布直方图可得,最高小矩形为,所以可估计该样本的众数是,故A项正确;对于B项,由频率分布直方图,可估计该样本的均值是,故B项错误;对于C项,由频率分布直方图可得,成绩在之间的频率为,在之间的频率为,
所以可估计该样本的中位数在内.设中位数为,则由可得,,故C项正确;对于D项,由频率分布直方图可得,测试成绩达到分的频率为,所以可估计有资格参加评奖的大一新生约为人,故D项正确.故选:ACD.
题型四 总体离散程度的估计
【例4-1】两名运动员在某次测试的6次成绩如图所示,则两人平均数与方差的关系是( )
A.甲的平均数大,方差小B.平均数相等,甲方差大
C.平均数相等,甲方差小D.平均数和方差都相等
【答案】C
【解析】由茎叶图可看出甲的平均数是,
乙的平均数是,两组数据的平均数相等.
甲的方差是,
乙的方差是,甲的方差小于乙的方差.
故选:C.
【例4-2】(多选)为响应自己城市倡导的低碳出行,小李上班可以选择公交车、自行车两种交通工具,他分别记录了100次坐公交车和骑车所用时间(单位:分钟),得到下列两个频率分布直方图:基于以上统计信息,则( )
A.骑车时间的中位数的估计值是22分钟
B.坐公交车时间的40%分位数的估计值是19分钟
C.坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值
D.坐公交车时间的方差的估计值小于骑车时间的方差的估计值
【答案】BC
【解析】对A:设骑车时间的中位数为,则,解得,
故骑车时间的中位数的估计值是分钟,A错误;
对B:设坐公交车时间的40%分位数为,则,解得,
故坐公交车时间的40%分位数的估计值是19分钟,B正确;
对C:坐公交车时间的平均数,
骑车时间的平均数,
∵,故坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值,C正确;
对D:坐公交车时间的方差
骑车时间的方差,
∵,故坐公交车时间的方差的估计值大于骑车时间的方差的估计值,D错误.
故选:BC.
【例4-3】甲、乙两名同学12次考试中数学成绩的茎叶图如图所示,则下列说法正确的是( )
A.甲同学比乙同学发挥稳定,且平均成绩也比乙同学高
B.甲同学比乙同学发挥稳定,但平均成绩比乙同学低
C.乙同学比甲同学发挥稳定,且平均成绩也比甲同学高
D.乙同学比甲同学发挥稳定,但平均成绩比甲同学低
【答案】C
【解析】由茎叶图中的数据,得甲同学次考试成绩的平均数是.
乙同学次考试成绩的平均数是,
甲同学数学成绩比较分散,乙同学数学成绩相对集中,所以乙同学比甲同学发挥稳定,且平均成绩比甲同学高.故选:C
【例4-4】经过简单随机抽样获得的样本数据为,且数据的平均数为,方差为,则下列说法正确的是( )
A.若数据,方差,则所有的数据都为0
B.若数据,的平均数为,则的平均数为6
C.若数据,的方差为,则的方差为12
D.若数据,的分位数为90,则可以估计总体中有至少有的数据不大于90
【答案】C
【解析】对于,数据的方差时,说明所有的数据都相等,但不一定为,故选项错误;
对于,数据,的平均数为,数据的平均数为,故选项错误;
对于,数据的方差为,数据的方差为,故选项正确;
对于,数据,的分位数为90,则可以估计总体中有至少有的数据大于90,故选项错误,
故选:.
9.2 用样本估计总体(精讲)思维导图
典例精讲
考点一 总体取值规律的估计
【例1-1】从某中学抽取100名学生进行周课余锻炼时长(单位:min)的调查,发现他们的锻炼时长都在50~350min之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示,则直方图中x的值为( )
A.0.0040B.0.0044C.0.0048D.0.0052
【答案】B
【解析】因为各组数据频率之和即所有矩形面积之和为,
则,解得.故选:B.
【例1-2】考查某校高三年级男同学的身高,随机地抽取50名男同学,测得他们的身高(单位:cm)如下表所示:
(1)这组数据的极差为______,数据160的频数为______,数据171的频率为______;
(2)填写下面的频率分布表:
(3)画出该校高三年级男同学身高的频率分布直方图.
【答案】(1)29,4,0.06(2)填表见解析(3)直方图见解析
【解析】(1)因为最高身高为180,最低身高为151,所以极差为:180-151=29;
因为身高为160的人数为4,所以频数为4;因为身高为171的人数为3,所以频率为;
(2)填表如下:
(3)由频率分布表,可得频率分布直方图,如下:
【一隅三反】
1.采用简单随机抽样抽到一个容量为的样本数据,分组后,各组的频数如下表:
已知样本数据在区间内的频率为,则样本数据在区间内的频率为( )
A.B.C.D.
【答案】D
【解析】由题意得,=0.35,解得x=4,则y=20-2-3-4-5-2=4,故所求频率为=0.20.故选:D
2.随着若卡塔尔世界杯的举办,全民对足球的热爱程度有所提高,组委会在某场比赛结束后,随机抽取了若干名球迷对足球“喜爱度”进行调查评分,把喜爱程度较高的按年龄分成5组,其中第一组:,第二组:,第三组:,第四组:,第五组:,得到如图所示的频率分布直方图,已知第一组与第二组共有32人,第三组中女性球迷有4人,则第三组中男性球迷人数为( )
A.16B.18C.20D.24
【答案】C
【解析】由题意结合频率分布直方图可得,第一组与第二组的频率之和为,第三组频率为.因为第一组与第二组共有32人,所以样本容量,所以,第三组人数为,所以第三组中男性球迷人数为.故选:C.
3某校从高三学生中选取了50名学生参加数学质量检测,成绩(单位:分)分组及各组的频数如下:,2;,3;,10;,15;,12;,8.
(1)列出频率分布表;
(2)画出频率直方图及频率折线图.
【答案】(1)表见解析(2)图见解析
【解析】(1)频率分布表如下:
(2)频率直方图及频率折线图如图所示.
4.有一个容量为100的样本,数据的分组及各组的频数如下:,6;,16;,18;,22;,20;,10;,8.
(1)列出样本的频率分布表;
(2)绘制频率分布直方图和频率折线图.
【解析】(1)根据已知数据,各段的频数依次为:6,16,18,22,20,10,8.
所以各段的频率依次为:0.06,0.16,0.18,0.22,020,0.10,0.08,得到频率分布表如下:
(2)各段的频率/组距的值依次为:
,,,,,,,
∴频率直方图和折线图如图所示:
考点二 统计图的解读
【例2-1】年月某市星级酒店经营数据统计分析如下图(“同比”指与去年同期相比):
下列说法错误的是( )
A.整体来看,年月该市星级酒店平均房价相对上一年有所提高
B.年月该市星级酒店平均房价的平均数超过元
C.年月这个月中,该市星级酒店在月份的平均房价创下个月来的最高纪录
D.年月该市星级酒店平均房价约为元
【答案】D
【解析】对于A选项,由图可知,仅有月同比增速为,其余个月同比增速均为正数,故A正确;
对于B选项,由图可知个数据的平均数为
,故B正确;
对于C选项,由图可知这个月的数据中,第个月的最大,故C正确;
对于D选项,由,得年月该市星级酒店平均房价大于元,故D错误.故选:D.
【例2-2】某高中为促进学生的全面发展,秋季学期合唱团、朗诵会、脱口秀、街舞社、音乐社等五个社团面向1200名高一年级同学招新,每名同学依据自己兴趣爱好最多可参加其中一个,各个社团的人数比例的饼状图如图所示,其中参加音乐社社团的同学有15名,参加脱口秀社团的有20名,则( )
A.高一年级同学参加街舞社社团的同学有120名
B.脱口秀社团的人数占这五个社团总人数的
C.高一年级参加这五个社团总人数占全年级人数的
D.高一年级同学参加这五个社团的总人数为200名
【答案】B
【解析】参加音乐社社团或者脱口秀社团的同学共有35名,结合扇形图知:其占这五个社团总人数的,
所以高一加这五个社团总人数为名,故AD均错,
脱口秀社团的人数占这五个社团总比为,故B对,
参加这五个社团总人数占全年级人数的占比为,故C错.故选:B
【一隅三反】
1.某企业不断自主创新提升技术水平,积极调整企业旗下的甲、乙、丙、丁、戊等种系列产品的结构比例,近年来取得了显著效果.据悉该企业年种系列产品年总收入是年的倍,其中种系列产品的年收入构成比例如图所示.则下列说法错误的是( )
A.年甲系列产品收入比年的多
B.年乙和丙系列产品收入之和比年的企业年总收入还多
C.年丁系列产品收入是年丁系列产品收入的
D.年戊系列产品收入是年戊系列产品收入的倍
【答案】C
【解析】对于A,年甲系列产品收入占了总收入的,年甲系列产品收入占了总收入的,而该企业年种系列产品年总收入是年的倍,故年甲系列产品收入比年的多,正确;
对于B,年乙和丙系列产品收入之和占了总收入的,该企业年种系列产品年总收入是年的倍,故年乙和丙系列产品收入之和比年的企业年总收入还多,正确;
对于C,年丁系列产品收入占了总收入的,年丁系列产品收入占了总收入的,而该企业年种系列产品年总收入是年的倍,故年丁系列产品收入是年丁系列产品收入的,错误;
对于D,年戊系列产品收入占了总收入的,年戊系列产品收入占了总收入的,而该企业年种系列产品年总收入是年的倍,故年戊系列产品收入是年戊系列产品收入的倍,正确;
故选:C
2.如图是甲、乙两人高考前次数学模拟成绩的折线图,则下列说法错误的是 ( )
A.甲的数学成绩最后次逐渐升高
B.甲有次考试成绩比乙高
C.甲数学成绩的极差小于乙数学成绩的极差
D.甲的数学成绩在分以上的次数多于乙的数学成绩在分以上的次数
【答案】B
【解析】对于A,由折线图可知甲的最后三次数学成绩逐渐升高,A对;
对于B,甲有次考试成绩比乙高,B错;
对于C,由折线图可知,甲乙两人的数学成绩的最高成绩接近,
甲的最低成绩为分,乙的最低成绩为分,
因此甲数学成绩的极差小于乙数学成绩的极差,C对;
对于D, 甲的数学成绩在分以上的次数为次,乙的数学成绩在分以上的次数为次,D对.
故选:B.
3.下图为2012年─2021年我国电子信息制造业企业和工业企业利润总额增速情况折线图,根据该图,下列结论正确的是( )
A.2012年─2021年电子信息制造业企业利润总额逐年递增
B.2012年─2021年工业企业利润总额逐年递增
C.2012年─2017年电子信息制造业企业利润总额均较上一年实现增长,且其增速均快于当年工业企业利润总额增速
D.2012年─2021年工业企业利润总额增速的均值大于电子信息制造业企业利润总额增速的均值
【答案】C
【解析】对于A,2018年电子信息制造业企业利润总额增速为负数,从2017到2018利润总额下降,故A不正确;
对于B,2015年工业企业利润总额增速为负数,从2014到2015利润总额下降,2019年工业企业利润总额增速为负数,从2018到2019利润总额下降,故B不正确;
对于C,2012年─2017年电子信息制造业企业利润总额增速均为正数,所以利润总额均较上一年实现增长,且其增速均大于当年工业企业利润总额增速,故C正确;
对于D,2012年─2021年工业企业利润总额增速的均值为,2012年─2021年电子信息制造业企业利润总额增速的均值为,,故D不正确.
故选:C
考点三 总体百分位数的估计
【例3-1】若一组数据为3,4,5,5,6,6,7,8,9,10,则这组数据的75%分位数为( )
A.7.5B.8C.8.5D.9
【答案】B
【解析】因为,所以这组数据的75%分位数为.故选:B.
【例3-2】(2023天津南开)某班60名学生期中考试物理成绩的频率分布直方图如图所示,其中成绩分组区间是,,,,,则该成绩的第70百分位数约为( )
A.73.6B.75.5C.76.2D.78.3
【答案】D
【解析】由题意可求得,则对应的频率为,
对应的频率为,,所以第70百分位数在之间;
即第70百分位数为.故选:D.
【一隅三反】
1.高二某班参加了“中国神舟十三号载人飞船航空知识答题”竞赛,10位评委的打分如下:5,6,6,7,7,8,9,9,10,10,则( )
A.该组数据第60百分位数为8B.该组数据第60百分位数为8.5
C.该组数据中位数为7和8D.该组数据中位数为8
【答案】B
【解析】这组数据从小到大排为:5,6,6,7,7,8,9,9,10,10,则,第60百分位数为,故A不符合,B符合;中位数为:,故C,D均不符合.故选:B.
2.已知一组数据:1,2,2,3,3,3,4,4,4,4,5,5,5,5,5,6,6,6,6,6,6,则其第70百分位数为( )
A.3B.4C.5D.6
【答案】C
【解析】第1步,按从小到大排列原始数据.第2步,计算 .
第3步,因i不是整数,故取大于14.7的比邻整数为15,则第70百分位数为第15项数据5;故选:C
3.数据的第63百分位数是,则实数的取值范围是__________.
【答案】
【解析】,故数据的第63百分位数是第个数据为,故.
故答案为:
考点四 总体集中趋势的估计
【例4】(多选)某大学共有12 000名学生,为了了解学生课外图书阅读情况,该校随机地从全校学生中抽取1000名,统计他们年度阅读书籍的数量,并制成如图所示的频率分布直方图,由此来估计全体学生年度阅读书籍的情况,下列说法中不正确的是(注:同一组数据用该组区间的中点值作为代表)( )
A.该校学生年度阅读书籍本数的中位数为6
B.该校学生年度阅读书籍本数的众数为10
C.该校学生年度阅读书籍本数的平均数为6.88
D.该校学生年度读书不低于8本的人数约为3600
【答案】ABD
【解析】对于A:因为,所以中位数在内,
设中位数为,则,解得,故A错误.
对于B:由图可知,众数在内,且众数为,故B错误.
对于C:平均数为,故C正确.
对于D:由图可知,该校抽取的学生年度读书不低于8本的频率之和为,
所以该校学生年度读书不低于8本的人数约为,故D错误.
故选:ABD.
【一隅三反】
1.(多选)某社会调查机构就某地居民的年运动时间情况调查了人,并根据所得数据画了样本的频率分布直方图(如下图).则( )
A.
B.再用分层抽样方法抽出人作进一步调查,则在段应抽出人数是
C.估计该地居民年运动时间的中位数在段内
D.估计该地居民年运动时间的平均数为
【答案】AC
【解析】对于A,由,得,故A正确;
对于B,根据频率分布直方图可得,年活动时间在段的频率为,所以抽出人中该段人数为,故B不正确;
对于C,前两个小矩形面积之和为,
前三个小矩形面积之和为,
由中位数是小矩形面积之和累计为0.5的值,所以中位数在段内,故C正确;
对于D,该地居民年运动时间的平均数约为,故D不正确.故选:AC
2.为了更好地锻炼身体,某人记录了自己4月份(共30天)每天行走的步数,将每天行走的步数(单位:千步)进行如下分组:,,,,,,并作出如图所示的频率分布直方图.
(1)由频率分布直方图估计此人每天行走步数(单位:千步)的众数是( )
A.10B.12.5C.15D.17.5
(2)若按此锻炼习惯,估计此人未来30天中行走不少于2万步的天数是( )
A.3B.5C.6D.10
(3)若同一组数据以这组区间的中点值作代表,估计此人该月平均每天行走的步数(单位:千步)是( )
A.13.5B.14.5C.15.5D.16.5
【答案】(1)B(2)C(3)B
【解析】(1)每天行走的步数在区间[0,5)内的频率为0.01×5=0.05,
在区间[5,10)内的频率为0.04×5=0.2,在区间[10,15)内的频率为0.06×5=0.3,
在区间[15,20)内的频率为0.05×5=0.25,在区间[20,25)内的频率为0.03×5=0.15,
在区间[25,30]内的频率为0.01×5=0.05.因为每天行走的步数在区间[10,15)内的频率最大,
所以每天行走步数的众数在区间[10,15)内,所以每天行走步数的众数是12.5.故选:B.
(2)由(1)知,因为每天行走不少于2万步的频率为0.15+0.05=0.2,
所以估计此人未来30天中行走不少于2万步的天数是30×0.2=6.故选:C.
(3)由(1)知,估计此人该月平均每天行走的步数为
2.5×0.05+7.5×0.2+12.5×0.3+17.5×0.25+22.5×0.15+27.5×0.05=14.5.
故选:B.
3.十名工人某天生产同一零件,生产的件数分别是:15,17,14,10,15,17,17,16,14,12,设其中位数为a,众数为b,第一四分位数为c,则a,b,c大小关系为( )
A.B.
C.D.
【答案】B
【解析】对生产件数由小到大排序可得:10,12,14,14,15,15,16,17,17,17,所以中位数众数为17,,所以第一四分位数为第三个数,即14,所以,故选:B.
考点五 总体离散程度的估计
【例5-1】甲和乙射箭,两人比赛的分数结果如下:
求甲和乙分数的平均数和方差,并说明甲和乙发挥的情况.
【答案】答案见解析
【解析】甲分数的平均数为,
方差为,
乙分数的平均数为,
方差为,
所以,,,故甲乙分数的平均数相同,但甲比乙发挥更为稳定.
【例5-2】(多选)有一组样本数据,由这组数据得到新样本数据,则下列结论正确的是( )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
【答案】CD
【解析】数据的平均数为,
新数据的平均数为
,故A错误;
若数据的中位数为,
则新数据的中位数为,故B错误;
数据的标准差为
,
新数据的标准差为
,故C正确;
若数据中的最大数为最小数为,则极差为,
则数据的极差为,故D正确,
故选:CD.
【例5-3】(多选)某校为调查学生身高情况,按比例分配的分层随机抽样抽取一个容量为50的样本,已知其中男生23人,平均数为170.6,方差为12.59;女生27人,平均数160.6,方差为38.62. 下列说法正确的是( )
A.这个样本的平均数为165.2B.这个样本的方差为51.4862
C.该校女生身高分布比男生集中D.该校男生的身高都比女生高
【答案】AB
【解析】先求样本的平均数:
再求样本的方差:.所以A,B均正确;
因为,所以该校男生身高分布比女生集中,所以C不正确;
样本数据无法得出男生的身高都比女生高,所以D不正确.故选:AB.
【一隅三反】
1.若数据的平均数为2,方差为3,则下列说法不正确的是( )
A.数据,,…,的平均数为20B.
C.数据,,…,的标准差为D.
【答案】A
【解析】对于A,若数据的平均数为2,则数据,,,的平均数为,A错误;
对于B,数据的平均数为2,则 , B正确;
对于C,数据,,,的方差为,故标准差为,C正确;
对于D,由于,
数据的平均数为2,方差为3,则有,
变形可得,D正确.故选:A
2.某班40人随机分成两组,第一组18人,第二组22人,两组学生在某次数学测验中的成绩如下:
求全班的平均成绩和标准差.(精确到0.01)
【答案】平均数为84.5;标准差为7.05.
【解析】设第一组人数为,第二组人数为,第一组学生数学测试的平均成绩为,第二组学生数学测试的平均数为,全班所有学生的数学测试的平均成绩为,第一组学生数学测试的方差为,第二组学生数学测试的方差为,全班所有学生的数学测试的方差为,
则,所以全班所有学生的数学测试的平均成绩
所以,
全班所有学生的数学测试的方差,
所以,
所以全班所有学生的数学测试的标准差为.
3.在一次高三年级统一考试中,数学试卷有一道满分10分的选做题,学生可以从,两道题目中任选一题作答.某校有800名高三学生参加了本次考试,为了了解该校学生解答该选做题的得分情况,计划从800名考生的选做题成绩中随机抽取一个容量为10的样本,为此将800名考生选做题的成绩按照随机顺序依次编号为.
(1)若采用随机数法抽样,并按照以下随机数表,以第2行的第18列的数字9为起点,从左向右依次读取数据,每次读取三位随机数,一行读数用完之后接下一行左端,写出样本编号;
(2)求出(1)中抽取的样本编号对应的数的极差与中位数;
(3)若采用分层抽样,按照学生选择A题目或题目,将成绩分为两层,且样本中A题目的成绩有8个,平均数为7,方差为4;样本中题目的成绩有2个,平均数为8,方差为1.用样本估计800名考生的选做题得分的平均数与方差.
【答案】(1)617,162,506,512,770,687,554,647,547,332
(2)
(3)00名考生的选做题得分的平均数的估计值为7.2;800名考生的选做题得分的方差的估计值为3.56
【解析】(1)根据题意,读出的编号依次是:
964(超界),617,162,991(超界),506,512,916(超界),935(超界),805(超界),770,951(超界),512(重复),687,858(超界),554,876(超界),647,547,332.故抽取的样本编号为617,162,506,512,770,687,554,647,547,332;
(2)将(1)中有效的编号从小到大排列得162,332,506,512,547,554,617,647,687,770.
所以(1)中抽取的样本编号对应的数的极差为,中位数为;
(3)设A题目的8个成绩为:,B题目的2个成绩为.
则,;
,.
故800名考生的选做题得分的平均数的估计值为:,
800名考生的选做题得分的方差的估计值为:.
9.2 用样本估计总体(精练)
1.如图是一学校期末考试中某班物理成绩的频率分布直方图,数据的分组依次为、、、、、,若成绩不低于70分的人数比成绩低于70分的人数多4人,则该班的学生人数为( )
A.45B.50C.55D.60
【答案】B
【解析】由题得
由题得低于70分的频率为,所以不低于70分的频率为,
设该班的学生人数为,则,所以.
故选:B
2.为倡导“节能减排,低碳生活”的理念,某社区对家庭的人均月用电量情况进行了调查,通过抽样,获得了某社区100个家庭的人均月用电量(单位:千瓦时),将数据按照分成6组,制成了如图所示的频率分布直方图.若该社区有3000个家庭,估计全社区人均月用电量低于80千瓦时的家庭数为( )
A.300B.450C.480D.600
【答案】D
【解析】由频率分布直方图知,人均月用电量低于80千瓦时的频率为,
而该社区有3000个家庭,所以全社区人均月用电量低于80千瓦时的家庭数约为.
故选:D
3.下列命题是真命题的有( )
A.有甲、乙、丙三种个体按的比例分层抽样调查,如果抽取的乙个体数为9,则样本容量为32
B.数据的平均数、众数、中位数相同
C.若甲组数据的方差为5,乙组数据为,则这两组数据中较稳定的是甲
D.一组数的分位数为4
【答案】B
【解析】对A:甲、乙、丙三种个体按的比例分层抽样,故乙占了样本容量为,故A不正确;对B:数据的平均数为,众数为3,中位数为,故B正确;
对C:乙组数的平均数为,
方差为.
乙组数据更稳定,故C错误;对D:将这组数据从小到大排列:1,2,2,3,;又,则这组数据的分位数是第七个数与第八个数的平均数,为,故D错误.故选:B.
4.某市甲、乙两个监测站在10日内分别对空气中某污染物实施监测,统计数据(单位:g/m3)如图所示,以下说法正确的是( )
A.这10日内任何一天甲监测站的大气环境质量均好于乙监测站
B.这10日内甲监测站该污染物浓度读数的中位数小于乙监测站读数的中位数
C.这10日内乙监测站该污染物浓度读数中出现频率最大的数值是167
D.这10日内甲监测站该污染物浓度读数的平均值小于乙监测站读数的平均值
【答案】C
【解析】由茎叶图易知A错误;甲监测站污染物浓度的中位数是,乙监测站污染物浓度的中位数是167,B错误;这10日内乙监测站该污染物浓度读数中出现频率最大的数值,即众数是167,C正确;
甲监测站该污染物浓度的平均值
,,D错误;
故选:C.
5.国家统计局服务业调查中心和中国物流与采购联合会发布的2018年10月份至2019年9月份共12个月的中国制造业采购经理指数(PMI)如图所示.则下列结论中正确的是( )
A.12个月的PMI值不低于的频率为
B.12个月的PMI值的平均值低于
C.12个月的PMI值的众数为
D.12个月的PMI值的中位数为
【答案】B
【解析】对于A:从图中数据变化看,PMI值不低于的月份有4个,所以12个月的PMI值不低于的频率为,故A错误;对于B:由图可以看出PMI值不低于的月份有个且超过不多,PMI值低于的月份有个,其中月份数据为低得比较多,所以PMI值的平均值低于,故B正确;
对于C:12个月的PMI值的众数为,故C错误;对于D:12个月的PMI值的中位数为,故D错误.故选:B
6.为了加深师生对党史的了解,激发广大师生知史爱党、知史爱国的热情,某校举办了“学党史、育文化”暨“喜迎党的二十大”党史知识竞赛,并将1000名师生的竞赛成绩(满分100分,成绩取整数)整理成如图所示的频率分布直方图,则下列说法正确的是( )
①a的值为0.005;
②估计成绩低于60分的有25人;
③估计这组数据的众数为75;
④估计这组数据的第85百分位数为86
A.①②③B.①②④C.①③④D.②③
【答案】C
【解析】对于①,由,得.故①正确;
对于②,估计成绩低于60分的有人.故②错误;
对于③,由众数的定义知,估计这组数据的众数为75.故③正确;
对于④,设这组数据的第85百分位数为m,则,解得:,故④正确.故选:C.
7.随着工业自动化和计算机技术的发展,中国机器人进入大量生产和实际应用阶段,下图为2022年中国服务机器人各行业渗透率调查情况.
根据该图,下列结论错误的是( )
A.物流仓储业是目前服务行业中服务机器人已应用占比最高的行业
B.教育业目前在大力筹备应用服务机器人
C.未计划使用服务机器人占比最高的是政务服务业
D.图中八大服务业中服务机器人已应用占比的中位数是33.3%
【答案】D
【解析】对A,由图易知,物流仓储业在目前服务行业中服务机器人已应用占比最高,A对;
对B,由图易知,教育业在目前服务行业中服务机器人筹备中占比最高,B对;
对C,由图易知,政务服务业在目前服务行业中服务机器人未计划占比最高,C对;
对D,由图易知,八大服务业中服务机器人已应用占比已经排好序,故中位数是,D错.故选:D
8.如图,一组数据,的平均数为5,方差为,去除,这两个数据后,平均数为,方差为,则( )
A.,B.,C.,D.,
【答案】D
【解析】由题意可得:,则,
故,∵是波幅最大的两个点的值,则去除,这两个数据后,整体波动性减小,故.故选:D.
9.甲、乙两名篮球运动员在相同站位点各进行6组篮球投篮练习,每组投篮10次,每投进篮筐一次记1分,否则记0分,他们每组投篮的得分如下:
甲 7 8 9 5 4 9
乙 7 8 7 8 7 7
则下列说法正确的是( )
A.甲比乙的平均成绩高,乙比甲的成绩稳定
B.甲比乙的平均成绩高,甲比乙的成绩稳定
C.乙比甲的平均成绩高,甲比乙的成绩稳定
D.乙比甲的平均成绩高,乙比甲的成绩稳定
【答案】D
【解析】由题意可得甲乙两人的平均数分别为:,
甲乙两人的方差分别为:,
,
故,,由此可知乙比甲的平均成绩高,乙比甲的成绩稳定,故选:D
10.甲乙两位射击运动员在一次射击中各射靶10次,每次命中的环数如下:
甲 6 9 6 8 6 6 9 7 8 10
乙 8 8 7 8 7 8 7 8 7 7
则下列说法正确的是( )
A.甲比乙射击的平均成绩高B.乙比甲射击的平均成绩高
C.甲比乙的射击成绩稳定D.乙比甲的射击成绩稳定
【答案】D
【解析】对于AB,甲的平均成绩为:,
乙的平均成绩为:,故甲乙射击的平均成绩一样,故AB错误;
对于CD,甲成绩对应的方差为:,
乙成绩对应的方差为:,因为,所以乙比甲的射击成绩稳定,故C错误,D正确,
故选:D
11.某科技攻关青年团队共有20人,他们的年龄分布如下表所示:
下列说法正确的是( )
A.29.5是这20人年龄的一个25%分位数B.29.5是这20人年龄的一个75%分位数
C.36.5是这20人年龄的一个中位数D.这20人年龄的众数是5
【答案】A
【解析】对选项A:,25%分位数为,正确;
对选项B:,75%分位数为,错误;
对选项C:这20人年龄的中位数是,错误;
对选项D:这20人年龄的众数是,错误;故选:A
12.如图是我国2011-2021年国内生产总值(GDP)(单位:亿元)及其年增长率(%)的统计图,则下列结论错误的是( )
A.2011-2021年国内生产总值逐年递增
B.2021年比2020年国内生产总值及其年增长率均有增加
C.2014-2017年国内生产总值年增长率的方差大于2018-2021年的方差
D.2011-2021年国内生产总值年增长率的平均值小于7.1%
【答案】C
【解析】由题图,2011-2021年国内生产总值逐年呈上升趋势,A正确;
由题图,2020与2021两年的数据,国内生产总值及其年增长率均有增加,B正确;
2014-2017年国内生产总值年增长率的波动较小,而2018-2021年国内生产总值年增长率的波动较大,所以2014-2017年国内生产总值年增长率的方差小于2018-2021年的方差,C错误;
2011-2021年国内生产总值年增长率的平均值为,所以2011-2021年国内生产总值年增长率的平均值小于7.0%,故 D正确.
故选:C.
13.现有甲、乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为,方差为,乙组数据的平均数为,方差为.若将这两组数据混合成一组,则新的一组数据的方差为( )
A.B.C.D.
【答案】D
【解析】设甲组数据分别为、、、,乙组数据分别为、、、,
甲组数据的平均数为,可得,方差为,可得,
乙组数据的平均数为,可得,方差为,可得,
混合后,新数据的平均数为,
方差为
.
故选:D.
14.小李晨练所花时间(单位:分钟)分别为x,y,30,29,31,已知这组数据的平均数为30,方差为2,则的值为( )
A.1B.2C.3D.4
【答案】D
【解析】由题意可得,得;
由,得.
令,解得,故.
故选:D.
15.已知数据甲:;数据乙:,则( )
A.甲的平均数大于乙的平均数B.乙的平均数大于甲的平均数
C.甲的方差大于乙的方差D.乙的方差大于甲的方差
【答案】C
【解析】甲的平均数,乙的平均数,
∴甲的平均数与乙的平均数相等,故A、B错误;
甲的方差;
乙的方差,
∴,故C正确,D错误.故选:C.
16.甲乙两名同学6次考试的成绩统计如图,甲乙成绩的平均数分别为,,标准差分别为,,则( )
A.,B.,
C.,D.,
【答案】C
【解析】由甲乙两名同学6次考试的成绩统计图知:甲组数据靠上,乙组数据靠下,甲组数据相对集中,乙组数据相对分散分散布,由甲乙两组数据的平均数分别为,标准差分别为,得,.
故选:C.
17.现有随机选出20个数据,统计如下,则( )
A.该组数据的众数为1.02B.该组数据的极差为1.12
C.该组数据的中位数为0.87D.该组数据的80%分位数为1.02
【答案】D
【解析】由题可知出现了三次,而只出现了两次,根据众数定义可知该组数据的众数为 ,故A错误;
根据极差定义可知,该组数据的极差为,所以B错误;
由中位数定义可知,该组数据的中位数为,即C错误;
由于,所以该组数据的80%分位数是第16个和第17个数的平均数,即,所以D正确;故选:D
18.如图是某赛季甲、乙两名篮球运动员5场比赛得分的茎叶图,已知甲的成绩的极差为31,乙的成绩的平均值为24,则下列结论错误的是( )
A.B.
C.乙的成绩的中位数为D.乙的成绩的方差小于甲的成绩的方差
【答案】C
【解析】根据题意,依次分析选项:
对于A,甲得分的极差为31,,解得:,A正确;
对于B,乙的平均数为,解得,B正确;
对于C,乙的数据为:12、25、26、26、31,其中位数是26,C错误;
对于D,甲的平均数,与乙的平均数相同,但根据茎叶图可得乙得分比较集中,则乙得分的方差小于甲得分的方差,D正确;
故选:C.
19.为了让学生了解环保知识,增强环保意识,某班举行了一次环保知识有奖竞答活动,有名学生参加活动.已知这名学生得分的平均数为,方差为.若将当成一个学生的分数与原来的名学生的分数一起,算出这个分数的平均数为,方差为,则( )
A.,B.,
C.,D.,
【答案】B
【解析】设这名学生得分分别是、、、、,
则,,故,
因为,
,因为,故.
故选:B.
20.(多选)据某地统计局发布的数据,现将8月份至12月份当地的人均月收入增长率数据制成如图所示的折线图,已知8月份当地的人均月收入为2000元,现给出如下信息,其中不正确的信息为( )
A.9月份当地人均月收入为1980元
B.10月份当地人均月收入为2040元
C.11月份当地人均月收入与8月份相同
D.这四个月中.当地12月份人均月收入最低
【答案】ACD
【解析】由题意及图知,8月份当地人均月收入为2000元,9月份当地人均月收入的增长率为0,
∴9月份当地人均月收入为2000元,故A错误;
∵10月份当地人均月收入的增长率为,∴10月份当地人均月收入为元,故B正确;
∵11月份当地人均月收入的增长率为,所以11月份当地人均月收入为,故C错误;
∵12月份当地人均月收入的增长率为,∴12月份当地人均月收入为2000,故D错误.
故选:ACD.
21.(多选)某学校为普及安全知识,对本校1500名高一学生开展了一次校园安全知识竞赛答题活动(满分为100分).现从中随机抽取100名学生的得分进行统计分析,整理得到如图所示的频率分布直方图,则根据该直方图,下列结论正确的是( )
A.图中的值为0.016
B.估计该校高一大约有77%的学生竞赛得分介于60至90之间
C.该校高一学生竞赛得分不小于90的人数估计为195人
D.该校高一学生竞赛得分的第75百分位数估计大于80
【答案】BCD
【解析】由频率分布直方图性质可得:,解得,故A错误;
得分介于60至90之间的频率为,故B正确;
得分不小于90的人数估计为,故C正确;
得分介于50至80之间的频率为,故D正确.
故选:BCD.
22.(多选)某地区经过2022年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中正确的是( )
A.新农村建设后,种植收入增加
B.新农村建设后,其他收入是原来的1.25倍
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,其他收入与第三产业收入的总和超过了经济收入的
【答案】AC
【解析】设建设前农村的经济收入为,则新农村建设后经济收入为,
建设前农村的种植收入为,则新农村建设后经济收入为,故A正确;
建设前农村的其他收入为,则新农村建设后其他收入为,倍,故B错误;
建设前农村的养殖收入为,则新农村建设后养殖收入为,故C正确;
新农村建设后,其他收入与第三产业收入的总和占比,故D错误;
故选:AC.
23.(多选)PM2.5的监测值是用来评价环境空气质量的指标之一,如图是某地12月1日至10日的PM2.5日均值(单位:)变化的折线图,则( )
A.这10日PM2.5日均值的80%分位数为60
B.前5日PM2.5日均值的极差小于后5日PM2.5日均值的极差
C.前5日PM2.5日均值的方差大于后5日PM2.5日均值的方差
D.这10日PM2.5日均值的中位数为43
【答案】BD
【解析】这个数据从小到大排列是:.
A选项,,所以这10日PM2.5日均值的80%分位数为,A选项错误.
B选项,前5日PM2.5日均值的极差为,后5日PM2.5日均值的极差为,B选项正确.
C选项,通过观察可知,前5日PM2.5日均值的波动程度小于后5日PM2.5日均值的波动程度,
所以前5日PM2.5日均值的方差小于后5日PM2.5日均值的方差,C选项错误.
D选项,中位数是,D选项正确.故选:BD
24(多选)已知一组数据为:4,1,2,5,5,3,3,2,3,2,则( )
A.标准差为B.众数为2和3
C.70分位数为D.平均数为3
【答案】BCD
【解析】,D对.,方差为,A错.
众数为2和3,B对.,按大小顺序排为1,2,2,2,3,3,3,4,5,5,第7,8位数的平均数为,C对.故选:BCD
25.某学校组织学生参加数学测试,某班成绩的频率分布直方图如图,数据的分组依次为,,,.若不低于80分的人数是35人,且同一组中的数据用该组区间的中点值代表,则下列说法中正确的是( )
A.该班的学生人数是50B.成绩在的学生人数是12
C.估计该班成绩的平均分为85D.成绩的众数一定落在区间内
【答案】AC
【解析】对A:由题图可知,解得,
则不低于80分的频率为,所以该班的学生人数是,所以A项正确;
对B:成绩在的频率为,所以成绩在的学生人数是,所以B选项不正确;
对C:因为,所以C选项正确;
对D:因为在区间内的数据尽管频率最大,但也可能数据分散,众数不一定在区间内,所以D选项不正确.
故选:AC.
26.(多选)在疫情防护知识竞赛中,对某校的2000名考生的参赛成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为,,,,,,若同一组中数据用该组区间中间值作代表值,则下列说法中正确的是( )
A.考生竞赛成绩的平均分为72.5分
B.若60分以下视为不及格,则这次知识竞赛的及格率为80%
C.分数在区间内的频率为0.02
D.用分层抽样的方法从该校学生中抽取一个容量为200的样本,则成绩在区间应抽取30人.
【答案】AB
【解析】对选项A:平均成绩为,正确;
对选项B:及格率为,正确;对选项C:分数在区间内的频率为,错误;对选项D:区间应抽取人,错误.故选:AB
27.如图表示甲、乙两组数据所示的茎叶图,设甲组、乙组两组数据为,则两组数据的平均值分别为与,则___________.
【答案】33.6
【解析】由茎叶图可得,,,所以.
故答案为:33.6.
28.《中国居民膳食指南()》数据显示,岁至岁儿童青少年超重肥胖率高达.为了解某地中学生的体重情况,某机构从该地中学生中随机抽取名学生,测量他们的体重(单位:千克),根据测量数据,按,,,,,分成六组,得到的频率分布直方图如图所示.根据调查的数据,估计该地中学生体重的中位数是___________.
【答案】
【解析】,,该地中学生体重的中位数位于内,
设中位数为,则,解得:.故答案为:.
29.已知样本数据的平均数与方差分别是和,若,且样本数据的平均数与方差分别是和,则______.
【答案】
【解析】由题意得,,解得,,,
,
.
故答案为:4044
30.某小区为了提高小区内人员的读书兴趣,准备举办读书活动,并购买一定数量的书籍丰富小区图书站.由于不同年龄段的人看不同类型的书籍,为了合理配备资源,现对小区内看书人员进行年龄调查,随机抽取了40名读书者进行调查,将他们的年龄(单位:岁)分成6段:,,后得到如图所示的频率分布直方图.
(1)求在这40名读书者中年龄分布在的人数;
(2)求这40名读书者的年龄的平均数和中位数(同一组中的数据用该组区间中点值为代表).
【答案】(1)30;(2)平均数54,中位数55.
【解析】(1)由频率分布直方图知,年龄在的频率为
故这40名读书者中年龄分布在的人数为.
(2)这40名读书者年龄的平均数为
设中位数为,则,
解得,故这40名读书者年龄的中位数为55.
31.某次人才招聘活动中,某公司计划招收600名新员工.由于报名者共2 000人,远超计划,故该公司采用笔试的方法进行选拔,并按照笔试成绩择优录取.现采用随机抽样的方法抽取200名报名者的笔试成绩,绘制频率分布直方图如图:
已知图中左边四个小长方形的高度自左向右依次构成公比为2的等比数列.根据频率分布直方图解答以下问题:
(1)求m;
(2)估计此次笔试的平均成绩.
【答案】(1)(2)67.1分
【解析】(1)根据频率分布直方图各小长方形面积之和为1,
,解得.
(2)由频率分布直方图,得样本数据的平均值可估计为
,
此次笔试的平均成绩可估计为67.1分.
32.某车站在春运期间为了了解旅客购票情况,随机抽样调查了200名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图(如图所示),解答下列问题:
(1)(直接填空)这次抽样的样本容量是 ?
(2)分别求出表中缺失的数据a,b,c;并将频率分布直方图补充完整;
(3)用每一组的两个端点的平均值来代替这一组的数据,求这个车站每位旅客购票平均所用的时间.
【答案】(1)(2),频率分布直方图见解析(3)分钟
【解析】(1)依题意可知样本容量是.
(2),,
第一组和第二组的频率相同,由此补全频率分布直方图如下图所示:
(3)每位旅客购票平均所用的时间为分钟.
33.在一个文艺比赛中,由8名专业人士和8名观众代表各组成一个评委小组,给参赛选手打分.下面是两组评委对同一名选手的打分:
(1)做出两组评委打分的茎叶图;
(2)每一个小组内评委打分的相似程度是不同的,我们可以用方差来进行刻画.请计算每一组数据中的方差;
(3)你能根据方差判断出小组A与小组B中哪一个更像是由专业人士组成的吗?请说明理由.
【答案】(1)答案见解析(2),(3)A组,理由见解析
【解析】(1)利用表中数据即可做出茎叶图如下:
(2)根据平均数、方差公式计算:小组A的平均数是,
即可得方差
小组B的平均数是,
即可得方差
即小组A的方差,小组B的方差.
(3)由于专业人士给分更符合专业规则,相似程度更高,由(2)可知小组A的方差,小组B的方差,因而,
根据方差越大数据波动越大,因此A组更像是由专业人士组成的.
34.坐位体前屈是中小学体质健康测试项目,主要测试学生躯干、腰、髋等部位关节韧带和肌肉的伸展性、弹性及身体柔韧性,在对某高中1500名高三年级学生的坐位体前屈成绩的调查中,采用按学生性别比例分配的分层随机抽样抽取100人,已知这1500名高三年级学生中男生有900人,且抽取的样本中男生的平均数和方差分别为13.2cm和13.36,女生的平均数和方差分别为15.2cm和17.56.
(1)求抽取的总样本的平均数;
(2)试估计高三年级全体学生的坐位体前屈成绩的方差.
参考公式:总体分为2层,分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:,,,,,.记总样本的平均数为,样本方差为,
【答案】(1);(2)16
【解析】(1)设在男生、女生中分别抽取m名和n名,则,解得:.
记抽取的总样本的平均数为,根据按比例分配分层随机抽样总样本平均数与各层样本平均数的关系,可得:所以,抽取的总样本的平均数为.
(2)男生样本的平均数为,样本方差为;
女生样本的平均数为,样本方差为;
由(1)知,总样本的平均数为.记总样本的样本方差为,
则
所以,估计高三年级全体学生的坐位体前屈成绩的方差为16.
1.在某校的“迎新年”歌咏比赛中,6位评委给某位参赛选手打分,6个分数的平均分为分,方差为,若去掉一个最高分分和一个最低分分,则剩下的4个分数满足( )
A.平均分分,方差B.平均分分,方差
C.平均分分,方差D.平均分分,方差
【答案】C
【解析】设这个数分别为,平均数为,方差为,的平均数为,方差为,则由题意可知,,所以,即,所以,所以,即,
所以,
所以剩下的4个分数满足平均分分,方差.故选:C.
2.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:均值为3,中位数为4B.乙地:均值为1,方差大于0
C.丙地:中位数为2,众数为3D.丁地:均值为2,方差为3
【答案】D
【解析】对于选项A:因为均值和中位数不能限制某一天的病例超过7人,如0,0,0,0,4,4,4,4,6,8,所以选项A不正确;
对于选项B:因为均值和方差不能限制某一天的病例超过7人,如0,0,0,0,0,0,0,0,0,10,所以B不正确;
对于选项C:因为中位数和众数不能限制某一天的病例超过7人,如0,0,0,0,2,2,3,3,3,8,所以C不正确;
对于选项D:假设过去10天新增疑似病例数据存在一个数据x,,而均值为2,则方差,
与方差为3矛盾,所以假设不成立,故符合没有发生大规模群体感染的标志,所以D正确;
故选:D.
3.冬末春初,人们容易感冒发热,某公司规定:若任意连续7天,每天不超过5人体温高于,则称没有发生群体性发热.根据下列连续7天体温高于人数的统计量,能判定该公司没有发生群体性发热的为( )
①中位数是3,众数为2;②均值小于1,中位数为1;③均值为3,众数为4;④均值为2,标准差为.
A.①③B.③④C.②③D.②④
【答案】D
【解析】任意连续7天,每天不超过5人体温高于的人数为2,2,2,3,3,4,6,
则满足中位数是3,众数为2,但第7天是6人高于5人,故①错误;
任意连续7天,每天不超过5人体温高于的人数为0,1,2,4,4,4,6,
则满足均值是3,众数为4,但第7天是6人高于5人,故③错误;
对于②,将个数据从小到大排列为,
,,所以,
由于是自然数,且,
所以都不超过,②正确.
对于④,将个数据从小到大排列为,
,,
,
,
由于是自然数,若自然数大于,则,矛盾,
所以都不超过,④正确.综上所述,正确的为②④.
故选:D
4.已知两组数据和的中位数、方差均相同,则两组数据合并为一组数据后,( )
A.中位数一定不变,方差可能变大
B.中位数一定不变,方差可能变小
C.中位数可能改变,方差可能变大
D.中位数可能改变,方差可能变小
【答案】A
【解析】对于中位数:不妨设,
则两组数据和的中位数分别为,则,
两组数据合并为一组数据后,则中位数为,故中位数一定不变;
对于方差:设的平均数为,方差为,的平均数为,方差为,
则,
可得,
则两组数据合并为一组数据的平均数,
方差
,当且仅当时等号成立,
故方差可能变大,一定不会变小;故选:A.
5.已知一组数据,,…,,c是非零常数,则对于数据,,…,,以下说法中正确的是( )
A.平均数与方差都不变B.平均数变了,方差不变
C.平均数不变,方差变了D.平均数与方差都变了
【答案】B
【解析】设的平均数为,即,
则其方差为:,
所以的平均数为:,
的方差为:
,
所以平均数变了,方差不变.
故选:B.
6.(多选)下列说法正确的是( )
A.用简单随机抽样从含有50个个体的总体中抽取一个容量为10的样本,个体被抽到的概率是0.2
B.已知一组数据1,2,m,6,7的平均数为4,则这组数据的方差是5
C.数据27,12,14,30,15,17,19,23的50%分位数是17
D.若样本数据,,…,的标准差为8,则数据,,…,的标准差为16
【答案】AD
【解析】对于A,一个总体含有50个个体,某个个体被抽到的概率为,
以简单随机抽样方式从该总体中抽取一个容量为10的样本,
则指定的某个个体被抽到的概率为 ,故A正确;
对于B,数据1,2,,6,7的平均数是4,,
这组数据的方差是,故B错误;
对于C,8个数据50百分为,第50百分位数为,故C错误;
对于D,依题意,,则,
所以数据的标准差为16,D正确;故选:AD.
7.(多选)第一组样本数据:,由这组数据得到第二组样本数据:,其中,其中为正数,则下列命题正确的是( )
A.当时,两组样本数据的样本平均数不相同
B.第二组样本数据的样本极差是第一组的倍
C.第二组样本数据的样本标准差是第一组的倍
D.第二组样本数据的样本方差是第一组的倍
【答案】ABC
【解析】设一组数据的平均数为,方差为,则的平均数为,方差为.
对于选项,根据以上性质以及可知,第二组样本数据的平均数为,故平均数不相同,故正确;
对于选项,由极差的定义知:若第一组的极差为,
则第二组的极差为,
即第二组样本数据的样本极差是第一组的倍,故正确;
对于选项,根据样本数的上述性质,第二组样本数据的样本方差是第一组的倍,
第二组样本数据的样本标准差是第一组的倍,故C正确, 错误.
故选:.
8.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:
(1)在下表中作出这些数据的频率分布直方图;
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)已知在这些数据中,质量指标值落在区间内的产品的质量指标值的平均数为94,方差为40,所有这100件产品的质量指标值的平均数为100,方差为202,求质量指标值在区间内的产品的质量指标值的方差.
【答案】(1)答案见解析(2)平均数为100,方差为104.(3)300
【解析】(1)由题意可知,分组,,,,,对应的频率分别为.则频率分布直方图如下图所示:
(2)质量指标值的样本平均数为
.
质量指标值的样本方差为
(3)由题,质量指标值落在区间内的产品有70件,设质量指标值分别为,则平均数为,方差为,质量指标值落在区间内的产品有30件,设质量指标值分别为,则平均数为,方差为,设这100件产品的质量指标值的平均数为,
方差为,则,所以,又因为,则,
又因为,则,所以
9.随着老年人消费需求从“生存型”向“发展型”转变.消费层次不断提升,“银发经济”成为社会热门话题之一,被各企业持续关注.某企业为了解该地老年人消费能力情况,对该地年龄在的老年人的年收入按年龄,分成两组进行分层抽样调查,已知抽取了年龄在的老年人500人.年龄在的老年人300人.现作出年龄在的老年人年收入的频率分布直方图(如下图所示).
(1)根据频率分布直方图,估计该地年龄在的老年人年收入的平均数及第95百分位数;
(2)已知年龄在的老年人年收入的方差为3,年龄在的老年人年收入的平均数和方差分别为3.75和1.4,试估计年龄在的老年人年收入的方差.
【答案】(1)5.35;8.3(2)3
【解析】(1)频率分布直方图中,该地年龄在的老年人年收入的平均数约为:
,
由频率分布直方图,年收入在万元以下的老年人所占比例为,
年收入在万元以下的老年人所占比例为,
因此,第95百分位数一定位于内,由,
可以估计该地年龄在的老年人年收入的第95百分位数为.
(2)设年龄在的老年人样本的平均数记为,方差记为;
年龄在的老年人样本的平均数记为,方差记为;
年龄在的老年人样本的平均数记为,方差记为.
由(1)得,由题意得,,,,
则,由,
可得,
即估计该地年龄在的老年人的年收入方差为3.
10.我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了促使居民节约用水,决定在该市实行阶梯水价,为合理确定出阶梯水价的用水量标准,从该市随机调查了100户居民,获取了他们去年的月人均用水量(单位:吨),并列出了月人均用水量的频数分布表().
(1)求出的值,并补全频率分布直方图;
(2)市政府举行听证会后,决定实施阶梯水价:家庭人均月用水量不超过吨的部分,水价为3元/吨;超过吨但不超过3.5吨的部分,水价为5元/吨;超过3.5吨的部分,水价为8元/吨.结合听证会上市政府的决定,为确保超过60%但不超过70%的居民只用3元/吨的水费,求的标准值(取0.5的整数倍).
(3)按照(2)中的方案,请你写出常住人口为的家庭月用水量为吨时,应缴水费的表达式.
【答案】(1),作图见解析;(2);(3).
【解析】(1)由题意可知,用水量在的频率为0.18;用水量在的频率为0.24;用水量在的频率为0.16.故补全频率分布直方图如下:
(2)由频数分布表易知:前4组频率之和为;
前5组频率之和为;
前6组频率之和为;
所以为确保超过60%但不超过70%的居民只用3元/吨的水,
需 解得:,即,又∵为0.5的整数倍,
∴;
(3)常住人口为的家庭月用水量为吨时,其家庭人均月用水量为,所以当时,;
当时,;
当时,;
总数所述:.
171
170
165
169
167
167
170
161
164
167
171
163
163
169
166
168
168
165
160
168
158
160
163
167
173
168
169
170
160
164
171
169
167
159
151
168
170
174
160
168
176
157
162
166
158
164
180
179
169
169
身高
频数
频率
身高
频数
频率
1
0.02
0
0
4
0.08
6
0.12
8
0.16
13
0.26
13
0.26
2
0.04
1
0.02
2
0.04
分组
频数
分组
频数
频率
2
0.04
3
0.06
10
0.20
15
0.30
12
0.24
8
0.16
合计
50
1
分组
频数
频率
6
0.06
16
0.16
18
0.18
22
0.22
20
0.20
10
0.10
8
0.08
合计
100
1
甲
乙
分组
平均成绩
标准差
第一组
90
6
第二组
80
4
年龄
45
40
36
32
30
29
28
人数
2
3
3
5
2
4
1
分组
频数
频率
一组
5≤t
相关试卷
这是一份高中数学人教A版 (2019)必修 第二册10.3 频率与概率精品随堂练习题,文件包含人教A版高中数学必修第二册同步讲练测103频率与概率教师版docx、人教A版高中数学必修第二册同步讲练测103频率与概率教师版pdf、人教A版高中数学必修第二册同步讲练测103频率与概率原卷版docx、人教A版高中数学必修第二册同步讲练测103频率与概率原卷版pdf等4份试卷配套教学资源,其中试卷共84页, 欢迎下载使用。
这是一份人教A版 (2019)必修 第二册10.1 随机事件与概率精品当堂达标检测题,文件包含人教A版高中数学必修第二册同步讲练测101随机事件与概率教师版docx、人教A版高中数学必修第二册同步讲练测101随机事件与概率教师版pdf、人教A版高中数学必修第二册同步讲练测101随机事件与概率原卷版docx、人教A版高中数学必修第二册同步讲练测101随机事件与概率原卷版pdf等4份试卷配套教学资源,其中试卷共109页, 欢迎下载使用。
这是一份高中人教A版 (2019)9.1 随机抽样优秀测试题,文件包含人教A版高中数学必修第二册同步讲练测91随机抽样教师版docx、人教A版高中数学必修第二册同步讲练测91随机抽样教师版pdf、人教A版高中数学必修第二册同步讲练测91随机抽样原卷版docx、人教A版高中数学必修第二册同步讲练测91随机抽样原卷版pdf等4份试卷配套教学资源,其中试卷共76页, 欢迎下载使用。