


高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体学案
展开9.2.2 总体百分位数的估计
9.2.3 总体集中趋势的估计
知识点一 第p百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
知识点二 第p百分位数的计算步骤
设一组数据的个数为n,则第1步,按从小到大排列原始数据;第2步,计算i=n×p%;第3步,①若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;②若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
特别地:①中位数相当于第50百分位数.②四分位数:第25,50,75百分位数.其中第25百分位数又称第一四分位数或下四分位数,第75百分位数又称第三四分位数或上四分位数.
知识点三 众数、中位数、平均数
知识点四 众数、中位数、平均数在频率分布直方图中的估计
众数:取最高的小矩形底边中点的横坐标;
中位数:把频率分布直方图划分为左右两个面积相等的部分,分界线与x轴交点的横坐标;
平均数:每个小矩形的面积乘小矩形底边中点的横坐标之和.
众数、中位数及平均数都是描述一组数据集中趋势的量.其中平均数与每一个样本数据有关,对数据有“取齐”的作用,代表了一组数据的数值平均水平;众数反映各数据出现的频率,其大小只与这组数据中的部分数据有关,它是样本数据的最大集中点;中位数仅与数据的
排列位置有关.某些数据的变动对中位数没有影响,中位数可能出现在所给的数据中(当数据的个数为奇数时,中间的那个数为中位数),也可能不在所给数据中(当数据的个数为偶数时,中间两个数据的平均数为中位数).
1.判一判(正确的打“√”,错误的打“×”)
(1)第25百分位数表示一组数据中至少有25%的数据小于或等于这个数值.( )
(2)中位数一定是样本数据中的某个数.( )
(3)在一组样本数据中,众数一定是唯一的.( )
答案 (1)√ (2)× (3)×
2.做一做
(1)10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有( )
A.a>b>c B.b>c>a
C.c>a>b D.c>b>a
(2)奥运会体操比赛的计分规则为:当评委亮分后,其成绩先去掉一个最高分,去掉一个最低分,再计算剩下分数的平均值,这是因为( )
A.减少计算量 B.避免故障
C.剔除异常值 D.活跃赛场气氛
(3)某次数学测验中,五位同学的分数分别是89,91,105,105,110.这组数据的中位数是________,众数是________,第60百分位数是________.
(4)10名工人某天生产同一零件,生产的件数是15,17,14,10,15,19,17,16,14,12,这一天10名工人生产的零件的中位数是________,第25百分位数是________.
(5)一组数据按从小到大顺序排列为:13,14,19,x,23,27,28,31,其中中位数是22,则第75百分位数是________.
(6)一个样本按从小到大的顺序排列为10,12,13,x,17,19,21,24,其中中位数为16,则x=________.
答案 (1)D (2)C (3)105 105 105 (4)15 14 (5)27.5 (6)15
题型一 百分位数的计算
例1 某项测试成绩满分为10分,现随机抽取30名学生参加测试,得分如图所示,假设得分值的中位数为m1,第60百分位数为m2,众数为m3,则( )
A.m1<m3<m2 B.m3<m1<m2
C.m3<m2<m1 D.m2<m3<m1
[解析] 由图知m3=5.
由中位数的定义,知第15个数与第16个数的平均数为m1==5.5;由百分位数的定义,且30×60%=18,则第18个数与第19个数的平均数为m2==6.故m3<m1<m2,选B.
[答案] B
计算一组n个数据的第p百分位数的一般步骤:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
某超市为了解顾客的购物量及结算时间等信息,安排一名员工随机收集了100位顾客的相关数据:
已知这100位顾客中的一次购物量超过8件的顾客占55%.
请确定x,y的值,并估计顾客一次购物的第80百分位数.
解 由已知,得25+y+10=55,x+y=35,所以x=15,y=20.
因为第80个数据和第81个数据都是2.5,所以顾客一次购物的结算时间的第80百分位数为2.5.
题型二 百分位数与频率分布直方图
例2 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:高一参赛学生成绩的第60百分位数.
[解] 由图可知,第1个小矩形的面积为0.3,第2个小矩形的面积为0.4,则第60百分位数一定位于[60,70)内,由60+10×=67.5,可以估计高一参赛学生成绩的第60百分位数约为67.5.
利用频率分布直方图求百分位数
百分位数表示左侧小矩形的面积之和.首先确定在哪个区间,然后从左到右所有小矩形计算面积和,百分位数所在区间需按照对应边比例计算面积.
从高三抽出50名学生参加数学竞赛,由成绩得到如图的频率分布直方图.试利用频率分布直方图求这50名学生成绩的75%分位数.
解 由题意可知,前四个小矩形的面积之和为0.6,前五个小矩形的面积之和为0.84>0.75,∴第75百分位数位于第五个小矩形内.由80+×10=86.25,
故75%分位数约为86.25.
题型三 众数、中位数、平均数的计算
例3 某公司的33名职工的月工资(以元为单位)如下表:
(1)求该公司职工月工资的平均数、中位数、众数;
(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是多少?(精确到元)
(3)你认为哪个统计量更能反映这个公司员工的工资水平?结合此问题谈一谈你的看法.
[解] (1)平均数是=×(5500×1+5000×1+3500×2+3000×1+2500×5+2000×3+1500×20)≈2091(元),
中位数是1500元,众数是1500元.
(2)新的平均数是′=×(30000×1+20000×1+3500×2+3000×1+2500×5+2000×3+1500×20)≈3288(元),新的中位数是1500元,新的众数是1500元.
(3)在这个问题中,中位数或众数均能反映该公司员工的工资水平,因为公司中少数人的工资与大多数人的工资差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平.
众数、中位数、平均数的特点
(1)众数、中位数及平均数都是描述一组数据集中趋势的量.
(2)平均数的大小与一组数据里每个数的大小均有关系,任何一个数据的变动都会引起平均数的变动.
(3)众数考查各数出现的频率,其大小与这组数据中部分数据有关,当一组数据中有不少数据重复出现时,其众数往往更能反映问题.
(4)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响,中位数可能出现在所给数据中,也可能不在所给数据中,当一组数据中个别数据较大时,用中位数描述这组数据的集中趋势.
在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
分别求这些运动员成绩的众数、中位数与平均数.
解 在这17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;这组数据的平均数是=×(1.50×2+1.60×3+1.65×2+1.70×3+1.75×4+1.80×1+1.85×1+1.90×1)=≈1.69(m).
答:17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m.
题型四 众数、中位数、平均数与频率分布直方图的关系
例4 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)求这次测试数学成绩的众数;
(2)求这次测试数学成绩的中位数;
(3)求这次测试数学成绩的平均数.
[解] (1)由图知众数为=75.
(2)由图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.
(3)由图知这次数学成绩的平均数为:
×0.005×10+×0.015×10+×0.02×10+×0.03×10+×0.025×10+×0.005×10=72.
用频率分布直方图估计众数、中位数、平均数
(1)众数:取最高小长方形底边中点的横坐标作为众数.
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.
(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.求:
(1)高一参赛学生成绩的众数、中位数;
(2)高一参赛学生的平均成绩.
解 (1)由题图可知参赛学生成绩的众数为65,
又第一个小矩形的面积为0.3,第二个小矩形的面积为0.4,0.3+0.4>0.5,
∴设中位数为60+x,则0.3+x×0.04=0.5,得x=5,
∴参赛学生成绩的中位数为60+5=65.
(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67(分),∴参赛学生的平均成绩约为67分.
题型五 众数、中位数、平均数的实际应用
例5 个体户李某经营一家快餐店,下面是快餐店所有工作人员8月份的工资表:
李某 | 大厨 | 二厨 | 采购员 | 杂工 | 服务生 | 会计 |
30000元 | 4500元 | 3500元 | 4000元 | 3200元 | 3200元 | 4100元 |
(1)计算所有员工8月份的平均工资;
(2)由(1)计算出的平均工资能否反映打工人员这个月收入的一般水平?为什么?
(3)去掉李某的工资后,再计算平均工资,这能代表打工人员当月的收入水平吗?
(4)根据以上计算,以统计的观点,你对(3)的结果有什么看法?
[解] (1)所有员工8月份的平均工资是1=×(30000+4500+3500+4000+3200+3200+4100)=7500(元).
(2)计算出的平均工资不能反映打工人员当月收入的一般水平,可以看出,打工人员的工资都低于平均工资,因为这7个值中有一个极端值——李某的工资特别高,所以他的工资对平均工资的影响较大,同时他也不是打工人员.
(3)去掉李某工资后的平均工资2=×(4500+3500+4000+3200+3200+4100)=3750(元),该平均工资能代表打工人员当月收入的一般水平.
(4)从本题的计算可以看出,个别特殊值对平均数有很大的影响,因此在选择样本时,样本中尽量不用特殊数据.
众数、中位数、平均数的优缺点
众数、中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会
成为缺点,而平均数与每一个样本数据都有关系,可反映出更多的关于样本数据的全体信息,但受数据中的极端值的影响较大,妨碍了对总体估计的可靠性,因此用平均数估计总体有时不可靠.
(1)16位参加百米半决赛同学的成绩各不相同,按成绩取前8位进入决赛.如果小刘知道了自己的成绩后,要判断能否进入决赛,其他15位同学成绩的下列数据中,能使他得出结论的是( )
A.平均数 B.极差
C.中位数 D.众数
(2)某鞋店试销一种新款女鞋,销售情况如下表:
码号 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 |
数量/双 | 2 | 5 | 9 | 16 | 9 | 5 | 3 | 2 |
如果你是鞋店经理,最关心的是哪种码号的鞋销量最大,那么下列统计量中对你来说最重要的是( )
A.平均数 B.众数
C.中位数 D.极差
答案 (1)C (2)B
解析 (1)判断是不是能进入决赛,只要判断是不是前8名,所以只要知道其他15位同学的成绩中是不是有8位高于他,也就是把其他15位同学的成绩排列后看第8位的成绩即可,其成绩高于这个成绩就能进入决赛,低于这个成绩就不能进入决赛,这个第8位的成绩就是这15位同学成绩的中位数.
(2)鞋店经理最关心的是哪种码号的鞋销量最大,由表可知,码号为37的鞋销量最大,共销售了16双,37是这组数据的众数.故选B.
1.北京市2019年5月份某一周的日最高气温(单位:℃)分别为25,28,30,29,31,32,28,则这周的日最高气温的第75百分位数为( )
A.28 ℃ B.29 ℃
C.31 ℃ D.32 ℃
答案 C
解析 将数据由小到大排列为25,28,28,29,30,31,32,因为7×75%=5.25,所以这周的日最高气温的第75百分位数为31 ℃.故选C.
2.已知一组数据按从小到大的顺序排列为14,19,x,23,27,其中位数是22,则x的值为( )
A.24 B.23
C.22 D.21
答案 C
解析 一组数据按从小到大的顺序排列为14,19,x,23,27,则中位数是x.因为中位数是22,所以x=22.故选C.
3.下列说法中,不正确的是( )
A.数据2,4,6,8的中位数是4,6
B.数据1,2,2,3,4,4的众数是2,4
C.一组数据的平均数、众数、中位数有可能是同一个数
D.8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是
答案 A
解析 数据2,4,6,8的中位数为=5,显然A错误,B,C,D都正确.故选A.
4.如图是一次考试结果的统计图,根据该统计图可估计,这次考试的平均分数约为( )
A.46 B.36
C.56 D.60
答案 A
解析 根据题中统计图,可知有4人成绩在[0,20)之间,其考试分数之和约为4×10=40;有8人成绩在[20,40)之间,其考试分数之和约为8×30=240;有10人成绩在[40,60)之间,其考试分数之和约为10×50=500;有6人成绩在[60,80)之间,其考试分数之和约为6×70=420;有2人成绩在[80,100)之间,其考试分数之和约为2×90=180,由此可知,考生总人数为4+8+10+6+
2=30,考试总成绩约为40+240+500+420+180=1380,平均分数约为=46.
5.已知7,4,3和m这四个数的平均数是5;18,9,7,m,n这五个数的平均数为10,求m,n的值.
解 由题意,得解得
∴m的值为6,n的值为10
人教A版 (2019)必修 第二册10.1 随机事件与概率学案: 这是一份人教A版 (2019)必修 第二册10.1 随机事件与概率学案,共55页。
高中数学人教A版 (2019)必修 第二册第九章 统计9.2 用样本估计总体导学案及答案: 这是一份高中数学人教A版 (2019)必修 第二册第九章 统计9.2 用样本估计总体导学案及答案,共4页。
高中数学人教A版 (2019)必修 第二册7.1 复数的概念学案: 这是一份高中数学人教A版 (2019)必修 第二册7.1 复数的概念学案,共6页。