高中数学湘教版(2019)必修 第一册6.4 用样本估计总体精品ppt课件
展开6.4.4 百分位数
课标要求 结合实例,能用样本估计百分位数,理解百分位数的统计含义.
素养要求 应用百分位数,把实际问题转化为数学问题,发展学生的数学建模、数学运算和数据分析素养.
自 主 梳 理
1.百分位数
(1)百分位数是位于按一定顺序排列的一组数据中某一个百分位置的数值;以Pr表示,其中r是区间[1,99]内的整数.
(2)一个百分位数Pr将总体或样本的全部观测值分为两部分,有r%个观测值小于或等于它,有(100-r)%个观测值大于或等于它,当r%=50%时,Pr即对应中位数.
2.四分位数
25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
自 主 检 验
1.思考辨析,判断正误
(1)若一组样本数据各不相等,则其75%分位数大于25%分位数.(√)
(2)若一组样本数据的10%分位数是23,则在这组数据中有10%的数据大于23.(×)
提示 若一组样本数据的10%分位数是23,则在这组数据中有10%的数据小于或等于23.
(3)若一组样本数据的24%分位数是24,则在这组数据中至少有76%的数据大于或等于24.(√)
(4)全班有80%的学生测验及格,其中的80%是百分位数.(×)
提示 该80%是及格学生占全体的百分比.
2.一组数据的第50分位数是该数据的( )
A.众数 B.中位数
C.平均数 D.任一数据
答案 B
3.(多选)下列表述正确的是( )
A.50%分位数就是总体的中位数
B.第p百分位数可以有单位
C.一个总体的四分位数有4个
D.样本容量越大,第p百分位数估计总体就越准确
答案 ABD
解析 一个总体的25%分位数,50%分位数,75%分位数是总体的四分位数,有3个,所以C错误.其余选项都正确.
4.下列一组数据的第25百分位数是( )
2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6
A.3.2 B.3.0
C.4.4 D.2.5
答案 A
解析 把该组数据按照由小到大排列,可得:
2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,
由c=10×25%=2.5,不是整数,则第3个数据3.2,是第25百分位数.
题型一 由样本数据求百分位数
例1 求下列数据的四分位数.
13,15,12,27,22,24,28,30,31,18,19,20,
解 把12个数据按从小到大的顺序排列可得:12,13,15,18,19,20,22,24,27,28,30,31,计算12×25%=3,12×50%=6,12×75%=9,
所以数据的第25百分位数为=16.5,
第50百分位数为=21,
第75百分位数为=27.5.
思维升华 计算一组n个数据的第Pr百分位数的步骤
(1)排列:设观测数据已经按从小到大的顺序排列,如x1,x2,…,xn.
(2)算c:计算c=n×r%.
(3)定数:若c不是整数,用m表示比c大的最小整数,则所求的Pr是xm;如果c是整数,则所求的Pr=.
训练1 计算下列数据:44,57,59,60,61,63,66,58,62,67的百分位数P30,P45,P80.
解 将数据从小到大顺序排列为:44,57,58,59,60,61,62,63,66,67,数据量n=10,
因为c=10×30%=3是整数,
所以P30==58.5,
因为c=10×45%=4.5不是整数,
5是比4.5大的最小整数,
所以P45=x5=60,
因为c=10×80%=8是整数,
所以P80==64.5.
题型二 由频数(频率)分布表求百分位数
例2 某工厂有工人1 000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样方法(按A类、B类分两层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(生产能力指一天加工的零件数).
(1)A类工人中和B类工人中各应抽查多少人?
(2)从A类工人中的抽查结果和从B类工人中的抽查结果分别如下表1和表2.
表1
生产能力分组 | [100,110) | [110,120) | [120,130) | [130,140) | [140,150] |
人数 | 4 | 8 | x | 5 | 3 |
表2
生产能力分组 | [110,120) | [120,130) | [130,140) | [140,150] |
人数 | 6 | y | 36 | 18 |
先确定x,y的值,再分别计算A类工人和B类工人生产能力的样本数据的60%分位数(保留两位小数).
解 (1)由已知可得,抽样比k==,
故从A类工人中应抽查250×=25(人),
从B类工人中应抽查750×=75(人).
(2)由题意知4+8+x+5+3=25,得x=5,
6+y+36+18=75,得y=15.
A类工人生产能力频率分布表为
生产能力分组 | [100,110) | [110,120) | [120,130) | [130,140) | [140,150] |
频率 | 0.16 | 0.32 | 0.20 | 0.20 | 0.12 |
由频率分布表可知,A类工人生产能力在120以下的所占比例为16%+32%=48%.
A类工人生产能力在130以下的所占比例为48%+20%=68%.
因此,60%分位数一定位于[120,130)内.
由120+10×=126,
可以估计A类工人生产能力的样本数据的60%分位数为126.
B类工人生产能力频率分布表为
生产能力分组 | [110,120) | [120,130) | [130,140) | [140,150] |
频率 | 0.08 | 0.20 | 0.48 | 0.24 |
由频率分布表可知,B类工人生产能力在130以下的所占比例为8%+20%=28%.
B类工人生产能力在140以下的所占比例为28%+48%=76%.
因此,60%分位数一定位于[130,140)内.
由130+10×≈136.67,
可以估计B类工人生产能力的样本数据的60%分位数约为136.67.
思维升华 题目给出的分布表与原始数据相比,损失了一些信息,不知道这些具体数据的情况,在求解时,可以把它们看成均匀地分布在某区间上.
训练2 从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频率分布表如下:
排号 | 分组 | 频数 | 频率 |
1 | [0,2) | 6 | 0.06 |
2 | [2,4) | 8 | 0.08 |
3 | [4,6) | 17 | b |
4 | [6,8) | 22 | 0.22 |
5 | [8,10) | 25 | 0.25 |
6 | [10,12) | 12 | 0.12 |
7 | [12,14) | a | 0.06 |
8 | [14,16) | 2 | 0.02 |
9 | [16,18) | 2 | 0.02 |
合计 | 100 | 1 |
|
(1)求频率分布表中a,b的值;
(2)计算50%分位数,并估计是否有50%的学生的阅读时间达到7.68.
解 (1)a=0.06×100=6,b==0.17.
(2)阅读时间小于6小时的所占比例是0.06+0.08+0.17=0.31,
阅读时间小于8小时的所占比例是0.06+0.08+0.17+0.22=0.53,
所以50%分位数在[6,8)内,
所以50%分位数约为6+2×≈7.73.
因为7.73>7.68,
所以估计有50%的学生的阅读时间达到7.68.
题型三 由频率分布直方图求百分位数
例3 某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了x人,按年龄分成5组(第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45]),得到如图所示的频率分布直方图,已知第一组有5人.
(1)求x;
(2)求抽取的x人的年龄的50%分位数(结果保留整数);
(3)以下是参赛的10人的成绩:90,96,97,95,92,92,98,88,96,99,求这10人成绩的20%分位数和平均数,以这两个数据为依据,评价参赛人员对“一带一路”的认知程度,并谈谈你的感想.
解 (1)第一组频率为0.01×5=0.05,
所以x==100.
(2)由题图可知年龄低于30岁的所占比例为40%,年龄低于35岁的所占比例为70%,
所以抽取的x人的年龄的50%分位数在[30,35)内,
由30+5×=≈32,
所以抽取的x人的年龄的50%分位数为32.
(3)把参赛的10人的成绩按从小到大的顺序排列:88,90,92,92,95,96,96,97,98,99,
计算10×20%=2,
所以这10人成绩的20%分位数为=91,
这10人成绩的平均数为×(88+90+92+92+95+96+96+97+98+99)=94.3.
评价:从第20百分位数和平均数来看,参赛人员的认知程度很高.
感想:略(结合本题和实际,符合社会主义核心价值观即可).
思维升华 由频率分布直方图求百分位数的方法
(1)要注意频率分布直方图中小矩形的面积,就是数据落在该组的频率.
(2)一般采用方程的思想,设出第p百分位数,根据其意义列出方程并求解即可.
训练3 某市为了鼓励居民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.
(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式;
(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用低于260元的占80%,求a,b的值;
(3)根据(2)中求得的数据计算用电量的第75百分位数.
解 (1)当0≤x≤200时,y=0.5x;
当200<x≤400时,
y=0.5×200+0.8×(x-200)=0.8x-60;
当x>400时,
y=0.5×200+0.8×200+1.0×(x-400)=x-140.
所以y与x之间的函数解析式为y=
(2)由(1)可知,当y=260时,x=400,即用电量低于400千瓦时的占80%,
结合频率分布直方图可知
解得a=0.001 5,b=0.002 0.
(3)设第75百分位数为m,
因为用电量低于300千瓦时的所占比例为
(0.001+0.002+0.003)×100=60%,
用电量低于400千瓦时的占80%,
所以第75百分位数在[300,400)内,
所以300+100×=375,
即用电量的第75百分位数为375千瓦时.
[课堂小结]
1.求第p百分位数时,应先将数据从小到大排列.
2.求一组数据的百分位数时,掌握其步骤:①按照从小到大排列原始数据;②计算c=n×r%;③若c不是整数,用m表示比c大的最小整数,则所求的Pr是xm;如果c是整数,则所求的Pr=.
一、基础达标
1.数据12,14,15,17,19,23,27,30的第70百分位数是( )
A.14 B.17
C.19 D.23
答案 D
解析 因为8×70%=5.6,故70%分位数是从小到大排列后的第6项数据23.
2.一组数据为6,47,49,15,42,41,7,39,43,40,36,则这组数据的一个四分位数是15,则它是第( )
A.15百分位数 B.25百分位数
C.50百分位数 D.75百分位数
答案 B
解析 将数据由小到大排列为6,7,15,36,39,40,41,42,43,47,49,共11项.
由11×25%=2.75,故第25百分位数是15.
3.以下数据为参加数学竞赛决赛的15人的成绩:(单位:分)
78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,
则这15人成绩的第80百分位数是( )
A.90 B.90.5
C.91 D.91.5
答案 B
解析 把成绩按从小到大的顺序排列为:
56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,
因为15×80%=12,所以这15人成绩的第80百分位数是=90.5.
4.已知100个数据的第75百分位数是9.3,则下列说法正确的是( )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数
答案 C
解析 因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,选C.
5.已知甲、乙两组数据(已按从小到大的顺序排列):
甲组:27,28,39,40,m,50;
乙组:24,n,34,43,48,52;
若这两组数据的第30百分位数、第80百分位数分别相等,则等于( )
A. B.
C. D.
答案 A
解析 因为30%×6=1.8,80%×6=4.8,
所以第30百分位数为n=28,
第80百分位数为m=48,
所以==.
6.某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的第________百分位数.
答案 30
解析 因为分数位于[20,40),[40,60)的频率之和为(0.005+0.01)×20=0.3,
所以60分为成绩的第30百分位数.
7.已知30个数据的第60百分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是______.
答案 8.6
解析 由于30×60%=18,
设第19个数据为x,
则=8.2,解得x=8.6,
即第19个数据是8.6.
8.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70%分位数约为________秒.
答案 16.5
解析 设成绩的70%分位数为x,
因为=0.55,=0.85,
所以x∈[16,17),
所以0.55+(x-16)×=0.70,解得x=16.5(秒).
9.如图是某市2022年4月1日至4月7日每天最高、最低气温的折线统计图,求这7天的日最高气温的第10百分位数和日最低气温的第80百分位数.
解 由折线图可知,把日最高气温按照从小到大排序,得
24,24.5,24.5,25,26,26,27,
因为共有7个数据,所以7×10%=0.7,不是整数,所以这7天日最高气温的第10百分位数是第1个数据,为24 ℃.
把日最低气温按照从小到大排序,得
12,12,13,14,15,16,17,
因为共有7个数据,所以7×80%=5.6,不是整数,所以这7天日最低气温的第80百分位数是第6个数据,为16 ℃.
10.省教育厅为了了解和掌握2022年高考考生的实际答卷情况,随机地取出了100名考生的数学成绩(单位:分),将数据分成了11组,制成了如图所示的频率分布表:
分组 | 频数 | 频率 |
[80,85) | 1 | 0.01 |
[85,90) | 2 | 0.02 |
[90,95) | 4 | 0.04 |
[95,100) | 14 | 0.14 |
[100,105) | 24 | 0.24 |
[105,110) | 15 | 0.15 |
[110,115) | 12 | 0.12 |
[115,120) | 9 | 0.09 |
[120,125) | 11 | 0.11 |
[125,130) | 6 | 0.06 |
[130,135] | 2 | 0.02 |
合计 | 100 | 1 |
(1)求样本数据的第60,第80百分位数;
(2)估计2022年高考考生的数学成绩的第90百分位数.
解 从频率分布表得,前六组的频率之和为0.01+0.02+0.04+0.14+0.24+0.15=0.60,
前七组的频率之和为0.60+0.12=0.72,
前八组的频率之和为0.72+0.09=0.81,
前九组的频率之和为0.81+0.11=0.92.
(1)由前六组的频率之和为0.60,得样本数据的第60百分位数为110,
样本数据的第80百分位数一定在第八组[115,120)内,
由115+5×≈119.4,
估计样本数据的第80百分位数约为119.4.
(2)由前八组的频率之和为0.81,前九组的频率之和为0.92,
知第90百分位数一定在第九组[120,125)内,
由120+5×≈124.1,
估计2022年高考考生的数学成绩的第90百分位数为124.1.
二、能力提升
11.数据3.2,3.4,3.8,4.2,4.3,4.5,x,6.6的第65百分位数是4.5,则实数x的取值范围是( )
A.[4.5,+∞) B.[4.5,6.6)
C.(4.5,+∞) D.(4.5,6.6]
答案 A
解析 因为8×65%=5.2,
所以这组数据的第65百分位数是第6项数据4.5,
则x≥4.5,故选A.
12.(多选)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的平均数等于乙的成绩的平均数
C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数
D.甲的成绩的极差等于乙的成绩的极差
答案 BCD
解析 由题图可得,甲==6,乙==6,A项错误,B项正确;
甲的成绩的第80百分位数=7.5,乙的成绩的第80百分位数=7.5,所以二者相等,所以C项正确;
甲的成绩的极差为4,乙的成绩的极差也为4,D项正确.
13.某网络营销部门随机抽查了某市200名网友在2022年11月11日的网购金额,所得数据如下表:
网购金额(单位:千元) | 人数 | 频率 |
[0,1) | 16 | 0.08 |
[1,2) | 24 | 0.12 |
[2,3) | x | p |
[3,4) | y | q |
[4,5) | 16 | 0.08 |
[5,6] | 14 | 0.07 |
合计 | 200 | 1.00 |
已知网购金额不超过3千元与超过3千元的人数比恰为3∶2.
(1)试确定x,y,p,q的值,并补全频率分布直方图(如图);
(2)估计网购金额的第25百分位数(结果保留3位有效数字).
解 (1)根据题意有:
解得
所以p=0.4,q=0.25.
补全频率分布直方图如图所示:
(2)由(1)可知,网购金额不高于2千元的频率为0.08+0.12=0.2,
网购金额不高于3千元的频率为0.2+0.4=0.6,
所以网购金额的第25百分位数在[2,3)内,
则网购金额的第25百分位数为2+×1=2.125≈2.13(千元).
三、创新拓展
14.某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:
(1)估计总体400名学生中分数小于70的人数;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)根据该大学规定,把15%的学生划定为不及格,利用(2)中的数据,确定本次测试的及格分数线,低于及格分数线的学生需要补考.
解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为
(0.02+0.04)×10=0.6,
所以样本中分数小于70的频率为1-0.6=0.4.
所以估计总体400名学生中分数小于70的人数为400×0.4=160.
(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,
分数在区间[40,50)内的人数为
100-100×0.9-5=5.
所以总体中分数在区间[40,50)内的人数估计为400×=20.
(3)设分数的第15百分位数为x,
分数小于50的频率为1-(0.01+0.02+0.04+0.02)×10=0.1,分数小于60的频率为0.1+0.1=0.2,
所以x∈[50,60),
则0.1+(x-50)×0.01=0.15,
解得x=55,
则本次考试的及格分数线为55分.
新湘教版高中数学必修一《限时小练62 百分位数》PPT课件+习题: 这是一份数学必修 第一册本册综合精品习题ppt课件,文件包含限时小练62百分位数doc、限时小练62百分位数pptx等2份课件配套教学资源,其中PPT共0页, 欢迎下载使用。
高中数学湘教版(2019)必修 第一册5.1 任意角与弧度制完美版课件ppt: 这是一份高中数学湘教版(2019)必修 第一册5.1 任意角与弧度制完美版课件ppt,文件包含512弧度制doc、512弧度制pptx等2份课件配套教学资源,其中PPT共0页, 欢迎下载使用。
湘教版(2019)必修 第一册4.3 对数函数优秀课件ppt: 这是一份湘教版(2019)必修 第一册4.3 对数函数优秀课件ppt,文件包含431对数的概念doc、431对数的概念pptx等2份课件配套教学资源,其中PPT共0页, 欢迎下载使用。