高中数学9.2 用样本估计总体复习练习题
展开目标导航
知识精讲
知识点01 百分位数的定义
1.一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
注意点:
(1)中位数相当于是第50百分位数.除了中位数外,常用的分位数还有第25百分位数,第75百分位数.
(2)第25,50,75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
(3)第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
【即学即练1】 下列表述不正确的是( )
A.50%分位数就是总体的中位数
B.第p百分位数可以有单位
C.一个总体的四分位数有4个
D.样本容量越大,第p百分位数估计总体就越准确
答案 C
解析 一个总体的25%分位数,50%分位数,75%分位数是总体的四分位数,有3个,所以C错误.
反思感悟 分位数是用于衡量数据的位置的度量,但它所衡量的不一定是中心位置.百分位数提供了有关数据项如何在最小值与最大值之间分布的信息.
知识点02 由样本数据求百分位数
【即学即练2】 从某公司生产的产品中,任意抽取12件,得到它们的质量(单位:kg)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0,
分别求出这组数据的25%,75%,95%分位数.
解 将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,
所以12×25%=3,
12×75%=9,
12×95%=11.4,
则25%分位数是eq \f(8.0+8.3,2)=8.15,
75%分位数是eq \f(8.6+8.9,2)=8.75,
95%分位数是第12个数据9.9.
反思感悟 计算一组n个数据的第p百分位数的一般步骤
第1步,按照从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项和第(i+1)项数据的平均数.
知识点03 由频数(频率)分布表求百分位数
【即学即练3】某工厂有工人1 000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现按比例分配分层随机抽样方法(按A类、B类分两层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(生产能力指一天加工的零件数).
(1)A类工人和B类工人中各应抽查多少人?
(2)A类工人中的抽查结果和B类工人中的抽查结果分别如表1和表2所示.
表1
表2
先确定x,y的值,再分别计算A类工人和B类工人生产能力的样本数据的60%分位数(保留两位小数).
解 (1)由已知可得,从A类工人中应抽查100×eq \f(250,1 000)=25(人),从B类工人中应抽查100×eq \f(750,1 000)=75(人).
(2)由题意知4+8+x+5+3=25,解得x=5,
6+y+36+18=75,解得y=15.
A类工人生产能力频率分布表为
由频率分布表可知,A类工人生产能力在120以下的所占比例为16%+32%=48%.
A类工人生产能力在130以下的所占比例为
48%+20%=68%.
因此,60%分位数一定位于[120,130)内.
由120+10×eq \f(0.60-0.48,0.68-0.48)=126,
可以估计A类工人生产能力的样本数据的60%分位数为126.
B类工人生产能力频率分布表为
由频率分布表可知,B类工人生产能力在130以下的所占比例为8%+20%=28%.
B类工人生产能力在140以下的所占比例为
28%+48%=76%.
因此,60%分位数一定位于[130,140)内.
由130+10×eq \f(0.60-0.28,0.76-0.28)≈136.67,
可以估计B类工人生产能力的样本数据的60%分位数约为136.67.
反思感悟 题目给出的分布表与原始数据相比,损失了一些信息,不知道这些具体数据的情况,在求解时,可以把它们看成均匀地分布在某区间上.
能力拓展
考法01 百分位数的定义
【典例1】15%分位数的含义是( )
A.总体中任何一个数小于它的可能性是15%
B.总体中任何一个数小于或等于它的可能性是15%
C.总体中任何一个数大于它的可能性是15%
D.总体中任何一个数大于或等于它的可能性是15%
答案 B
解析 根据第p百分位数的定义可知B正确.
【变式训练】
考法02 由样本数据求百分位数
【典例2】某歌手电视大奖赛中,七位评委对某选手打出如下分数:7.9,8.1,8.4,8.5,8.5,8.7,9.9,则其50%分位数为________.
答案 8.5
解析 ∵7×50%=3.5,
∴其50%分位数为8.5.
考法03 由频数(频率)分布表求百分位数
【典例3】从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频率分布表如下:
(1)求频率分布表中a,b的值;
(2)计算50%分位数,并估计是否有50%的学生的阅读时间达到7.68小时.
解 (1)a=0.06×100=6,b=eq \f(17,100)=0.17.
(2)阅读时间小于6小时的学生所占比例是0.06+0.08+0.17=0.31,
阅读时间小于8小时的所占比例是0.06+0.08+0.17+0.22=0.53,
所以50%分位数在[6,8)内,
所以50%分位数约为6+2×eq \f(0.50-0.31,0.53-0.31)≈7.73.
因为7.73>7.68,
所以估计有50%的学生的阅读时间达到7.68小时.
考法03 由频率分布直方图求百分位数
例4 某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了x人,按年龄分成5组:[20,25),[25,30),[30,35),[35,40),[40,45],得到如图所示的频率分布直方图,已知年龄在[20,25)的参赛者有5人.
(1)求x;
(2)估计抽取的x人的年龄的50%分位数(结果保留整数);
(3)以下是参赛的10人的成绩:90,96,97,95,92,92,98,88,96,99,求这10人成绩的20%分位数和平均数,以这两个数据为依据,评价参赛人员对“一带一路”的认知程度,并谈谈你的感想.
解 (1)第一组频率为0.01×5=0.05,
所以x=eq \f(5,0.05)=100.
(2)由题图可知年龄低于30岁的所占比例为(0.07+0.01)×5×100%=40%,年龄低于35岁的所占比例为(0.01+0.07+0.06)×5×100%=70%,所以抽取的x人的年龄的50%分位数在[30,35)内,由30+5×eq \f(0.50-0.40,0.70-0.40)≈32,所以抽取的x人的年龄的50%分位数约为32.
(3)把参赛的10人的成绩按从小到大的顺序排列为88,90,92,92,95,96,96,97,98,99,
计算10×20%=2,所以这10人成绩的20%分位数为eq \f(90+92,2)=91,这10人成绩的平均数为
eq \f(1,10)×(88+90+92+92+95+96+96+97+98+99)=94.3.
评价:从第20百分位数和平均数来看,参赛人员的认知程度很高.
感想:结合本题和实际,符合社会主义核心价值观即可.
反思感悟 由频率分布直方图求百分位数的方法
(1)要注意频率分布直方图中小矩形的面积,就是数据落在该组的频率.
(2)一般采用方程的思想,设出第p百分位数,根据其意义列出方程并求解即可.
跟踪训练4 为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,你能估计一下60株树木的第50百分位数和第75百分位数吗?
解 由题意知分别落在各区间上的频数
在[80,90)上为60×0.015×10=9,
在[90,100)上为60×0.025×10=15,
在[100,110)上为60×0.030×10=18,
在[110,120)上为60×0.020×10=12,
在[120,130]上为60×0.010×10=6.
从以上数据可知第50百分位数一定落在区间[100,110)上,
由100+10×eq \f(0.5-0.4,0.7-0.4)≈103.3;
第75百分位数一定落在区间[110,120)上,
由110+10×eq \f(0.75-0.7,0.9-0.7)=112.5.
综上可知,第50百分位数和第75百分位数分别估计为103.3 cm,112.5 cm.
分层提分
题组A 基础过关练
1.数据12,14,15,17,19,23,27,30的第70百分位数是( )
A.14 B.17 C.19 D.23
答案 D
解析 因为8×70%=5.6,故第70百分位数是由小到大排列后的第六项数据23.
2.已知100个数据的75%分位数是9.3,则下列说法正确的是( )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第74个数据和第75个数据的平均数
答案 C
解析 因为100×75%=75为整数,所以第75个数据和76个数据的平均数为75%分位数,是9.3,则C正确.
3.下列一组数据的下四分位数是( )
2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6
A.3.2 B.3.0 C.4.4 D.2.5
答案 A
解析 把该组数据按照由小到大排列,可得
2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,
下四分位数即第25百分位数,由10×25%=2.5,不是整数,则第3个数据3.2是下四分位数.
4.一组样本数据的频率分布直方图如图所示,试估计此样本数据的第50百分位数为________.
答案 eq \f(100,9)
解析 样本数据低于10的比例为(0.08+0.02)×4=0.40,样本数据低于14的比例为0.40+0.09×4=0.76,所以此样本数据的第50百分位数在[10,14)内,估计此样本数据的第50百分位数为10+eq \f(0.1,0.36)×4=eq \f(100,9).
题组B 能力提升练
1.数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的30%分位数为( )
A.8.4 B.8.5 C.8.6 D.8.3
答案 A
解析 因为8×30%=2.4,故30%分位数是由小到大排列后的第三项数据8.4.
2.以下数据为参加数学竞赛决赛的15人的成绩(单位:分):78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是( )
A.90 B.90.5 C.91 D.91.5
答案 B
解析 把成绩按从小到大的顺序排列为
56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,
因为15×80%=12,所以这15人成绩的第80百分位数是eq \f(90+91,2)=90.5.
3.(多选)一组数据为6,47,49,15,42,41,7,39,43,40,36,这组数据的一个四分位数是15,则它是( )
A.第一四分位数 B.下四分位数
C.第三四分位数 D.上四分位数
答案 AB
解析 将数据由小到大排列为 6,7,15,36,39,40,41,42,43,47,49,共11项.由11×25%=2.75,故15是第一四分位数或下四分位数.
4.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,第50百分位数为b,则有( )
A.a=13.7,b=15.5 B.a=14,b=15
C.a=12,b=15.5 D.a=14.7,b=15
答案 D
解析 把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a=eq \f(1,10)×(10+12+14+14+15+15+16+17+17+17)=14.7,因为10×50%=5,所以这10名工人一小时内生产零件的第50百分位数为b=eq \f(15+15,2)=15.
5.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,估计棉花纤维的长度的样本数据的80%分位数是( )
A.29 mm B.29.5 mm
C.30 mm D.30.5 mm
答案 A
解析 棉花纤维的长度在30 mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5×100%=85%,
在25 mm以下的比例为85%-0.05×5×100%=60%,
因此,80%分位数一定位于[25,30)内,
由25+5×eq \f(0.80-0.60,0.85-0.60)=29,
可以估计棉花纤维的长度的样本数据的80%分位数是29 mm.
6.(多选)某校高一(6)班某次测试数学成绩累积频数分布折线图如图所示,则下列说法正确的是( )
A.没有人的成绩在30~40分这组内
B.第25百分位数位于40~50分这组内
C.第50百分位数位于60~70分这组内
D.第75百分位数位于70~80分这组内
答案 ABC
解析 由题图知没有人的成绩在30~40分这组内;故A正确;
由40×25%=10,取第10,11项数据的平均数,所以第25百分位数位于40~50分这组内;故B正确;
由40×50%=20,取第20,21项数据的平均数,所以第50百分位数位于60~70分这组内;故C正确;
由40×75%=30,取第30,31项数据的平均数,所以第75百分位数位于60~70分这组内. 故D不正确.
7.某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的第________百分位数.
答案 30
解析 因为分数位于[20,40),[40,60)的频率之和为(0.005+0.01)×20=0.3,所以60分为成绩的第30百分位数.
8.如图是某市2022年4月1日至4月7日每天最高、最低气温的折线统计图,这7天的日最高气温的第10百分位数为______,日最低气温的第80百分位数为______.
答案 24 ℃ 16 ℃
解析 由折线图可知,把日最高气温按照从小到大排序得24,24.5,24.5,25,26,26,27,因为共有7个数据,7×10%=0.7不是整数,所以这7天日最高气温的第10百分位数是第1个数据24 ℃.把日最低气温按照从小到大排序得12,12,13,14,15,16,17,因为共有7个数据,7×80%=5.6,不是整数,所以这7天日最低气温的第80百分位数是第6个数据16 ℃.
9.求下列数据的四分位数.
13,15,12,27,22,24,28,30,31,18,19,20.
解 把这12个数据按从小到大的顺序排列可得
12,13,15,18,19,20,22,24,27,28,30,31,
计算12×25%=3,12×50%=6,12×75%=9,
所以数据的第25百分位数为eq \f(15+18,2)=16.5,
第50百分位数为eq \f(20+22,2)=21,
第75百分位数为eq \f(27+28,2)=27.5.
10.某网络营销部门随机抽查了某市200名网友在2022年6月18日的网购金额(单位:千元),所得数据如下表:
已知网购金额低于3千元与不低于3千元的人数比恰为3∶2.
(1)试确定x,y,p,q的值,并补全频率分布直方图;
(2)估计网购金额的25%分位数(结果保留3位有效数字).
解 (1)根据题意有eq \b\lc\{\rc\ (\a\vs4\al\c1(16+24+x+y+16+14=200,,\f(16+24+x,y+16+14)=\f(3,2),))
解得eq \b\lc\{\rc\ (\a\vs4\al\c1(x=80,,y=50.))
所以p=eq \f(80,200)=0.4,q=eq \f(50,200)=0.25.
补全频率分布直方图如图所示.
(2)由(1)可知,网购金额低于2千元的频率为0.08+0.12=0.2,
网购金额低于3千元的频率为0.2+0.4=0.6,
所以网购金额的25%分位数在[2,3)内,
则网购金额的25%分位数估计为2+eq \f(0.25-0.2,0.6-0.2)×1=2.125≈2.13(千元).
题组C 培优拔尖练
1.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高.现随机抽取10位某地市民,他们的幸福感指数为3,4,5,5,6,7,7,8,9,10.则这组数据的75%分位数等于( )
A.7 B.7.5 C.8 D.8.5
答案 C
解析 由题意,这10个人的幸福指数已经从小到大排列,
因为75%×10=7.5,
所以这10个人的75%分位数是从小到大排列后第8个人的幸福指数,即8.
2.按从小到大排序的一组数据为6,a,b,20,24,若40%分位数为16,则下列情况可能的是( )
A.a=15,b=17 B.a=16,b=17
C.a=17,b=18 D.a=16,b=19
答案 A
解析 由5×40%=2,可知40%分位数为第2项和第3项数据的平均数,即eq \f(a+b,2)=16,所以a+b=32.
3.(多选)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的平均数等于乙的成绩的平均数
C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数
D.甲的成绩的极差等于乙的成绩的极差
答案 BCD
解析 由题图可得,eq \x\t(x)甲=eq \f(4+5+6+7+8,5)=6,eq \x\t(x)乙=eq \f(3×5+6+9,5)=6,A错误,B正确;
甲的成绩的第80百分位数是eq \f(7+8,2)=7.5,乙的成绩的第80百分位数是eq \f(6+9,2)=7.5,二者相等,C正确;甲的成绩的极差为4,乙的成绩的极差也为4,D正确.
4.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间,将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图,如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70%分位数约为____秒.
答案 16.5
解析 设成绩的70%分位数为x,因为eq \f(1+3+7,1+3+7+6+3)=0.55,eq \f(1+3+7+6,1+3+7+6+3)=0.85,所以x∈[16,17),
则成绩的70%分位数约为16+1×eq \f(0.7-0.55,0.85-0.55)=16.5(秒).
5.数据3.2,3.4,3.8,4.2,4.3,4.5,x,6.6的第65百分位数是4.5,则实数x的取值范围是( )
A.[4.5,+∞) B.[4.5,6.6)
C.(4.5,+∞) D.(4.5,6.6]
答案 A
解析 因为8×65%=5.2,所以这组数据的第65百分位数是按从小到大排列后的第6项数据4.5,则x≥4.5.
6.某市为了鼓励居民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量(单位:千瓦时)划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.
(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式;
(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用低于260元的占80%,求a,b的值;
(3)根据(2)中求得的数据计算用电量的75%分位数.
解 (1)当0≤x≤200时,y=0.5x;
当200<x≤400时,
y=0.5×200+0.8×(x-200)=0.8x-60;
当x>400时,
y=0.5×200+0.8×200+1.0×(x-400)=x-140.
所以y与x之间的函数解析式为
y=eq \b\lc\{\rc\ (\a\vs4\al\c1(0.5x,0≤x≤200,,0.8x-60,200<x≤400,,x-140,x>400.))
(2)由(1)可知,当y=260时,x=400,即用电量低于400千瓦时的占80%,
结合频率分布直方图可知
eq \b\lc\{\rc\ (\a\vs4\al\c1(0.001×100+2×100b+0.003×100=0.8,,100a+0.000 5×100=0.2,))
解得a=0.001 5,b=0.002 0.
(3)因为用电量低于300千瓦时的所占比例为
(0.0010+0.0020+0.0030)×100×100%=60%,
用电量低于400千瓦时的占80%,
所以75%分位数在[300,400)内,
所以300+eq \f(0.75-0.6,0.8-0.6)×100=375,即用电量的75%分位数为375千瓦时.
课程标准
课标解读
1.结合实例,能用样本估计百分位数.2.理解百分位数的统计含义.
前面我们用频率分布表、频率分布直方图描述了居民用户月均用水量的样本数据,通过对图表的观察与分析,得出了一些样本数据的频率分布规律,并由此推测了该市全体居民用户月均用水量的分布情况,得出了“大部分居民用户的月均用水量集中在一个较低值区域”等推断.接下来的问题是,如何利用这些信息,为政府决策服务呢?
生产能力分组
[100,110)
[110,120)
[120,130)
[130,140)
[140,150]
人数
4
8
x
5
3
生产能力分组
[110,120)
[120,130)
[130,140)
[140,150]
人数
6
y
36
18
生产能力分组
[100,110)
[110,120)
[120,130)
[130,140)
[140,150]
频率
0.16
0.32
0.20
0.20
0.12
生产能力分组
[110,120)
[120,130)
[130,140)
[140,150]
频率
0.08
0.20
0.48
0.24
排号
分组
频数
频率
1
[0,2)
6
0.06
2
[2,4)
8
0.08
3
[4,6)
17
b
4
[6,8)
22
0.22
5
[8,10)
25
0.25
6
[10,12)
12
0.12
7
[12,14)
a
0.06
8
[14,16)
2
0.02
9
[16,18]
2
0.02
合计
100
1
网购金额(单位:千元)
人数
频率
[0,1)
16
0.08
[1,2)
24
0.12
[2,3)
x
p
[3,4)
y
q
[4,5)
16
0.08
[5,6]
14
0.07
合计
200
1.00
高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体同步练习题: 这是一份高中数学人教A版 (2019)必修 第二册<a href="/sx/tb_c4000310_t7/?tag_id=28" target="_blank">9.2 用样本估计总体同步练习题</a>,文件包含第39讲频率分布直方图总体取值规律总体百分位数的估计5种常考题型原卷版docx、第39讲频率分布直方图总体取值规律总体百分位数的估计5种常考题型解析版docx等2份试卷配套教学资源,其中试卷共61页, 欢迎下载使用。
数学必修 第二册9.2 用样本估计总体优秀课时作业: 这是一份数学必修 第二册9.2 用样本估计总体优秀课时作业,文件包含人教A版高中数学必修第二册同步培优讲义专题93用样本估计总体重难点题型精讲教师版doc、人教A版高中数学必修第二册同步培优讲义专题93用样本估计总体重难点题型精讲原卷版doc等2份试卷配套教学资源,其中试卷共37页, 欢迎下载使用。
高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体测试题: 这是一份高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体测试题,文件包含人教A版高中数学必修第二册同步讲义第41讲总体离散程度的估计原卷版doc、人教A版高中数学必修第二册同步讲义第41讲总体离散程度的估计含解析doc等2份试卷配套教学资源,其中试卷共20页, 欢迎下载使用。