湘教版(2019)必修 第一册6.4 用样本估计总体导学案
展开
6.4.3 用频率分布直方图估计总体分布
新课程标准解读 | 核心素养 |
能根据实际问题,用频率分布直方图结合数学特征进行数据分析,从而估计总体分布,会运用所学知识和方法解决实际问题 | 直观想象、数据分析、数学建模、数学运算 |
为了了解学生的课业负担,甲、乙两所学校分别抽取了200名在校生,了解他们完成作业所需的时间,并分别作出了频数分布直方图如图①②所示,其中分组的区间都为[0.5,1),[1,1.5),[1.5,2),[2,2.5),[2.5,3].记甲学校所得数据的中位数为x,乙学校所得数据的中位数为y.
[问题] 你能判断出x,y的大小吗?
知识点 频率分布直方图与对应样本数据中的平均数、众数、中位数
1.众数:取最高小长方形底边中点的横坐标作为众数.
2.中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.
3.平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
为了调查某厂工人生产某种产品的能力,随机抽样调查了20位工人某天生产该产品的数量得到频率分布直方图如图,则:
(1)这20名工人中一天生产该产品数量在[55,75)的人数是________;
(2)这20名工人一天生产该产品数量的中位数为________;
(3)这20名工人一天生产该产品数量的平均数为________.
解析:(1)在[55,75)的人数为(0.040×10+0.025×10)×20=13.
(2)设中位数为x,则0.2+(x-55)×0.04=0.5,x=62.5.
(3)0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64.
答案:(1)13 (2)62.5 (3)64
频率分布直方图的识读 |
[例1] (1)如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为( )
A.20 B.30
C.40 D.50
(2)(多选)为征求个人所得税法修改建议,某机构调查了10 000名当地职工的月收入情况,并根据所得数据画出了样本的频率分布直方图.
下列说法正确的是( )
A.月收入低于5 000元的职工有5 500名
B.如果个税起征点调整至5 000元,估计有50%的当地职工会被征税
C.月收入高于或等于7 000元的职工约为当地职工的5%
D.根据此次调查,为使60%以上的职工不用缴纳个税,起征点应位于[5 000,6 000)内
[解析] (1)样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.故选B.
(2)月收入低于5 000元的职工有10 000×(0.000 1+0.000 2+0.000 25)×1 000=5 500(名),A正确;如果个税起征点调整至5 000元,由(0.000 25+0.000 15+0.000 05)×1 000×100%=45%,可估计有45%的当地职工会被征税,B不正确;月收入高于或等于7 000元的职工约占0.000 05×1 000×100%=5%,C正确;月收入低于5 000元的频率为0.55,低于6 000元的频率为0.8,D正确.
[答案] (1)B (2)ACD
1.频率分布直方图的性质
(1)频率分布表中,各小组频数之和等于数据个数总和,各小组频率之和等于1;频率分布直方图中,纵坐标表示,频率=组距×;
(2)频率分布表中频率的和为1;频率分布直方图中,每个小矩形的面积表示相应组的频率,所有小矩形的面积的总和等于1.
2.利用频率分布直方图可得到以下信息
(1)样本总数;
(2)各段中的频数,频率;
(3)均值;
(4)样本整体发展趋势(折线图)等.
[跟踪训练]
对某市“四城同创”活动中800名志愿者的年龄进行抽样调查,统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得
(1)年龄组[25,30)对应小矩形的高度为________;
(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)内的人数为________.
解析:(1)设年龄组[25,30)对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.(2)由(1)得志愿者年龄在[25,35)内的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)内的人数约为0.55×800=440.
答案:(1)0.04 (2)440
由频率分布直方图求平均数、中位数和众数 |
[例2] 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)求这次测试数学成绩的众数;
(2)求这次测试数学成绩的中位数.
[解] (1)由题图知众数为=75(分).
(2)由题图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.故这次测试数学成绩的中位数为73.3分.
[母题探究]
1.(变设问)若本例的条件不变,求数学成绩的平均分.
解:由题图知这次数学成绩的平均分为×0.005×10+×0.015×10+×0.02×10+×0.03×10+×0.025×10+×0.005×10=72(分).
2.(变设问)若本例条件不变,求80分以下的学生人数.
解:[40,80)分的频率为(0.005+0.015+0.020+0.030)×10=0.7,所以80分以下的学生人数为80×0.7=56.
频率分布直方图对样本平均数及中位数的影响
(1)对一个单峰的频率分布直方图来说,如果直方图的形状是对称的(图①)那么平均数和中位数应该大体上差不多;
(2)如果直方图在右边“拖尾”(如图②)那么平均数大于中位数;
(3)如果直方图在左边“拖尾”(如图③)那么平均数小于中位数.
[跟踪训练]
某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.
求:(1)高一参赛学生成绩的众数、中位数;
(2)高一参赛学生的平均成绩.
解:(1)用频率分布直方图中最高矩形所在的区间的中点值作为众数的近似值,得众数为65分,又∵第一个小矩形的面积为0.3,设第二个小矩形底边的一部分长为x,则x×0.04=0.2,得x=5,∴中位数为60+5=65(分).
(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67(分),∴平均成绩约为67分.
利用样本频率分布直方图估计总体分布 |
[例3] 某超市从甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,整理得到甲种酸奶日销售量的频率分布表和乙种酸奶日销售量的频率分布直方图.
分组(日销售量) | 频率(甲种酸奶) |
[0,10) | 0.10 |
[10,20) | 0.20 |
[20,30) | 0.30 |
[30,40) | 0.25 |
[40,50] | 0.15 |
合计 | 1 |
(1)求出频率分布直方图中a的值,并作出甲种酸奶日销售量的频率分布直方图;
(2)记甲种酸奶与乙种酸奶日销售量(单位:箱)的方差分别为s,s,试比较s和s的大小;
(3)假设同一组中的每个数据可用该组区间的中间值代替,试估计乙种酸奶在未来一个月(按30天计算)的销售总量.
[解] (1)由乙种酸奶日销售量的频率分布直方图可得
10a=1-(0.010+0.020+0.030+0.025)×10=0.15,解得a=0.015.
根据表中数据可作出甲种酸奶日销售量的频率分布直方图如图所示:
(2)法一:记甲、乙两种酸奶日销售量的平均数分别为甲,乙,
则甲=5×0.1+15×0.2+25×0.3+35×0.25+45×0.15=26.5(箱),
乙=5×0.2+15×0.1+25×0.3+35×0.15+45×0.25=26.5(箱),
所以s=(5-26.5)2×0.1+(15-26.5)2×0.2+(25-26.5)2×0.3+(35-26.5)2×0.25+(45-26.5)2×0.15=142.75,
s=(5-26.5)2×0.2+(15-26.5)2×0.1+(25-26.5)2×0.3+(35-26.5)2×0.15+(45-26.5)2×0.25=202.75,所以s<s.
法二:比较两种酸奶的频率分布直方图,数据越集中,则方差越小,由频率分布直方图可得,甲种酸奶对应的数据更集中,故甲的方差小于乙的方差,即s<s.
(3)由(2)得乙种酸奶的平均日销售量为26.5箱,
故乙种酸奶未来一个月的销售总量为26.5×30=795(箱).
1.频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.
2.频率分布是指各个小组数据在容量中所占比例的大小,可以用样本的频率分布估计总体的频率分布,频率分布表是反映样本的频率分布的表格.通过频率分布直方图和频率分布表可以看到样本的频率分布.
[跟踪训练]
(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
解:(1)由已知得0.70=a+0.20+0.15,
故a=0.35,
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
1.某班全体学生英语测试成绩(单位:分)的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )
A.45 B.50
C.55 D.60
解析:选B 根据频率分布直方图,可知低于60分的人数的频率是(0.005+0.010)×20=0.3,所以该班的学生人数是=50.
2.如图是一次考试结果的统计图,根据该图可估计,这次考试的平均分数为________.
解析:根据题中统计图,可估计有4人成绩在[0,20)之间,其考试分数之和为4×10=40;有8人成绩在[20,40)之间,其考试分数之和为8×30=240;有10人成绩在[40,60)之间,其考试分数之和为10×50=500;有6人成绩在[60,80)之间,其考试分数之和为6×70=420;有2人成绩在[80,100]之间,其考试分数之和为2×90=180,由此可知,考生总人数为4+8+10+6+2=30,考试总成绩为40+240+500+420+180=1 380,平均分数为=46.
答案:46
3.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少?
解:(1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因此第二小组的频率为=0.08.
又因为第二小组频率=,
所以样本容量===150.
(2)由题图可估计该校高一学生的达标率约为
×100%=88%.
高中数学6.4 用样本估计总体导学案及答案: 这是一份高中数学6.4 用样本估计总体导学案及答案,共14页。
人教版新课标A必修32.2.1用样本的频率分布估计总体学案: 这是一份人教版新课标A必修32.2.1用样本的频率分布估计总体学案,共4页。学案主要包含了选择题,填空题,计算题等内容,欢迎下载使用。
人教版新课标A必修32.2.1用样本的频率分布估计总体学案: 这是一份人教版新课标A必修32.2.1用样本的频率分布估计总体学案,共3页。