高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体示范课ppt课件
展开为了了解总体的情况,前面我们研究了如何通过样本的分布规律估计总体的分布规律。但有时候,我们可能不太关心总体的分布规律,而更关注总体取值在某一方面的特征. 例如,对于某县今年小麦的收成情况,我们可能会更关注该县今年小麦的总产量或平均每公顷的产量,而不是产量的分布;对于一个国家国民的身高情况,我们可能会更关注身高的平均数或中位数,而不是身高的分布;等等. 在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.
例1 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
众数、中位数、平均数的计算
分别求这些运动员成绩的众数、中位数与平均数.
解 在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70.
故17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m.
众数:一组数据中出现次数最多的数.中位数:一组数据按大小顺序依次排序后, 当数据个数是奇数时,处在最中间的数是中位数; 当数据个数是偶数时,最中间两个数的平均数是中位数.平均数:
问题1 平均数、中位数、众数是什么?
下面我们通过具体实例进一步了解这些量的意义,探究它们之间的联系与区别,并根据样本的集中趋势估计总体的集中趋势.
例2 某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群 13,13,14,15,15,15,15,16,17,17; 乙群 54,3,4,4,5,5,6,6,6,57.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?
(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?
中位数为15岁,众数为15岁. 平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.
中位数为5.5岁,众数为6岁. 由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.
众数、中位数、平均数有没有发生变化?
通过计算可得, 平均数由原来的15岁变为10.3, 中位数没有变化, 还是5.5.
样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变;
中位数只利用了样本数据中间位置的一个或两个值,所以不是任何一个样本数据的改变都会引起中位数的改变
与中位数比较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感.
1.平均数与中位数的区别与联系
探究1 平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在下图的三种分布形态中,平均数和中位数的大小存在什么关系?
(1)直方图的形状是对称的,平均数和中位数应该大体上差不多
和中位数相比,平均数总是在“长尾巴”那边.
(2)直方图在右边“拖尾”,平均数大于中位数
(3)直方图在左边“拖尾”,那么平均数小于中位数
如果一组数据的平均数和中位数相差较大,那么可以推断这组数据一定是不对称的.
如果样本平均数大于样本中位数,说明数据中存在较大的极端值;反之,说明数据中不存在较大的极端值.
解:为了更直观地观察数据的特征,我们用条形图来表示表中的数据.
通过观察条形图可以发现,选择校服规格为“165”的女生频数最高,所以用众数165作为该校高一年级女生校服的规格比较合适. 由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理.
众数只利用了出现次数最多的那个值的信息.众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.因此,众数只能传递数据中的信息的很少的一部分,对极端值也不敏感.
对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;
对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
在频率分布直方图中,我们无法知道每个组内的数据是如何分布的.此时,通常假设它们在组内均匀分布.
探究2 样本的平均数、中位数和众数可以分别作为总体的平均数、中位数和众数的估计,但在某些情况下我们无法获知原始的样本数据. 如何由频率分布直方图估计样本的平均数、中位数和众数? 你能以图9.2-1中频率分布直方图提供的信息为例,给出估计方法吗?
2. 根据频率分布直方图计算样本平均数:
假设数据在组内均匀分布.
样本平均数可以表示为数据与它的频率的成绩之和
↓小矩形底边中点横坐标
每个小矩形底边中点的横坐标与小矩形的面积的乘积之和
这个结果与根据原始数据计算的样本平均数8.79相差不大.
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
∴中位数落在区间[4.2,7.2)内
这个结果与根据原始数据求得的中位数6.8相差不大.
中位数左边的直方图面积和右边的直方图面积相等
众数常用在描述分类型数据中,众数5.7让我们知道月均用水量在区间[4.2,7.2)的居民用户最多. 这个信息具有实际意义.
在频率分布直方图中,月均用水量在区间[4.2,7.2)内的居民最多,可以将这个区间的中点5.7作为众数的估计值.
——找众数、中位数、平均数
众数:最高矩形的中点
由频率分布直方图估计总体的集中趋势
中位数:中位数左边的直方图面积和右边的直方图面积相等
平均数:每个小矩形底边中点的横坐标与小矩形的面积的乘积之和
平均数、中位数、众数各自的含义、特点及优缺点:
每个小矩形面积乘以小矩形底边中点的横坐标之和
与每一个数据有关,任何一个数的改变都会引起它的改变
把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标
只利用了样本数据中间位置的一个或两个值,并未利用其他数据
最高矩形底边中点的横坐标
只利用了出现次数最多的那个值的信息
受极端数据的影响较大.
代表了样本数据更多的信息.
只能表达样本数据中的少量信息.
容易计算,不受少数几个极端值的影响.
练习 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)求这次测试数学成绩的众数;(2)求这次测试数学成绩的中位数.(3)求这次测试数学成绩的平均分.
∴中位数落在区间[70,80)内,
解:(1) 由直方图可知,众数为75分. 中位数约为
变式 为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则: (1) 这20名工人中一天生产该产品数量在[55, 75)的人数是______; (2) 这20名工人中一天生产该产品数量的中位数为______; (3) 这20名工人中一天生产该产品数量的平均数为______.
1. 根据表9.2-2中的数据,估计该市2015年全年空气质量指数的平均数、中位数和第80百分位数.(注:已知该市属于“严重污染”等级的空气质量指数不超过400)
25×22.8%+75×33.2%+125×18.6%+175×13.4%+250×8.2%+350×3.8%≈111.
由上表数据可知,中位数在50~100之间,其估计值为
由上表数据可知,空气质量指数在0~150的频率为0.746,0~200的频率为0.88.所以第80百分位数在150~200之间,其估计值为
总体的各种数字特征都可以由两种途径来估计:
①直接利用样本数据; ②由频率分布直方图来估计
①众数:最高矩形的中点.
②中位数:中位数左边的直方图面积和右边的直方图面积相等.
③平均数:每个小矩形底边中点的横坐标与小矩形的面积的乘积之和.
高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体精品ppt课件: 这是一份高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体精品ppt课件,文件包含923《总体集中趋势的估计》课件人教版高中数学必修二pptx、923《总体集中趋势的估计》分层练习基础+提升含答案解析docx等2份课件配套教学资源,其中PPT共32页, 欢迎下载使用。
人教A版 (2019)必修 第二册9.2 用样本估计总体教课课件ppt: 这是一份人教A版 (2019)必修 第二册9.2 用样本估计总体教课课件ppt,共37页。PPT课件主要包含了小到大,n×p%,平均数,答案A,出现次数最多,横坐标,答案9696等内容,欢迎下载使用。
高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体优秀ppt课件: 这是一份高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体优秀ppt课件,共29页。PPT课件主要包含了学习目标,新知学习,易错辨析,典例剖析,反思感悟,跟踪训练,随堂小测,ABC,课堂小结等内容,欢迎下载使用。