数学5.1.2 数据的数字特征教课ppt课件
展开1.会求一组数据的最值、平均数、中位数、百分位数、众数、方差.(重点)2.理解上述数字特征的意义,并能解决与之相关的实际问题.(难点)
如下是某学校高一 (1) 班和高一 (2) 班某一次期中考试的语文成绩,试从不同的角度对两班成绩进行对比.
在日常生活中,当面对一组数据时,相比每一个观测值,有时我们更关心的是能反映这组数据特征的一些值.例如,上述情境中的两个班的成绩,我们可以从最值、平均数、中位数、方差等角度进行比较.
一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况.一般地,最大值用 max 表示,最小值用 min 表示. 日常生活中,有时我们只关心数据的最值,比如,高考部分科目实行“一年多考”,最终取的是多次考试成绩中的最大值;举重比赛中,选手有三次“试举”机会,其中成绩的最大值将计入总成绩;末位淘汰的比赛中,积分最小值对应的团体或个人将被淘汰出局;等等.
某武术比赛中,共有 7 个评委,计分的规则是:去掉一个最高分,去掉一个最低分,然后把其他分数的平均数作为选手的最后得分. 按照这样的规则,根据以下数据,计算三位选手的最后得分:
(1) 从数学的角度,讨论为什么要去掉一个最高分与最低分后再计算平均数,以及平均数具有什么特点; (2) 有人认为,应该把最高分与最低分之外的分数总分作为选手的最后得分,讨论这样的计分规则与前面的规则是否有本质上的区别.
平均数会受每一个数的影响,尤其是最大值、最小值,很多情况下,为了避免过于极端的值影响结果太大等,会去掉最低分与最高分后再计算平均数.但是,计算总分与计算平均分不会有本质区别,请读者自行说明理由. 当计算上述甲选手的最后得分时,在把 88 与 96 去掉之后,可以先把其余数都减去 92,得到新的数为-2,1,1,0,0,因为这一组数的平均数为0,所以可知甲的最后得分为 92. 其余选手的得分可以用类似的方法得到.
我们知道,一组数的平均数与这组数中的每一个数都有关,特别地,平均数容易受到最值的影响,因此有时平均数并不能很好地表示这组数的中心位置.
有甲、乙两个组,每组有 6 名成员,他们暑假读书的本数分别如下: 甲组:1,2,3,3,4,5; 乙组:0,0,1,2,3,12.分别求出两组数的平均数;平均数是否很好地表示了每一组数的中心位置?如果没有,可以选择什么数来表示?
指出甲、乙两组数的中位数,并思考:中位数是否能比较全面地体现数据的分布特点?如果不能,有什么补救的办法?
当数据个数较多时,如果仅仅知道中位数,是不足以了解这组数的分布特点的.例如,上述甲、乙两组数的中位数都是 5.5,但是甲组数中,小于5.5 的数普遍比乙组的大,而大于 5.5 的数普遍比乙组的小. 更具体地,将甲、乙两组数小于 5.5 的前 10 个数分别看成一组数,则它们的中位数分别是 2.5,4____,这两个数能够反映甲、乙两组数小于5.5 的数的分布特点,因为这两个数是通过找小于或等于中位数的所有数的中位数得到的,所以它们分别称为甲、乙两组数的 25%分位数.
一般地,当数据个数较多时,可以借助多个百分位数来了解数据的分布特点. 一组数的力p %(p∈(0,100)) 分位数指的是满足下列条件的一个数值;至少有 p%的数据不大于该值,且至少有 (100-p)%的数据不小于该值. 直观来说,一组数的 p%分位数指的是,将这组数按照从小到大的顺序排列后,处于p%位置的数. 例如,中位数就是一个 50%分位数.
实际应用中,除了中位数外,经常使用的是 25%分位数 (简称为第四分位数) 与 75%分位数(简称为第三四分位数).
求中位数的一般步骤(1)把数据按大小顺序排列.(2)找出排列后位于中间位置的数据,即为中位数.若中间位置有两个数据,则求出这两个数据的平均数作为中位数.
计算上述尝试与发现中甲、乙两组数的 75%分位数.
因为数据个数为 20,而且20×75%=15,所以,甲组数的 75%分位数为乙组数的 75%分位数为5 ____________. 由此可知,如果尝试与发现中的甲组数用 2.5,5.5,9.5 来刻画,乙组数用 1,5.5,12 来刻画,则大致可以看出它们的数的分布特点.
求百分位数的一般步骤(1)排序:按照从小到大排列:x1,x2,…,xn.(2)计算:求i=np%的值.(3)求值:
一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.有些情形中,我们用众数来描述一组数据的中心位置.
某班级准备利用暑假去进行研学旅行,为了便于识别,他们准备定做一批容量一致的双肩包,为此,活动负责人征求了班内同学的意向,得到了如下数据:你认为应该定做什么容量的双肩包?为什么?
为了照顾到绝大多数人的需求,此时应该定做容量为 29 L 的双肩包这里的 29 就是上述数据的众数.
1.最值和众数的求法在样本数据中出现次数最多的数据即为众数,最大的数是最大值,最小的数是最小值.2.求平均数的步骤(1)求和:数据x1,x2,…,xn的和为x1+x2+…+xn.(2)求平均数:和除以数据的个数n,即x1,x2,…,xn的平均数为(x1+x2+…+xn).
5.极差、方差与标准差
方差的算术平方根称为标准差.由此可知,如果一组数中,各数据值都相等,则标准差为 0,表明数据没有波动,数据没有离散性;若各数据的值与平均数的差的绝对值较大,则标准差也较大,表明数据的波动幅度也较大,数据的离散程度较高. 因此标准差描述了数据相对于平均数的离散程度.
计算下列各组数的平均数与方差:18.9,19.5,19.5,19.2,19,18.8,19.5;2,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,6,6.
每一个数都减去 4 可得这组数的平均数与方差分别为
计算标准差的五个步骤(1)算出样本数据的平均数.(2)算出每个样本数据与样本数据平均数的差:xi-(i=1,2,3,…,n).(3)算出(2)中xi-(i=1,2,3,…,n)的平方.(4)算出(3)中n个平方数的平均数,即为样本方差.(5)算出(4)中方差的算术平方根,即为样本标准差.
用计算机软件可以方便快捷地求得一组数的各种数字特征.例如,为了求出例2(1) 中数据的数字特征,可以将它们输入 Excel的表格中,然后使用相应的函数即可,如图 5-1-5 所示.
6.用信息技术求数据的数字特征
其中,求第一四分位数输人的是“=QUARTILE.EXC(A2:A8,1)”求第三四分位数输入的是“=QUARTILE.EXC(A2:A8,3)” 用 GeGebra 软件的表格区也可实现类似的功能,但是函数的名称不-致,如图 5-1-6 所示. 其中,求第一四分位数输入的是“=Percentile[A2:A8,0.25]”,求第三四分位数输入的是“=Percentile[A2:A8,0.75]”
1.平均数、众数、中位数的应用因为平均数与每一个样本数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质,也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于全体样本数据的信息.但平均数受数据的极端值的影响较大,使平均数在估计总体时可靠性降低.
2.标准差(方差)的两个作用(1)标准差(方差)较大,数据的离散程度较大;标准差(方差)较小,数据的离散程度较小.(2)在实际应用中,常常把平均数与标准差结合起来进行决策.在平均值相等的情况下,比较方差或标准差来确定稳定性.
一、知识总结1.众数、中位数、平均数的意义(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其中心位置.
2.在计算方差或标准差时,当数据的重复数据较多时,要先把数据整理为频数表再用公式或性质计算.3.在实际问题中,平均值和方差(或标准差)是评定优劣的两个依据.二、常见误区1.计算标准差和方差时公式记错致误.2.数据同时增加或减少相同的数,平均数变化,方差不变.
数学必修 第二册第五章 统计与概率5.1 统计5.1.2 数据的数字特征教学演示课件ppt: 这是一份数学必修 第二册第五章 统计与概率5.1 统计5.1.2 数据的数字特征教学演示课件ppt,共59页。PPT课件主要包含了最大值,最小值,标准差等内容,欢迎下载使用。
人教B版 (2019)必修 第二册5.1.2 数据的数字特征授课课件ppt: 这是一份人教B版 (2019)必修 第二册5.1.2 数据的数字特征授课课件ppt,共49页。PPT课件主要包含了平均数为,你有什么发现,先整理数据再进行计算,课堂小结等内容,欢迎下载使用。
高中数学人教B版 (2019)必修 第二册5.1.2 数据的数字特征多媒体教学ppt课件: 这是一份高中数学人教B版 (2019)必修 第二册5.1.2 数据的数字特征多媒体教学ppt课件,共52页。PPT课件主要包含了问题与情境,平均数,尝试与发现1,如何计算甲组的分数,为什么可以这样计算,答没有本质的区别,尝试与发现2,中位数,尝试与发现3,百分位数等内容,欢迎下载使用。