所属成套资源:中职数学高教版(2021~十四五)拓展模块一下册课件+教案+同步练习(含答案)
数学第10章 统计10.1 集中趋势与离散程度公开课课件ppt
展开
这是一份数学第10章 统计10.1 集中趋势与离散程度公开课课件ppt,共39页。PPT课件主要包含了集中趋势,算术平均数,中位数,离散程度,方差和标准差,离散系数等内容,欢迎下载使用。
10.1 集中趋势与离散程度
在基础模块中,我们学习了通过抽样来收集数据、分析数据、理解数据中蕴含的信息,用样本的频率分布估计总体的频率分布.用样本均值和样本方差体现样本的集中趋势和离散程度. 本章我们将进一步学习如何用样本数据估计总体的集中趋势和离散程度,从而更 好地用样本数据估计总体的特征.
10.1.1 集中趋势
为了备战2022 年北京冬季奥运会,甲、乙两名短道速滑运动员按计划进行速滑训练.在某天的训练中,他们随机抽取的5次训练成绩 ( 单位:s)如下:甲:40.7,41.2,39.9,40.3,41.9;乙:41.3,39.7,41.4,40.0,41.8. 分析上述数据,你能估计出谁的训练成绩更好吗?
可以从集中趋势的角度分析这些样本数据的分布特征,估计哪一名运动员的训练成绩更好.
集中趋势是指一组数据向某一中心值靠拢的倾向,反映这组数据中心点的位置所在.常用的表示集中趋势的统计量有算术平均数、 中位数和众数等.
计算可得,上述“情境与问题”中两位运动员的5次训练成绩的算术平均数分别为: 估计甲训练成绩更好.
可以看出,算术平均数的计算方法与基础模块中样本均值的计算方法是一致的,所以算术平均数也称为算术均值.
在某些实际问题中,不同样本数据的重要程度可能不同,从而对集中趋势产生不同的影响,若一组数据为x1,x2,…,xn,它们出现的频数分别为f1,f2,…,fn,则 称为这组数据的加权算术平均数,其中fk也称为样本数据xk的权重.
显然,加权算术平均数不仅依赖于样本数据,还依赖于样本数据的权重.容易看出,当权重f1,f2,…,fn相等时,样本数据的加权算术平均数就是它们的算术平均数.因此,算术平均数是加权算术平均 数的特例.
例1 某校调研全体学生的日 睡眠时间,随机抽取了 100 名学生进行调查,得到的日睡眠时间数据见下表. 根据表中的数据,估算该校学生的日平均睡眠时间.
算术平均数和加权算术平均数在统计学中具有重要地位、是进行统计分析和推断的基础. 但是,它们对极端数据值反映很灵敏,容易受 到极端数据值的影响,作为反映集中趋热的统计量有时并不准确.
一组数据按大小顺序排列后,位于中间位置的数或者位于中间位置的两个数的算术平均数称为中位数,记为 Me.
例如,数据 4,2,7 的中位数是4;数据 4,2,7,5 的中位数是 4.5.
容易看出,中位数以其居中的位置体现了这组数据的集中趋势,并且不受极端数据值的影响,当一组数据中出现极端数据值时, 用中位数反映集中趋势比用算术平均数更准确. 但是,中位数不能充分利用所有数据的信息,从而也不能全面反映数据的统计特征.
一组数据中出现次数最多的数值称为众数.
例如,数据 5,2,3,2,7,5,2的众数是2. 众数表现的集中趋势是显而易见的,但是众数可能不存在或不唯一,若所有数值出现的次数一样多,则认为这组数据没有众数;若有多个数值出现的次数相同,并且都是最多,则这几个数值都是这组数据的众数. 如,数据 5,4,6,6,5,4 没有众数;数据 1,3,5,1,4,5,9,7,1,5 有两个众数,分别为1和5.
例2 某企业为了估计全厂技术工人加工某种零件的日产量,随 机抽取 10名技术人员进行调查,发现他们一天加工的零件数量分别为 15,17,14,15,17,16,13,18,12,11,求这组数据的中位数和众数,并估计该企业技术人员日产量的集中趋势.
不难看出,算术平均数表示一组数据的平均水平,中位数是组数据按大小顺序排列后的中间值,众数是一组数据中出现次数最多的数据,它们从不同的角度表示了一组数据的集中趋势. 掌握平均数、中位数及众数的特点,有助于我们在实际应用中选择合适的统 计量来描述数据的集中趋势.
1. 求下列各组数据的算术平均数、中位数和众数.(1) 1,2,4,2,5; (2) 12,22,16,22,20,22; (3) 6,6,6,7,7,7,8,8,8; (4) 0.4,1.8,2.0,0.7,1.6,1.3,0.7,0.4,1.5,2.2.
2. 调查某部门的 10名员工的年龄,具体情况见下表.求该部门员工年龄的算术平均数、中位数和众数.
3. 某灯厂为了测定本厂生产的一批灯的使用寿命(单位:h),随机抽取了 100个灯,测得它们的使用寿命见下表. 试估计这批灯的平均使用寿命.
10.1.2 离散程度
在 10.1.1节中,我们学习了如何描述数据的集中趋势,但是集中趋势只从一个侧面说明了数据的分布特征,不能反映各个数据之间 的差异以及各个数据远离其算术平均数的程度. 这就需要从另一个侧面,即通过数据的离散程度来进一步反映数据的分布特征.
我国拥有世界上规模最大的高速铁路系统,无论是里程、速度还是技术,都居于世界领先水平.我国自主研发的高铁“复兴号”动车组列车,是目前世界上运营时速最高的高铁列车. 在对列车上某种标准规格为25.64 cm 的零件进行招标时,从A厂与B厂提供的样本中分别随机抽取 6个零件,测得零件的规格数据如下(单位:cm) A厂:25.637,25.640,25.641,25.640,25.641,25.641;B厂:25.641,25.640,25.639,25.637,25.641,25.642.
可以发现,所测的两个厂家提供的零件的规格数据的算术平均数都是25.64cm. 因此,单从这一点上,无法判断哪个厂家生产的零件更接近标准规格. 那么,如何判断哪个厂家生产的零件更接近标准规格呢?
为了更进一步揭示规格数据的分布特征,可以考察规格数据与算术平均数的差以及规格数据之间的差等,这就涉及数据的离散程度.
离散程度是指数据远离其中心值的程度,也称离中趋势.
它与集中趋势相辅相成,共同反映数据的分布规律.常用的反映数据离散程度的统计量有极差、方差、标准差和离散系数等.
一组数据的最大值和最小值之差称为极差,也称全距.极差是最 简单的描述数据离散程度的统计量.
若xmax与xmin分别表示这组数据的最大值和最小值,则这组数据的极差 R= xmax- xmin. 用极差来评价数据的离散程度时,极差值越小,说明数据的离散程度越小,数据越集中,算术平均数的代表性越好;反之,极差值越大,数据的离散程度越大,数据越分散,算术平均数的代表性越差.
“情境与问题(1)”中,A厂零件的规格数据的极差为RA=25.641-25.637=0.004, B厂零件的规格数据的极差为 RB= 25.642-25.637=0.005. 因为RA < RB ,所以判定 A厂生产的零件更接近标准规格.
由于极差只是利用了数据两端的信息,没有涉及中间数据的分散情况,因而不能精确描述数据的离散程度.
在《数学 基础模块》中,我们学习了样本方差和样本标准差的概念. 方差(或标准差)描述了一组数据围绕平均值波动的程度,与极差相比,能更好地反映数据的离散程度.
方差和标准差反映一组数据的平均离散程度,消除了样本含量的影响,通常与平均数一起用来描述一组数据的集中趋势和离散程度. 在平均数相同的情况下,方差和标准差越大,数据的离散程度越大;反之,数据的离散程度越小.
求“情境与问题(1)”中A厂和B厂生产的零件的规格数据的标准差,并判断哪个厂家生产的零件更加接近标准规格(标准 差的结果保留5位小数).
某校随机抽取8名同学,测得他们的身高x(单位:cm)与体重y(单位: kg)的数据见下表.
考虑到身高的算术平均数远大于体重的算术平均数,仅从标准差的大小来比较两组数据的离散程度是不全面的. 因此,相对于算术平均数的相对离散程度是一个更加合理的指标.
离散系数反映了每单位平均数的离散程度,是数据离散程度的相对性指标.离散系数消除了数据平均数和计量单位的影响,当两组数据的算术平均数或计量单位不同时,常用离散系数比较这两组数 据的离散程度. 离散系数大,说明该组数据的离散程度大;离散系数小,说明该组数据的离散程度小.
求“情境与问题(2)”中8名同学的身高和体重的离散系数,并判断身高和体重中哪一项的离散程度小.
集中趋势和离散程度从不同的侧面反映了数据的分布特征,在实际统计工作中,必须把集中趋势和离散程度相结合才能准确地反映数据的整体状况. 数据的离散程度越小,集中趋势的代表性就越大;离散程度越大,集中趋势的代表性就越小.
2.参加比赛的甲、乙两支篮球队的 5 名队员的身高(单位:cm)见下表. 计算两队队员身高的离散系数,并判断哪队队员的身高比较均匀.
1.书面作业:完成课后习题和《学习指导与练习》;2.查漏补缺:根据个人情况对课堂学习复习与回顾;3.拓展作业:阅读教材扩展延伸内容.
相关课件
这是一份高教版(2021·十四五)拓展模块一(下册)第9章 随机变量及其分布9.1 离散型随机变量及其分布优秀ppt课件,共40页。PPT课件主要包含了离散型随机变量,二项分布等内容,欢迎下载使用。
这是一份中职数学高教版(2021·十四五)拓展模块一(上册)第5章 复数5.2 复数的运算5.2.2 复数的乘法优秀ppt课件,共11页。PPT课件主要包含了复数的乘法,情境导入,探索新知,典型例题,巩固练习,归纳总结,布置作业,例题辨析等内容,欢迎下载使用。
这是一份中职数学4.2.1 共面直线优质课ppt课件,共21页。PPT课件主要包含了共面直线,平行直线,相交直线等内容,欢迎下载使用。