高中数学上教版 (2020)必修第三册1 估计总体的分布优质课件ppt
展开某医学期刊 2018 年刊出了关于我国成人高血压的调查结果 :我国成人中约 2. 45 亿人可能患有高血压 , 还有约 4. 35 亿人可能是高血压 “ 后备军 ”( 正常高值血压 ) . 是谁统计了这几亿人的数据呢?
实际上并没有人一一统计这几亿人的数据 , 而是研究团队根据在全国范围内随机调查的约 45 万名成人的血压数据 , 推断出了我国成人患高血压情况 . 为何该研究团队仅仅通过调查约 45万名成人的血压数据 , 就可以推断出我国约 10 亿成人中患高血压的人数? 这就是统计估计所起的强大作用 : 在实际问题中 , 当总体的信息难以或无法获得时 , 我们可以采取科学的抽样方法 ,获取具有代表性的样本 , 利用样本信息来估计总体的分布规律
我们知道 , 总体是指考察对象的全体 , 个体是总体中的每一个考察的对象 , 总体的分布指的是总体中不同范围或类型的个体所占的比例 . 如果我们研究的总体是某校高一年级学生的身高和体重 , 那么总体的分布是指该校高一年级学生中的不同身高和体重范围的学生个体在总体中所占的比例 . 如果我们研究的总体是某校高一年级学生偏好的运动方式 , 那么总体的分布是指该校高一年级学生中偏好每种运动方式的学生个体在总体中所占的比例
在 13. 4 节中 , 我们学习了如何通过频率分布表和频率分布直方图来分析样本数据的分布 . 如果样本数据是随机抽取的 , 那么依据大数定律 , 当样本量不断增大时 , 样本中每组数据的频率会越来越稳定于一个相应的概率 , 我们就可以把这个概率作为总体中的个体在相应区间内取值的概率 , 从而用样本的频率分布来估计总体的分布情况 .
例1。某营养学研究人员用随机抽样的方法获得了某高校100 名女大学生平均每日摄取的热量 ( 单位 : 千大卡 , 1 千大卡 =1000 千卡 ), 其数据如下 :
( 1 ) 试估计该校全体女大学生每日摄取热量的分布情况 ;( 2 ) 健康的成年女性每天需要摄取 1. 80~1. 90 千大卡 ( 不含1. 90 千大卡 ) 的热量 , 试估计该校有多少比例的女大学生摄取的热量在此范围之内
解 ( 1 ) 这里的总体是该校女大学生的每日摄取热量 , 我们要利用通过抽样获得的 100 名女大学生的样本信息来估计总体的分布情况 . 由于从上面的数据很难看出任何规律 , 因此我们通过制作频率分布表来分析样本数据的频率分布 .
这组数据的最小值为 1. 42 , 最大值为 2. 29 , 故全距为 0. 87 ,可选取组距为 0. 1 , 将其分为 9 组 . 其频率分布表如表 13-5 所示 .
从表 13-5 中可以估计总体的大致分布情况 . 比如 , 该校女大学生每日摄取热量在 [ 1. 50 , 2. 00 ) 范围内的频率最大 , 每日摄取热量不足 1. 50 千大卡或超过 2. 00 千大卡的频率相对较小 .
( 2 ) 从表 135 中可以看出 , 样本中摄取热量范围在[ 1. 80 , 1. 90 ) 的女大学生的频率为 0. 21. 由于样本是随机抽取的 ,因此可以估计该校女大学生每日摄取热量的范围在[ 1. 80 , 1. 90 ) 的概率是 0. 21 , 或者说约有 21% 的该校女大学生每日摄取热量的范围在 [ 1. 80 , 1. 90 )
在例 1 中 , 如果想要使信息更为直观地呈现 , 那么我们可以绘制频率分布直方图 , 用图中矩形的面积大小来反映分布情况 .
这组数据的频率分布直方图如图 13-5-1 所示 .
从图 13-5-1 中可以看出 , [ 1. 80 , 1. 90 ) 所对应的矩形面积最大 , 并且整幅直方图具有一定的对称性 . 由此可以推测该校女大学生每日摄取热量的范围集中在 [ 1. 80 , 1. 90 ) 附近 , 摄取特别多的热量或特别少的热量的女大学生人数都较少 .
在本例中 , 如果将样本容量取得足够大 , 且分组的组距取得足够小 , 那么相应的频率分布折线图将趋于一条光滑的曲线 , 称为 总体分布密度曲线 ( 图 13-5-2 ) . 事实上 , 尽管总体分布密度曲线是客观存在的 , 但由于在实际中往往无法获得总体的数据 , 因此无法精确地得到它的密度曲线 , 只能通过样本的频率分布折线图来对总体分布的密度曲线进行估计 . 一般来说 , 样本容量越接近总体容量 , 样本的频率分布折线图与总体分布密度曲线的贴近程度越高 .
注意 , 上面我们已通过抽取一定容量的样本来估计该校女大学生每日摄取热量的分布 , 但如果重新抽取一个包含 100 名女大学生的样本 , 由于这个样本极有可能会包含和上一个样本不同的学生 , 因此每个区间内的样本数的频率会有所不同 , 即样本具有变异性 . 但当样本量较大时 , 样本中每个区间内的样本数的频率会稳定于总体在相应区间内取值的概率 , 不会有太大的变动 . 当然 , 样本容量越大 , 采集这些样本所需要耗费的人力 、 物力和财力就会越多 , 所以应根据实际情况选择适当容量的样本
1. 某学生第二天要参加 100m 短跑比赛 , 他记录了比赛前一日集训中 20 次 100m 短跑的成绩 ( 单位 : s ):
( 1 ) 制作频率分布表 ;( 2 ) 试估计该学生在 100m 短跑比赛中用时低于 14s 的可能性
2. 某展览馆随机抽取了 2018 年中 5 周的客流量( 单位 : 人次 ), 如下表所示 . 试估计该展览馆 2018 年有多少天的客流量超过了 200.
1、某商场买来一车苹果,从中随机抽取了10个苹果,其重量(单位:g)分别为150,152,153,149,148,146,151,150,152,147,由此估计这车苹果单个重量的平均值是( )A.150.2 g B.149.8 g C.149.4 g D.147.8 g
2、如图所示是一容量为100的样本的频率直方图,则由图中的数据可知,样本落在[15,20]内的频数为
【答案】30;【解析】样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30;
3、谢老师对班上某次数学模拟考试成绩进行统计,绘制了如图所示的统计图,根据图中给出的信息,这次考试成绩为A等级的有 人;
【答案】10;【解析】观察统计图,可知这次考试成绩为A等级的有10人;
4、甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图.
(1)分别求出两人得分的平均数与方差;(2)根据折线图和上面算得的结果,对两人的训练成绩作出评价.
【解析】(1)由题图可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分;
从折线图可以看出,甲的成绩基本呈上升状态,而乙的成绩上下波
动,可知甲的成绩在不断提高,而乙的成绩则无明显提高;
高中数学上教版 (2020)必修第三册第13章 统计13.5 统计估计3 估计百分位数完美版课件ppt: 这是一份高中数学上教版 (2020)必修第三册<a href="/sx/tb_c4027115_t3/?tag_id=26" target="_blank">第13章 统计13.5 统计估计3 估计百分位数完美版课件ppt</a>,共16页。PPT课件主要包含了答案A,答案C等内容,欢迎下载使用。
高中上教版 (2020)2 估计总体的数字特征一等奖教学ppt课件: 这是一份高中上教版 (2020)<a href="/sx/tb_c4027114_t3/?tag_id=26" target="_blank">2 估计总体的数字特征一等奖教学ppt课件</a>,共26页。PPT课件主要包含了答案1484,答案01等内容,欢迎下载使用。
高中数学上教版 (2020)必修第三册1 频数分布表和频率分布直方图优秀课件ppt: 这是一份高中数学上教版 (2020)必修第三册<a href="/sx/tb_c4027109_t3/?tag_id=26" target="_blank">1 频数分布表和频率分布直方图优秀课件ppt</a>,共20页。