高中数学第三册--选修Ⅱ 第一章 概率与统计教案(第8课)总体分布估计
展开课 题: 1.4总体分布估计
教学目的:
1了解当总体中的个体取不同数值很少时,可用频率分布表或频率分布条形图估计总体分布,并会用这两种方式估计总体分布;
⒉了解当总体中的个体取不同数值较多,甚至无限时,可用频率分布表或频率分布直方图估计总体分布,并会用这两种方式估计总体分布
教学重点:用样本的频率分布估计总体分布
教学难点:频率分布表和频率分布直方图的绘制
授课类型:新授课
课时安排:1课时
教 具:多媒体、实物投影仪
内容分析:
统计学中有两个核心问题,一是如何从整体中抽取样本?二是如何用样本估计总体?经过前面的学习,我们已经了解了一些常用的抽样方法.本节课,我们在初中学过样本的频率分布的基础上,研究总体的分布及其估计
教学过程:
一、复习引入:
1.简单随机抽样:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样⑴用简单随机抽样从含有N个个体的总体中抽取一个容量为的样本时,每次抽取一个个体时任一个体被抽到的概率为;在整个抽样过程中各个个体被抽到的概率为; ⑵简单随机抽样的特点是,逐个抽取,且各个个体被抽到的概率相等; ⑶简单随机抽样方法,体现了抽样的客观性与公平性,是其他更复杂抽样方法的基础.(4).简单随机抽样的特点:它是不放回抽样;它是逐个地进行抽取;它是一种等概率抽样
2.抽签法:先将总体中的所有个体(共有N个)编号(号码可从1到N),并把号码写在形状、大小相同的号签上(号签可用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌,抽签时每次从中抽一个号签,连续抽取n次,就得到一个容量为n的样本
适用范围:总体的个体数不多时
优点:抽签法简便易行,当总体的个体数不太多时适宜采用抽签法.
3.随机数表法: 随机数表抽样“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码
4.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样.系统抽样的步骤:①采用随机的方式将总体中的个体编号为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等②为将整个的编号分段(即分成几个部分),要确定分段的间隔k当(N为总体中的个体的个数,n为样本容量)是整数时,k=;当不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数能被n整除,这时k=.③在第一段用简单随机抽样确定起始的个体编号 ④按照事先确定的规则抽取样本(通常是将加上间隔k,得到第2个编号+k,第3个编号+2k,这样继续下去,直到获取整个样本)
①系统抽样适用于总体中的个体数较多的情况,它与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样;
②与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的.
③总体中的个体数恰好能被样本容量整除时,可用它们的比值作为系统抽样的间隔;当总体中的个体数不能被样本容量整除时,可用简单随机抽样先从总体中剔除少量个体,使剩下的个体数能被样本容量整除在进行系统抽样
5.分层抽样: 当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层
6.不放回抽样和放回抽样:在抽样中,如果每次抽出个体后不再将它放回总体,称这样的抽样为不放回抽样;如果每次抽出个体后再将它放回总体,称这样的抽样为放回抽样.
随机抽样、系统抽样、分层抽样都是不放回抽样
7. 分布列:
ξ | x1 | x2 | … | xi | … |
P | P1 | P2 | … | Pi | … |
分布列的两个性质: ⑴Pi≥0,i=1,2,…; ⑵P1+P2+…=1
二、讲解新课:
⒈频率分布表或频率分布条形图
历史上有人通过作抛掷硬币的大量重复试验,得到了如下试验结果:
试验结果 | 频数 | 频率 |
正面向上(0) | 36124 | 0.5011 |
反面向上(1) | 35964 | 0.4989 |
抛掷硬币试验的结果的全体构成一个总体,则上表就是从总体中抽取容量为72088的相当大的样本的频率分布表.尽管这里的样本容量很大,但由于不同取值仅有2个(用0和1表示),所以其频率分布可以用上表和右面的条形图表示.其中条形图是用高来表示取各值的频率.
试验结果 | 概率 |
正面向上(记为0) | 0.5 |
反面向上(记为1) | 0.5 |
说明:⑴频率分布表在数量表示上比较确切,而频率分布条形图比较直观,两者相互补充,使我们对数据的频率分布情况了解得更加清楚.⑵①各长条的宽度要相同;②相邻长条之间的间隔要适当.
当试验次数无限增大时,两种试验结果的频率值就成为相应的概率,得到右表,除了抽样造成的误差,精确地反映了总体取值的概率分布规律.这种整体取值的概率分布规律通常称为总体分布.
说明:频率分布与总体分布的关系:
⑴通过样本的频数分布、频率分布可以估计总体的概率分布.
⑵研究总体概率分布往往可以研究其样本的频数分布、频率分布.
2.总体分布:总体取值的概率分布规律
在实践中,往往是从总体中抽取一个样本,用样本的频率分布去估计总体分布一般地,样本容量越大,这种估计就越精确
3.总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线.
它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于总体密度曲线,直线x=a,x=b及x轴所围图形的面积.
三、讲解范例:
例1.为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5岁~18岁的男生的体重情况,结果如下(单位:kg)
56.5 | 69.5 | 65 | 61.5 | 64.5 | 66.5 | 64 | 64.5 | 76 | 58.5 |
72 | 73.5 | 56 | 67 | 70 | 57.5 | 65.5 | 68 | 71 | 75 |
62 | 68.5 | 62.5 | 66 | 59.5 | 63.5 | 64.5 | 67.5 | 73 | 68 |
55 | 72 | 66.5 | 74 | 63 | 60 | 55.5 | 70 | 64.5 | 58 |
64 | 70.5 | 57 | 62.5 | 65 | 69 | 71.5 | 73 | 62 | 58 |
76 | 71 | 66 | 63.5 | 56 | 59.5 | 63.5 | 65 | 70 | 74.5 |
68.5 | 64 | 55.5 | 72.5 | 66.5 | 68 | 76 | 57.5 | 60 | 71.5 |
57 | 69.5 | 74 | 64.5 | 59 | 61.5 | 67 | 68 | 63.5 | 58 |
59 | 65.5 | 62.5 | 69.5 | 72 | 64.5 | 75.5 | 68.5 | 64 | 62 |
65.5 | 58.5 | 67.5 | 70.5 | 65 | 66 | 66.5 | 70 | 63 | 59.5 |
试根据上述数据画出样本的频率分布直方图,并对相应的总体分布作出估计
解:按照下列步骤获得样本的频率分布.
(1)求最大值与最小值的差.在上述数据中,最大值是76,最小值是55,它们的差(又称为极差)是76—55=21)所得的差告诉我们,这组数据的变动范围有多大.
(2)确定组距与组数.如果将组距定为2,那么由21÷2=10.5,组数为11,这个组数适合的.于是组距为2,组数为11.
(3)决定分点.根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是
[54.5,56.5),[56.5,58.5),…,[74.5,76.5).
(4)列频率分布表,如表① 频率分布表
分组 | 频数累计 | 频数 | 频率 |
[54.5,56.5) |
| 2 | 0.02 |
[56.5,58.5) |
| 6 | 0.06 |
[58.5,60.5) |
| 10 | 0.10 |
[60.5,62.5) |
| 10 | 0.10 |
[62.5,64.5) |
| 14 | 0.14 |
[64.5,66.5) |
| 16 | 0.16 |
[66.5,68.5) |
| 13 | 0.13 |
[68.5,70.5) |
| 11 | 0.11 |
[70.5,72.5) |
| 8 | 0.08 |
[72.5,74.5) |
| 7 | 0.07 |
[74.5,76.5) |
| 3 | 0.03 |
合计 |
| 100 | 1.00 |
(5)绘制频率分布直方图.频率分布直方图如图所示
由于图中各小长方形的面积等于相应各组的频率,这个图形的面积的形式反映了数据落在各个小组的频率的大小.在反映样本的频率分布方面,频率分布表比较确切,频率分布直方图比较直观,它们起着相互补充的作用.
在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计,体重在(64.5,66.5)kg的学生最多,约占学生总数的16%;体重小于58.5kg的学生较少,约占8%;等等
例2.对某电子元件进行寿命追踪调查,情况如下:
寿命(h) | 100~200 | 200~300 | 300~400 | 400~500 | 500~600 |
个数 | 20 | 30 | 80 | 40 | 30 |
出频率分布表;
(2)画出频率分布直方图和累计频率分布图;
(3)估计电子元件寿命在100h~400h以内的概率;
(4)估计电子元件寿命在400h以上的概率;
(5)估计总体的数学期望值
解:(1)
寿命 | 频数 | 频率 | 累计频率 |
100~200 | 20 | 0.1 | 0.10 |
200~300 | 30 | 0.15 | 0.25 |
300~400 | 80 | 0.40 | 0.65 |
400~500 | 40 | 0.20 | 0.85 |
500~600 | 30 | 0.15 | 1 |
合计 | 200 | 1 |
|
(2)频率分布直方图如右和累计频率分布图如下
(3)频率分布图可以看出,寿命在100h~400h的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100h~400h的概率为0.65
(4)由频率分布表可知,寿命在400h以上的电子元件出现的频率为
0.20+0.15=0.35,故我们估计电子元件寿命在400h以上的概率为0.35
(5)样本的期望值为
所以,我们估计总体生产的电子元件寿命的期望值(总体均值)为365h
四、课堂练习:
1 . 为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品14件.
⑴列出样本频率分布表;
⑵画出表示样本频率分布的条形图;
⑶根据上述结果,估计此种商品为二级品或三级品的概率约是多少?
解:⑴样本的频率分布表为
产品 | 频数 | 频率 |
一级品 | 5 | 0.17 |
二级品 | 8 | 0.27 |
三级品 | 13 | 0.43 |
次品 | 4 | 0.13 |
⑵样本频率分布的条形图如右:
⑶此种产品为二极品或三极品的概率为0.27+0.43=0.7
2. 如下表:
分 组 | 频数 | 频 率 | 分 组 | 频数 | 频 率 |
[10.75,10.85) | 3 |
| [11.25,11.35) | 20 |
|
[10.85,10.95) | 9 |
| [11.35, 11.45) | 7 |
|
[10.95,11.05) | 13 |
| [11.45, 11.55) | 4 |
|
[11.05,11.15) | 16 |
| [11.55, 11.65) | 2 |
|
[11.15,11.25) | 26 |
| 合 计 | 100 |
|
⑴完成上面的频率分布表.
⑵根据上表,画出频率分布直方图.
⑶根据上表,估计数据落在[10.95,11.35)范围内的概率约为多少?
答案:⑴⑵略.
⑶数据落在[10.95,11.35)范围的频率为0.13+0.16+0.26+0.20=0.75
∴ 落在[10.95,11.35)内的概率约为0.75
五、小结 :用样本的频率分布估计总体分布,可以分成两种情况讨论:
⒈当总体中的个体取不同数值很少(并不是总体中的个数很少)时,其频率分布表由所取样本的不同数值及其相应的频率来表示,其几何表示就是相应的条形图;
⒉当总体中的个体取不同值较多、甚至无限时,对其频率分布的研究要用到初中学过的整理样本数据的知识.
它们的不同之处在于:前者的频率分布表中列出的是几个不同数值的频率,相应的条形图是用其高度来表示取各个值的频率;后者的频率分布表列出的是在各个不同区间内取值的频率,相应的直方图是用图形面积的大小来表示在各个区间内取值的频率
六、课后作业:
七、板书设计(略)
八、课后记:
高中数学人教版新课标A必修32.2.1用样本的频率分布估计总体教案: 这是一份高中数学人教版新课标A必修32.2.1用样本的频率分布估计总体教案,共5页。教案主要包含了创设情境,探究新知,例题精析,课堂精练,课堂小结,评价设计等内容,欢迎下载使用。
人教版新课标A必修32.2.1用样本的频率分布估计总体教学设计及反思: 这是一份人教版新课标A必修32.2.1用样本的频率分布估计总体教学设计及反思,共5页。教案主要包含了创设情境,探究新知,例题精析,课堂精练,课堂小结,评价设计等内容,欢迎下载使用。