高中人教A版 (2019)9.2 用样本估计总体教案

展开

这是一份高中人教A版 (2019)9.2 用样本估计总体教案，共10页。教案主要包含了教学目标，教学重难点，教学过程等内容，欢迎下载使用。
总体离散程度的估计
一、教学目标
1.熟悉极差、方差、标准差的计算公式，并理解极差、方差、标准差等离散程度参数的统计意义．
2.会求解极差、方差、标准差，并会用平均数、中位数、众数和极差、方差、标准差对数据进行比较、分析和评价．
3.掌握用样本的离散程度参数估计总体的离散程度的方法，体会样本估计总体的思想，发展数据分析素养.

二、教学重难点
重点：极差、方差、标准差等离散程度参数的统计意义的理解和计算，应用平均数、中位数、众数和极差、方差、标准差对数据进行分析．
难点：已知每组数据个数、平均数和方差，获得各组数据合并后全部数据的方法的计算方法，及计算中的递推思想．

三、教学过程
（一）创设情境
假设你是一名质量控制分析师，工作于一个生产陶瓷餐具的公司。公司最近推出了一款新的餐盘系列，并希望确保它们在生产过程中的尺寸保持一致性，因为每个餐盘直径越接近，则餐盘的整体美观和功能性更好，你被要求分析餐盘直径的数据集，并确定生产过程是否一致.那么，如何刻画餐盘直径的离散程度呢？
设计意图：通过案例，给出生活中应用方差解决实际问题的例子，培养学生的学习兴趣，让学生从生活中去感知数学.
（二）探究新知
任务1：回忆和巩固方差的概念和统计意义.
例：有两位射击运动员在一次射击测试中各射靶10次，每次命中的环数如下：
甲 7 8 7 9 5 4 9 10 7 4
乙 9 5 7 8 7 6 8 6 7 7
想一想：如果你是教练，你如何对两位运动员的射击情况作出评价？如果这是一次选拔性考核，你应当如何作出选择？
师生活动：学生提出评价标准，教师利用电子表格软件进行计算.
预设答案：学生可能先提出比较甲和乙10次射击的平均数、中位数和众数（通过计算会发现甲、乙两名运动员射击成绩的平均数、中位数和众数均为7）.
在发现甲、乙两名运动员射击成绩的平均数、中位数和众数均为7后，知道从集中位置的角度看，两名运动员之间没有差别.
结合初中知识，可能想到用方差进行比较.
方差的定义：假设一组数据是x1，x2，···，xn，用x表示这组数据的平均数，我们称
1ni=1n(xi−x)2
为这组数据的方差.
因为
1ni=1n(xi−x)2=1ni=1n(xi2−2∙x∙xi+x2)
=1ni=1nxi2−2∙x∙(1ni=1nxi)+x2
=1ni=1nxi2−2∙x∙x+x2
=1ni=1nxi2−x2
所以有时为了计算方差方便，也用上述表达式计算方差.
方差刻画了数据的离散程度或波动程度，方差越大，数据的离散程度越大；方差越小，数据的离散程度越小.
如果有学生回答用最大值或最小值，那么可以引导学生考虑成绩的稳定性.
思考：两名运动员射靶环数的方差分别是多少？为什么可以运用方差分析两个运动员的射击成绩？
预设答案：根据方差公式s2=1ni=1n(xi−x)2计算得s甲2=4，s乙2≈1.2，由s甲2>s乙2可知，甲的成绩离散程度大，乙的成绩离散程度小，说明乙比甲的射击成绩稳定.两个运动员的平均成绩一样，比较他们的平均成绩在所有参赛选手中的位置，如果两人都排在前面，越稳定越好，可以选择成绩稳定的乙；如果两人的成绩抽排在后面，希望比赛时有突出表现，可以选择成绩方差大的甲.
设计意图：通过案例，帮助学生回忆方差的概念和统计意义，并掌握应用方差刻画一组数据的离散程度.
任务2：探究其他刻画一组数据的离散程度的统计量.
思考：除了方差，你还能想到其他刻画一组数据的离散程度的统计量？
师生活动：学生思考、讨论并分享，教师引导学生解释这些量的合理性.
预设答案：（1）极差.极差是数据的最大值与最小值的差，即xmax−xmin，可以反映数据的波动范围.在一定程度上，极差越大，数据的离散程度越大；极差越小，数据的离散程度越小.
评价：极差是一种简单的度量数据离散程度的方法.但因为极差只用到了数据中的最大值和最小值，对其他数据没有涉及，所以极差包含的信息量很少.
平均偏差.平均偏差是每个数据与其平均数的差的绝对值的平均数，假设一组数据是x1，x2，···，xn，用x表示这组数据的平均数.即
|x1−x|+|x2−x|+∙∙∙+|xn−x|n
为这组数据的平均偏差.
评价：平均偏差与方差产生的思想一样，都是运用平均距离刻画数据的离散程度.但平均偏差计算公式中含绝对值，计算不方便.
设计意图：让学生主动探索多个统计量刻画数据的离散程度，并认识到每个统计量的优缺点.
任务3：探究标准差的概念和统计意义.
思考：任务1中计算的两名运动员的方差，其单位是什么？是否与原始数据的单位一致呢？如果不一致，又可以用什么来刻画一组数据的离散程度呢？
预设答案：方差的单位是原始数据单位的平方.，与原始数据的单位不一致.如果对方差求算术平方根，则单位和原始数据的单位一致.
因此用方差的算术平方根，即
1ni=1n(xi−x)2
我们称之为这组数据的标准差，来刻画一组数据的离散程度.
标准差刻画了数据的离散程度或波动程度，标准差越大，数据的离散程度越大；标准差越小，数据的离散程度越小.
显然，在刻画数据的分散程度上，方差和标准差是一样的.但在解决实际问题中，一般多采用标准差.
如果总体中所有个体的变量值分别为Y1，Y2，···，YN，总体平均数为Y，则称
S2=1Ni=1N(Yi−Y)2
为总体方差，
S=S2
为总体标准差.
与总体均值类似，总体方差也可以写成加权的形式.如果总体的N个变量值中，不同的值共有k（k≤N）个，不妨记为Y1，Y2，···，Yk，其中Yi出现的频数为fi（i=1，2，···，k），则总体方差为
S2=1Ni=1kfi(Yi−Y)2
追问：方差和标准差的取值范围是什么？如果方差和标准差为0，这组数据有什么特征？
预设答案：方差和标准差的取值范围为[0,+∞).标准差和方差为0时，样本各数据全相等，都等于样本的平均数，表明数据没有波动幅度，数据没有离散性.
设计意图：巩固对方差和标准差的理解.
任务4：探究分层随机抽样样本方差的计算，并估计总体的方差.
在实际问题中，如果能获得总体中所有个体的观测值，可以用方差的公式直接计算总体的方差.比如，要了解某中学教师年工资差别，可以直接从学校财务出获得所有教师的年工资收入数据，计算其方差即可判断.如果要了解某市中学生教师年工资的差别，获取所有教师的年工资数据就比较困难，可以用简单随机抽样或分层随机抽样方法抽取样本，取到样本中所有个体的年工资数据，然后计算其方差，该方差是样本的方差，利用样本估计总体的思想，可以用样本方差估计总体方差.
思考：在对树人中学高一年级学生身高的调查中，采用样本量比例分配的分层随机抽样，如果不知道样本数据，只知道抽取了男生23人，样本的平均数和方差分别为170.6和12.59，抽取了女生27人，样本的平均数和方差分别为160.6和38.62.你能由这些数据计算出样本的方差吗？并对高一年级全体学生的身高方差作出估计吗？
师生活动：教师引导学生明确题目的条件和结论，引导学生独立计算多组数据汇总后的方差.
分析：把男生样本记为x1，x2，⋯，x23，其平均数记为x，方差记为sx2；把女生样本记为y1，y2，⋯，y27，其平均数记为y，方差记为sy2；把总样本数据的平均数记为z，方差记为s2．
根据方差的定义，总样本方差为
s2=150[i=123(xi−z)2+i=127(yj−z)2]
=150[i=123(xi−x+x−z)2+j=127(yj−y+y−z)2].
由i=123(xi−x)=i=123xi−23x=0，可得i=1232(xi−x)(x−z)=2(x−z)i=123(xi−x)=0．
同理可得j=1272(yi−y)(y−z)=0．
因此，s2=150[i=123(xi−x)2+i=123(x−z)2+j=127(yj−y)2+j=127(y−z)2]
=15023[sx2+(x−z)2]+27[sy2+(y−z)2]①.
由x=170.6，y=160.6，根据按比例分配分层随机抽样总样本平均数与各层样本平
均数的关系，可得总样本平均数为
z=2323+27x+2723+27y=23×170.6+27×160.650=165.2．
把已知的男生、女生样本平均数和方差的取值代入 ①，可得
s2=15023×[12.59+(170.6−165.2)2]+27×[38.62+(160.6−165.2)2]=51.4862．
我们可以计算出总样本的方差为51.4862，并据此估计高一年级学生身高的总体方差为51.4862．
追问：比较总体样本方差与男生组及女生组的方差，你能发现什么？你能解释在估计全体学生平均身高时，按性别分层随机抽样的理由吗？
师生活动：学生可以看到总样本方差既大于男生组的方差，也大于女生组的方差，教师解释相同样本量的条件下，总样本方差越小，样本均值估计总体均值效果越好.男、女生的均值相差越大，即两组差别越大，总样本方差比男、女生的方差均大得越多，分层随机抽样的效果越好.
设计意图：引导学生对统计结果进行解释，进而更好地理解分层随机抽样的适用范围.
思考：一般地，如果知道两组数据各自的数据个数、平均数和方差，如何计算全部数据的平均数和方差呢？
师生活动：教师引导学生由具体例子进行一般化归纳.
分析：一般地，如果已知第一组数据的个数是m，平均数和方差分别是x和sx2，第二组数据的个数是n，平均数和方差分别是y和sy2，那么，总样本平均数
z=mm+nx+nm+ny
总样本方差为
s2=mm+n[sx2+(x−z)2]+nm+n[sy2+(y−z)2]
如果两组数据的平均数相等，那么总样本均值与两组数据的均值相同，总样本方差计算公式中的(x−z)2和(y−z)2都等于0，总样本方差是两组方差的加权平均，即s2=mm+nsx2+nm+nsy2，不会同时大于每组的方差.
设计意图：将总样本均值和总样本方差的计算公式在问题的推广到一般，让学生体会由具体到一般的思想.
拓展：平均数反映数据的集中趋势，标准差刻画了数据离平均数的波动大小，那么将平均数和标准差综合在一起呢?
如：课本9.2.1节中100户居民用户的月均用水量数据，可以计算出样本平均数x=8.79，样本标准差s≈6.20.则
x−s=2.59，x+s=14.99，
x−2s=−3.61，x+2s=21.19.
如图可以发现，这100个数据中大部分落在区间[x−s，x+s]=[2.59，14.99]内，在区间[x−2s，x+2s]=[−3.61，21.19]外的只有7个，也就是说，绝大部分的数据落在[x−2s，x+2s]内.
通过平均数和标准差两个统计量，就可以得到大部分数据的取值范围.方差越大，则这个区间越大；方差越小，则这个区间也越小.
设计意图：让学生认识到利用平均数和标准差也可以部分反映数据的取值规律.
（三）应用举例
例1 小明和小红5次考试数学成绩统计如表：
则成绩较为稳定的那个同学成绩的方差为( )
A. 110B. 108C. 22D. 4
提示：根据已知条件，结合平均数x=1n(x1+x2+⋯+xn)与方差s2=1ni=1n(xi−x)2的公式，即可求解.
解：观察两组数据可知，小明的成绩较稳定，
小明成绩的平均数x−=15×(107+111+110+109+113)=110，
小明成绩的方差s2=15[(107−110)2+(111−110)2+(110−110)2+(109−110)2+(113−110)2]=4．
故选：D．
例2 现有A，B两组数据，其中A组有4个数据，平均数为2，方差为6，B组有6个数据，平均数为7，方差为1.若将这两组数据混合成一组，则新的一组数据的方差为．
提示：根据题意，由分层随机抽样的样本平均数的计算公式z=mm+nx+nm+ny
和方差的计算公式s2=mm+n[sx2+(x−z)2]+nm+n[sy2+(y−z)2]计算可得答案.
解： A组有4个数据，平均数为2，方差为6，B组有6个数据，平均数为7，方差为1，
则两组数据混合后，新数据的平均数x=4×2+6×74+6=5，
新数据的方差s2=410[6+(2−5)2]+610[1+(7−5)2]=9，
故答案为：9．
例3有一组样本数据x1，x2，…，xn，由这组数据得到新样本数据y1，y2，…，yn，其中yi=xi+c(i=1,2,⋅⋅⋅,n),c为非零常数，则( )
A. 两组样本数据的样本平均数相同B. 两组样本数据的样本中位数相同
C. 两组样本数据的样本标准差相同D. 两组样本数据的样本极差相同
解：对于A，∵x=1ni=1nxi，
y=1ni=1n(xi+c)=1ni=1nxi+c=x+c， ∴A错；
对于B，设第一组中位数为xk，
则第二组中位数为yk=xk+c， ∴B错；
对于C，∵第一组标准差s= 1ni=1n(xi−x)2，
第二组标准差s′= 1ni=1n(yi−y)2= 1nn=1n(xi−x)2，
∴C正确;
对于D，设第一组中最大值为xi，最小值为xj， ∴极差xi−xj，
则第二组中最大值为xi+c，最小值为xj+c， ∴极差xi−xj， D正确．
故选CD．
【反思感悟】
设一组样本数据x1，x2，…，xn，其方差为s2，标准差为s2=s.
由这组数据得到新样本数据x1+c，x2+c，…，xn+c，其中c为非零常数，则该组数据的方差也为s2，标准差也为s2=s，极差为xmax−xmin.
由这组数据得到新样本数据mx1，mx2，…，mxn，，其中m为非零常数，则该组数据的方差为m2s2，标准差为m2s2=|ms|=|m|s，极差为mxmax−mxmin=m(xmax−xmin).
由这组数据得到新样本数据mx1+c，mx2+c，…，mxn+c，，其中m、c均为非零常数，则该组数据的方差为m2s2，标准差为m2s2=|ms|=|m|s，极差为(mxmax+c)−(mxmin+c)=m(xmax−xmin).
例4 在一组样本数据中，1，2，3，4出现的频率分别为p1，p2，p3，p4，且i=14pi=1，则下面四种情形中，对应样本的标准差最大的一组是( )
A. ，==0.1，==0.4B. ==0.4，==0.1
C. ，==0.2，==0.3D. ==0.3，==0.2
提示：根据方差的加权公式s2=1ni=1nfi(yi−y)2先求出方差，再得方差的算术平方根，即可求解.
解：A中，平均数为1×0.1+2×0.4+3×0.4+4×0.1=2.5，
标准差为 (1−2.5)2×0.1+(2−2.5)2×0.4+3−2.52×0.4+(4−2.5)2×0.1= 0.65，
同理可得B中，平均数为2.5，标准差为 1.85，
C中，平均数为2.5，标准差为 1.05，
D中，平均数为2.5，标准差为 1.45，
故选B．
设计意图：通过例题，熟悉极差、方差和标准差的公式，并增强对极差、方差和标准差及其统计意义的理解，掌握分层随机抽样样本方差的计算．
（四）课堂练习
1.为评估一种农作物的种植效果，选了n块地作试验田．这n块地的亩产量(单位：kg)分别为x1，x2，…，xn，下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
A. x1，x2，…，xn的平均数B. x1，x2，…，xn的标准差
C. x1，x2，…，xn的最大值D. x1，x2，…，xn的中位数
解：评估这种农作物亩产量稳定程度的指标是标准差或方差
故选B．
2.已知一组数据4.7，4.8，5.1，5.4，5.5，则该组数据的方差是．
解：∵数据4.7，4.8，5.1，5.4，5.5的平均数为：
x=15×(4.7+4.8+5.1+5.4+5.5)=5.1，
∴该组数据的方差：
S2=15×[(4.7−5.1)2+(4.8−5.1)2+(5.1−5.1)2+(5.4−5.1)2+(5.5−5.1)2]=0.1．
故答案为：0.1．
已知一组样本数据x1，x2，…，x10，且x12+x22+…+x102=2020，平均数x=9，则该组数据的标准差为．
解：一组样本数据x1，x2，…，x10，且x12+x22+…+x102=2020，平均数x−=9，
则该组数据的方差为110[(x1−x−)2+(x2−x−)2+…+(x10−x−)2]
=110[x12+x22+…+x102−2x−×(x1+x2+…+x10)+10x2]
=110(2020−2×9×90+10×81)=121，
∴则其标准差为s=121=11．
故答案为：11．
4. 若样本数据 x1, x2,⋯, x10的标准差为8，则数据2x1−1，2x2−1，−1，的标准差为( )
A. 8B. 15C. 16D. 32
解：设样本数据 x1, x2,⋯, x10的标准差为 D(X) ，则 D(X) =8，即方差D(X)=64，而数据2x1−1，2x2−1，⋯，2x10−1的方差D(2X−1)= 22D(X)= 22 ×64，所以其标准差为 22 ×64 =16,
故选C．
5.现有甲、乙两组数据，每组数据均由六个数组成，其中甲组数据的平均数为3，方差为5，乙组数据的平均数为5，方差为3.若将这两组数据混合成一组，则新的一组数据的方差为( )
A. 3.5B. 4C. 4.5D. 5
解：根据题意，甲组数据的平均数为3，方差为5，乙组数据的平均数为5，方差为3，
则两组数据混合后，新数据的平均数x=6×3+6×512=4，
则新数据的方差s2=612[5+(3−4)2]+612[3+(5−4)2]=5，
故选：D．
设计意图：通过课堂练习，让学生反复巩固极差、方差和标准差的公式及其统计意义，并能够灵活运用.
（五）归纳总结
【课堂小结】回顾本节课的内容，你都学到了什么？
次数
1
2
3
4
5
6
7
8
9
10
平均数
中位数
众数
甲
7
8
7
9
5
4
9
10
7
4
7
7
7
乙
9
5
7
8
7
6
8
6
7
7
7
7
7
姓名
第一次
第二次
第三次
第四次
第五次
小明
107
111
110
109
113
小红
99
110
111
108
112

高中数学人教A版高一下学期必修第二册第九章《9.2.4总体离散程度的估计》教案

高中人教A版 (2019)9.2 用样本估计总体教案

相关教案

相关教案更多

高中数学人教A版高一下学期必修第二册第九章《9.2.4总体离散程度的估计》教案

高中人教A版 (2019)9.2 用样本估计总体教案

相关教案

相关教案 更多

相关教案更多