高中人教A版 (2019)9.2 用样本估计总体教案
展开
这是一份高中人教A版 (2019)9.2 用样本估计总体教案,共10页。教案主要包含了教学目标,教学重难点,教学过程等内容,欢迎下载使用。
总体离散程度的估计
一、教学目标
1.熟悉极差、方差、标准差的计算公式,并理解极差、方差、标准差等离散程度参数的统计意义.
2.会求解极差、方差、标准差,并会用平均数、中位数、众数和极差、方差、标准差对数据进行比较、分析和评价.
3.掌握用样本的离散程度参数估计总体的离散程度的方法,体会样本估计总体的思想,发展数据分析素养.
二、教学重难点
重点:极差、方差、标准差等离散程度参数的统计意义的理解和计算,应用平均数、中位数、众数和极差、方差、标准差对数据进行分析.
难点:已知每组数据个数、平均数和方差,获得各组数据合并后全部数据的方法的计算方法,及计算中的递推思想.
三、教学过程
(一)创设情境
假设你是一名质量控制分析师,工作于一个生产陶瓷餐具的公司。公司最近推出了一款新的餐盘系列,并希望确保它们在生产过程中的尺寸保持一致性,因为每个餐盘直径越接近,则餐盘的整体美观和功能性更好,你被要求分析餐盘直径的数据集,并确定生产过程是否一致.那么,如何刻画餐盘直径的离散程度呢?
设计意图:通过案例,给出生活中应用方差解决实际问题的例子,培养学生的学习兴趣,让学生从生活中去感知数学.
(二)探究新知
任务1:回忆和巩固方差的概念和统计意义.
例:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲 7 8 7 9 5 4 9 10 7 4
乙 9 5 7 8 7 6 8 6 7 7
想一想:如果你是教练,你如何对两位运动员的射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?
师生活动:学生提出评价标准,教师利用电子表格软件进行计算.
预设答案:学生可能先提出比较甲和乙10次射击的平均数、中位数和众数(通过计算会发现甲、乙两名运动员射击成绩的平均数、中位数和众数均为7).
在发现甲、乙两名运动员射击成绩的平均数、中位数和众数均为7后,知道从集中位置的角度看,两名运动员之间没有差别.
结合初中知识,可能想到用方差进行比较.
方差的定义:假设一组数据是x1,x2,···,xn,用x表示这组数据的平均数,我们称
1ni=1n(xi−x)2
为这组数据的方差.
因为
1ni=1n(xi−x)2=1ni=1n(xi2−2∙x∙xi+x2)
=1ni=1nxi2−2∙x∙(1ni=1nxi)+x2
=1ni=1nxi2−2∙x∙x+x2
=1ni=1nxi2−x2
所以有时为了计算方差方便,也用上述表达式计算方差.
方差刻画了数据的离散程度或波动程度,方差越大,数据的离散程度越大;方差越小,数据的离散程度越小.
如果有学生回答用最大值或最小值,那么可以引导学生考虑成绩的稳定性.
思考:两名运动员射靶环数的方差分别是多少?为什么可以运用方差分析两个运动员的射击成绩?
预设答案:根据方差公式s2=1ni=1n(xi−x)2计算得s甲2=4,s乙2≈1.2,由s甲2>s乙2可知,甲的成绩离散程度大,乙的成绩离散程度小,说明乙比甲的射击成绩稳定.两个运动员的平均成绩一样,比较他们的平均成绩在所有参赛选手中的位置,如果两人都排在前面,越稳定越好,可以选择成绩稳定的乙;如果两人的成绩抽排在后面,希望比赛时有突出表现,可以选择成绩方差大的甲.
设计意图:通过案例,帮助学生回忆方差的概念和统计意义,并掌握应用方差刻画一组数据的离散程度.
任务2:探究其他刻画一组数据的离散程度的统计量.
思考:除了方差,你还能想到其他刻画一组数据的离散程度的统计量?
师生活动:学生思考、讨论并分享,教师引导学生解释这些量的合理性.
预设答案:(1)极差.极差是数据的最大值与最小值的差,即xmax−xmin,可以反映数据的波动范围.在一定程度上,极差越大,数据的离散程度越大;极差越小,数据的离散程度越小.
评价:极差是一种简单的度量数据离散程度的方法.但因为极差只用到了数据中的最大值和最小值,对其他数据没有涉及,所以极差包含的信息量很少.
平均偏差.平均偏差是每个数据与其平均数的差的绝对值的平均数,假设一组数据是x1,x2,···,xn,用x表示这组数据的平均数.即
|x1−x|+|x2−x|+∙∙∙+|xn−x|n
为这组数据的平均偏差.
评价:平均偏差与方差产生的思想一样,都是运用平均距离刻画数据的离散程度.但平均偏差计算公式中含绝对值,计算不方便.
设计意图:让学生主动探索多个统计量刻画数据的离散程度,并认识到每个统计量的优缺点.
任务3:探究标准差的概念和统计意义.
思考:任务1中计算的两名运动员的方差,其单位是什么?是否与原始数据的单位一致呢?如果不一致,又可以用什么来刻画一组数据的离散程度呢?
预设答案:方差的单位是原始数据单位的平方.,与原始数据的单位不一致.如果对方差求算术平方根,则单位和原始数据的单位一致.
因此用方差的算术平方根,即
1ni=1n(xi−x)2
我们称之为这组数据的标准差,来刻画一组数据的离散程度.
标准差刻画了数据的离散程度或波动程度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
显然,在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.
如果总体中所有个体的变量值分别为Y1,Y2,···,YN,总体平均数为Y,则称
S2=1Ni=1N(Yi−Y)2
为总体方差,
S=S2
为总体标准差.
与总体均值类似,总体方差也可以写成加权的形式.如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,···,Yk,其中Yi出现的频数为fi(i=1,2,···,k),则总体方差为
S2=1Ni=1kfi(Yi−Y)2
追问:方差和标准差的取值范围是什么?如果方差和标准差为0,这组数据有什么特征?
预设答案:方差和标准差的取值范围为[0,+∞).标准差和方差为0时,样本各数据全相等,都等于样本的平均数,表明数据没有波动幅度,数据没有离散性.
设计意图:巩固对方差和标准差的理解.
任务4:探究分层随机抽样样本方差的计算,并估计总体的方差.
在实际问题中,如果能获得总体中所有个体的观测值,可以用方差的公式直接计算总体的方差.比如,要了解某中学教师年工资差别,可以直接从学校财务出获得所有教师的年工资收入数据,计算其方差即可判断.如果要了解某市中学生教师年工资的差别,获取所有教师的年工资数据就比较困难,可以用简单随机抽样或分层随机抽样方法抽取样本,取到样本中所有个体的年工资数据,然后计算其方差,该方差是样本的方差,利用样本估计总体的思想,可以用样本方差估计总体方差.
思考:在对树人中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生23人,样本的平均数和方差分别为170.6和12.59,抽取了女生27人,样本的平均数和方差分别为160.6和38.62.你能由这些数据计算出样本的方差吗?并对高一年级全体学生的身高方差作出估计吗?
师生活动:教师引导学生明确题目的条件和结论,引导学生独立计算多组数据汇总后的方差.
分析:把男生样本记为x1,x2,⋯,x23,其平均数记为x,方差记为sx2;把女生样本记为y1,y2,⋯,y27,其平均数记为y,方差记为sy2;把总样本数据的平均数记为z,方差记为s2.
根据方差的定义,总样本方差为
s2=150[i=123(xi−z)2+i=127(yj−z)2]
=150[i=123(xi−x+x−z)2+j=127(yj−y+y−z)2].
由i=123(xi−x)=i=123xi−23x=0,可得i=1232(xi−x)(x−z)=2(x−z)i=123(xi−x)=0.
同理可得j=1272(yi−y)(y−z)=0.
因此,s2=150[i=123(xi−x)2+i=123(x−z)2+j=127(yj−y)2+j=127(y−z)2]
=15023[sx2+(x−z)2]+27[sy2+(y−z)2]①.
由x=170.6,y=160.6,根据按比例分配分层随机抽样总样本平均数与各层样本平
均数的关系,可得总样本平均数为
z=2323+27x+2723+27y=23×170.6+27×160.650=165.2.
把已知的男生、女生样本平均数和方差的取值代入 ①,可得
s2=15023×[12.59+(170.6−165.2)2]+27×[38.62+(160.6−165.2)2]=51.4862.
我们可以计算出总样本的方差为51.4862,并据此估计高一年级学生身高的总体方差为51.4862.
追问:比较总体样本方差与男生组及女生组的方差,你能发现什么?你能解释在估计全体学生平均身高时,按性别分层随机抽样的理由吗?
师生活动:学生可以看到总样本方差既大于男生组的方差,也大于女生组的方差,教师解释相同样本量的条件下,总样本方差越小,样本均值估计总体均值效果越好.男、女生的均值相差越大,即两组差别越大,总样本方差比男、女生的方差均大得越多,分层随机抽样的效果越好.
设计意图:引导学生对统计结果进行解释,进而更好地理解分层随机抽样的适用范围.
思考:一般地,如果知道两组数据各自的数据个数、平均数和方差,如何计算全部数据的平均数和方差呢?
师生活动:教师引导学生由具体例子进行一般化归纳.
分析:一般地,如果已知第一组数据的个数是m,平均数和方差分别是x和sx2,第二组数据的个数是n,平均数和方差分别是y和sy2,那么,总样本平均数
z=mm+nx+nm+ny
总样本方差为
s2=mm+n[sx2+(x−z)2]+nm+n[sy2+(y−z)2]
如果两组数据的平均数相等,那么总样本均值与两组数据的均值相同,总样本方差计算公式中的(x−z)2和(y−z)2都等于0,总样本方差是两组方差的加权平均,即s2=mm+nsx2+nm+nsy2,不会同时大于每组的方差.
设计意图:将总样本均值和总样本方差的计算公式在问题的推广到一般,让学生体会由具体到一般的思想.
拓展:平均数反映数据的集中趋势,标准差刻画了数据离平均数的波动大小,那么将平均数和标准差综合在一起呢?
如:课本9.2.1节中100户居民用户的月均用水量数据,可以计算出样本平均数x=8.79,样本标准差s≈6.20.则
x−s=2.59,x+s=14.99,
x−2s=−3.61,x+2s=21.19.
如图可以发现,这100个数据中大部分落在区间[x−s,x+s]=[2.59,14.99]内,在区间[x−2s,x+2s]=[−3.61,21.19]外的只有7个,也就是说,绝大部分的数据落在[x−2s,x+2s]内.
通过平均数和标准差两个统计量,就可以得到大部分数据的取值范围.方差越大,则这个区间越大;方差越小,则这个区间也越小.
设计意图:让学生认识到利用平均数和标准差也可以部分反映数据的取值规律.
(三)应用举例
例1 小明和小红5次考试数学成绩统计如表:
则成绩较为稳定的那个同学成绩的方差为( )
A. 110B. 108C. 22D. 4
提示:根据已知条件,结合平均数x=1n(x1+x2+⋯+xn)与方差s2=1ni=1n(xi−x)2的公式,即可求解.
解:观察两组数据可知,小明的成绩较稳定,
小明成绩的平均数x−=15×(107+111+110+109+113)=110,
小明成绩的方差s2=15[(107−110)2+(111−110)2+(110−110)2+(109−110)2+(113−110)2]=4.
故选:D.
例2 现有A,B两组数据,其中A组有4个数据,平均数为2,方差为6,B组有6个数据,平均数为7,方差为1.若将这两组数据混合成一组,则新的一组数据的方差为 .
提示:根据题意,由分层随机抽样的样本平均数的计算公式z=mm+nx+nm+ny
和方差的计算公式s2=mm+n[sx2+(x−z)2]+nm+n[sy2+(y−z)2]计算可得答案.
解: A组有4个数据,平均数为2,方差为6,B组有6个数据,平均数为7,方差为1,
则两组数据混合后,新数据的平均数x=4×2+6×74+6=5,
新数据的方差s2=410[6+(2−5)2]+610[1+(7−5)2]=9,
故答案为:9.
例3有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,⋅⋅⋅,n),c为非零常数,则( )
A. 两组样本数据的样本平均数相同B. 两组样本数据的样本中位数相同
C. 两组样本数据的样本标准差相同D. 两组样本数据的样本极差相同
解:对于A,∵x=1ni=1nxi,
y=1ni=1n(xi+c)=1ni=1nxi+c=x+c, ∴A错;
对于B,设第一组中位数为xk,
则第二组中位数为yk=xk+c, ∴B错;
对于C,∵第一组标准差s= 1ni=1n(xi−x)2,
第二组标准差s′= 1ni=1n(yi−y)2= 1nn=1n(xi−x)2,
∴C正确;
对于D,设第一组中最大值为xi, 最小值为xj, ∴极差xi−xj,
则第二组中最大值为xi+c, 最小值为xj+c, ∴极差xi−xj, D正确.
故选CD.
【反思感悟】
设一组样本数据x1,x2,…,xn,其方差为s2,标准差为s2=s.
由这组数据得到新样本数据x1+c,x2+c,…,xn+c,其中c为非零常数,则该组数据的方差也为s2,标准差也为s2=s,极差为xmax−xmin.
由这组数据得到新样本数据mx1,mx2,…,mxn,,其中m为非零常数,则该组数据的方差为m2s2,标准差为m2s2=|ms|=|m|s,极差为mxmax−mxmin=m(xmax−xmin).
由这组数据得到新样本数据mx1+c,mx2+c,…,mxn+c,,其中m、c均为非零常数,则该组数据的方差为m2s2,标准差为m2s2=|ms|=|m|s,极差为(mxmax+c)−(mxmin+c)=m(xmax−xmin).
例4 在一组样本数据中,1,2,3,4出现的频率分别为p1,p2,p3,p4,且i=14pi=1,则下面四种情形中,对应样本的标准差最大的一组是( )
A. ,==0.1,==0.4B. ==0.4,==0.1
C. ,==0.2,==0.3D. ==0.3,==0.2
提示:根据方差的加权公式s2=1ni=1nfi(yi−y)2先求出方差,再得方差的算术平方根,即可求解.
解:A中,平均数为1×0.1+2×0.4+3×0.4+4×0.1=2.5,
标准差为 (1−2.5)2×0.1+(2−2.5)2×0.4+3−2.52×0.4+(4−2.5)2×0.1= 0.65,
同理可得B中,平均数为2.5,标准差为 1.85,
C中,平均数为2.5,标准差为 1.05,
D中,平均数为2.5,标准差为 1.45,
故选B.
设计意图:通过例题,熟悉极差、方差和标准差的公式,并增强对极差、方差和标准差及其统计意义的理解,掌握分层随机抽样样本方差的计算.
(四)课堂练习
1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
A. x1,x2,…,xn的平均数B. x1,x2,…,xn的标准差
C. x1,x2,…,xn的最大值D. x1,x2,…,xn的中位数
解:评估这种农作物亩产量稳定程度的指标是标准差或方差
故选B.
2.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是 .
解:∵数据4.7,4.8,5.1,5.4,5.5的平均数为:
x=15×(4.7+4.8+5.1+5.4+5.5)=5.1,
∴该组数据的方差:
S2=15×[(4.7−5.1)2+(4.8−5.1)2+(5.1−5.1)2+(5.4−5.1)2+(5.5−5.1)2]=0.1.
故答案为:0.1.
已知一组样本数据x1,x2,…,x10,且x12+x22+…+x102=2020,平均数x=9,则该组数据的标准差为 .
解:一组样本数据x1,x2,…,x10,且x12+x22+…+x102=2020,平均数x−=9,
则该组数据的方差为110[(x1−x−)2+(x2−x−)2+…+(x10−x−)2]
=110[x12+x22+…+x102−2x−×(x1+x2+…+x10)+10x2]
=110(2020−2×9×90+10×81)=121,
∴则其标准差为s=121=11.
故答案为:11.
4. 若样本数据 x1, x2,⋯, x10的标准差为8,则数据2x1−1,2x2−1,−1,的标准差为( )
A. 8B. 15C. 16D. 32
解:设样本数据 x1, x2,⋯, x10的标准差为 D(X) ,则 D(X) =8,即方差D(X)=64,而数据2x1−1,2x2−1,⋯,2x10−1的方差D(2X−1)= 22D(X)= 22 ×64,所以其标准差为 22 ×64 =16,
故选C.
5.现有甲、乙两组数据,每组数据均由六个数组成,其中甲组数据的平均数为3,方差为5,乙组数据的平均数为5,方差为3.若将这两组数据混合成一组,则新的一组数据的方差为( )
A. 3.5B. 4C. 4.5D. 5
解:根据题意,甲组数据的平均数为3,方差为5,乙组数据的平均数为5,方差为3,
则两组数据混合后,新数据的平均数x=6×3+6×512=4,
则新数据的方差s2=612[5+(3−4)2]+612[3+(5−4)2]=5,
故选:D.
设计意图:通过课堂练习,让学生反复巩固极差、方差和标准差的公式及其统计意义,并能够灵活运用.
(五)归纳总结
【课堂小结】回顾本节课的内容,你都学到了什么?
次数
1
2
3
4
5
6
7
8
9
10
平均数
中位数
众数
甲
7
8
7
9
5
4
9
10
7
4
7
7
7
乙
9
5
7
8
7
6
8
6
7
7
7
7
7
姓名
第一次
第二次
第三次
第四次
第五次
小明
107
111
110
109
113
小红
99
110
111
108
112
相关教案
这是一份高中数学人教A版 (2019)必修 第二册第九章 统计9.2 用样本估计总体精品教案设计,共11页。教案主要包含了类题通法,巩固练习1,巩固练习2,巩固练习3,设计意图等内容,欢迎下载使用。
这是一份高中数学第九章 统计9.1 随机抽样教学设计及反思,共4页。
这是一份高中数学9.2 用样本估计总体教案及反思,共6页。教案主要包含了总体集中趋势的估计,总体离散程度的估计,典例分析,巩固练习等内容,欢迎下载使用。

