![(新)北师大版数学必修第一册教学讲义:第6章 §4 4.1 样本的数字特征第1页](http://m.enxinlong.com/img-preview/3/3/5705679/0/0.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![(新)北师大版数学必修第一册教学讲义:第6章 §4 4.1 样本的数字特征第2页](http://m.enxinlong.com/img-preview/3/3/5705679/0/1.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![(新)北师大版数学必修第一册教学讲义:第6章 §4 4.1 样本的数字特征第3页](http://m.enxinlong.com/img-preview/3/3/5705679/0/2.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
所属成套资源:(新)北师大版高中数学必修第一册导学案
高中数学北师大版 (2019)必修 第一册第六章 统计4 用样本估计总体数字特征4.1 样本的数字特征获奖教学设计及反思
展开这是一份高中数学北师大版 (2019)必修 第一册第六章 统计4 用样本估计总体数字特征4.1 样本的数字特征获奖教学设计及反思,共10页。
§4 用样本估计总体的数字特征
4.1 样本的数字特征
1.众数、中位数、平均数定义
(1)众数:一组数据中出现次数最多的数.
(2)中位数:把一组数据按从小到大的顺序排列,处在中间位置(或中间两个数的平均数)的数称为这组数据的中位数.
(3)平均数:如果n个数x1,x2,…,xn,那么 eq \x\t(x)= eq \f(1,n)(x1+x2+…+xn)称为这n个数的平均数.
2.方差
(1)公式:s2= eq \f((x1-\x\t(x))2+(x2-\x\t(x))2+…+(xn-\x\t(x))2,n).
(2)意义:方差刻画的是数据偏离平均数的离散程度.
3.标准差
s= eq \r(s2)= eq \r(\f((x1-\x\t(x))2+(x2-\x\t(x))2+…+(xn-\x\t(x))2,n)).
思考:1.众数、中位数和平均数各有什么优点和缺点?
提示:三种数字特征的优缺点比较:
2.标准差、方差的意义是什么?
提示:标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.
1.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有( )
A.a>b>c B.b>c>a
C.c>a>b D.c>b>a
D [将数据从小到大排列为10,12,14,14,15,15,16,17,17,17,则平均数a= eq \f(1,10)(10+12+14×2+15×2+16+17×3)=14.7,中位数b=15,众数c=17,显然a<b<c.]
2.在教学调查中,甲、乙、丙三个班的数学测试成绩分布如图,假设三个班的平均分都是75分,s1,s2,s3分别表示甲、乙、丙三个班数学测试成绩的标准差,则有( )
甲 乙 丙
A.s3>s1>s2 B.s2>s1>s3
C.s1>s2>s3 D.s3>s2>s1
D [所给图是成绩分布图,平均分是75分,在题图甲中,集中在75分附近的数据最多,题图丙中从50分到100分均匀分布,所有成绩不集中在任何一个数据附近,题图乙介于两者之间.由标准差的意义可得s3>s2>s1.]
3.已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________.
6 [ eq \f(4+6+5+8+7+6,6)=6.]
众数、中位数、平均数的简单运用
【例1】 下面是某快餐店所有职位一周的收入表:
(1)计算所有职位的周平均收入;
(2)这个平均收入能反映所有职位的周收入的一般水平吗?为什么?
(3)去掉老板的收入后,再计算平均收入,这能代表该店职位的周收入的水平吗?
[解] (1)周平均收入 eq \x\t(x)1= eq \f(1,7)(6 000+900+700+800+640+640+820)=1 500(元).
(2)这个平均收入不能反映所有职位的周收入水平,可以看出打工人员的收入都低于平均收入,因为老板收入特别高,这是一个异常值,对平均收入产生了较大的影响,并且他不是打工人员.
(3)去掉老板的收入后的周平均收入 eq \x\t(x)2= eq \f(1,6)(900+700+800+640+640+820)=750(元).
这能代表该店职位的周收入水平.
利用样本数字特征进行决策时的两个关注点
(1)平均数与每一个数据都有关,可以反映更多的总体信息,但受极端值的影响大;中位数是样本数据所占频率的等分线,不受几个极端值的影响;众数只能体现数据的最大集中点,无法客观反映总体特征.
(2)当平均数大于中位数时,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.
eq \a\vs4\al([跟进训练])
1.在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
分别求这些运动员成绩的众数、中位数与平均数.
[解] 在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.题表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;这组数据的平均数是 eq \x\t(x)= eq \f(1,17)(1.50×2+1.60×3+…+1.90×1)= eq \f(28.75,17)≈1.69(m).所以17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m.
标准差、方差的计算及简单应用
【例2】 甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
[解] (1) eq \x\t(x)甲= eq \f(1,6)(99+100+98+100+100+103)=100,
eq \x\t(x)乙= eq \f(1,6)(99+100+102+99+100+100)=100.
s eq \\al(\s\up1(2),\s\d1(甲))= eq \f(1,6)[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]
= eq \f(7,3),
s eq \\al(\s\up1(2),\s\d1(乙))= eq \f(1,6)[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)两台机床所加工零件的直径的平均值相同,又s eq \\al(\s\up1(2),\s\d1(甲))>s eq \\al(\s\up1(2),\s\d1(乙)),所以乙机床加工零件的质量更稳定.
标准差、方差的意义
(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小,标准差的大小不会超过极差.
(2)标准差、方差的取值范围:[0,+∞).
标准差、方差为0时,样本各数据相等,说明数据没有波动幅度,数据没有离散性.
eq \a\vs4\al([跟进训练])
2.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为 eq \x\t(x)A和 eq \x\t(x)B,样本标准差分别为sA和sB,则( )
A. eq \x\t(x)A> eq \x\t(x)B,sA>sB B. eq \x\t(x)A< eq \x\t(x)B,sA>sB
C. eq \x\t(x)A> eq \x\t(x)B,sA
B [ eq \x\t(x)A= eq \f(1,6)(2.5+10+5+7.5+2.5+10)=6.25,
eq \x\t(x)B= eq \f(1,6)(15+10+12.5+10+12.5+10)= eq \f(35,3)≈11.67.
s eq \\al(\s\up1(2),\s\d1(A))= eq \f(1,6)[(2.5-6.25)2+(10-6.25)2+(5-6.25)2+(7.5-6.25)2+(2.5-6.25)2+(10-6.25)2]≈9.90,
s eq \\al(\s\up1(2),\s\d1(B))= eq \f(1,6)[(15- eq \f(35,3))2+(10- eq \f(35,3))2+( eq \f(25,2)- eq \f(35,3))2+(10- eq \f(35,3))2+( eq \f(25,2)- eq \f(35,3))2+(10- eq \f(35,3))2]≈3.47.
故 eq \x\t(x)A< eq \x\t(x)B,sA>sB.]
数据的数字特征的综合应用
[探究问题]
1.对一组数据进行统计分析,应该从哪几个方面进行?
提示:平均数反映数据的平均水平,用众数反映数据的最大集中点,用中位数反映数据的集中趋势和一般水平,用标准差或方差反映数据的离散程度.
2.对比两组数据时,要从哪几个方面进行?
提示:从众数、中位数、平均数和方差等几个方面.
【例3】 在一次科技知识竞赛中,某学校的两组学生的成绩如下表:
请根据你所学过的统计知识,判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.
[思路点拨] 分别求出这两组数据的众数、中位数、平均数和方差,从这几个方面进行统计分析.
[解] (1)甲组成绩的众数为90,乙组成绩的众数为70,从成绩的众数比较看,甲组成绩好些.
(2) eq \x\t(x)甲= eq \f(1,2+5+10+13+14+6)(50×2+60×5+70×10+80×13+90×14+100×6)
= eq \f(1,50)×4 000=80,
eq \x\t(x)乙= eq \f(1,4+4+16+2+12+12)(50×4+60×4+70×16+80×2+90×12+100×12)
= eq \f(1,50)×4 000=80.
s eq \\al(\s\up1(2),\s\d1(甲))= eq \f(1,2+5+10+13+14+6)[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172,
s eq \\al(\s\up1(2),\s\d1(乙))= eq \f(1,4+4+16+2+12+12)[4×(50-80)2+4×(60-80)2+16×(70-80)2+2×(80-80)2+12×(90-80)2+12×(100-80)2]=256.
∵ eq \x\t(x)甲= eq \x\t(x)乙,s eq \\al(\s\up1(2),\s\d1(甲))
(3)甲、乙两组成绩的中位数、平均数都是80分.其中,甲组成绩在80分以上(包括80分)的有33人,乙组成绩在80分以上(包括80分)的有26人.从这一角度看,甲组的成绩较好.
(4)从成绩统计表看,甲组成绩大于等于90分的有20人,乙组成绩大于等于90分的有24人,所以乙组成绩集中在高分段的人数多.同时,乙组得满分的人数比甲组得满分的人数多6人.从这一角度看,乙组的成绩较好.
1.如果从甲、乙两组学生中选择一组代表学校外出参加全市的科技知识竞赛,按照往年的竞赛成绩,该学校的竞赛水平均高于其它参赛学校,如果你是竞赛教练员,请问你选择哪一组学生代表学校参加比赛?为什么?
[解] 选择甲组学生代表学校参加比赛.因为甲、乙两组的学生的平均成绩相同,都是80,且往年的竞赛成绩,该学校的竞赛水平均高于其它参赛学校,所以要想稳拿冠军,就需要参赛学生稳定发挥就可以了,因为s eq \\al(\s\up1(2),\s\d1(甲))
2.如果从甲、乙两组学生中选择一组代表学校外出参加全市的科技知识竞赛,按照往年的竞赛成绩,该学校的竞赛水平均不如其它参赛学校,如果你是竞赛教练员,请问你选择哪一组学生代表学校参加比赛?为什么?
[解] 选择乙组学生代表学校参加比赛.因为甲、乙两组的学生的平均成绩相同,都是80,且照往年的竞赛成绩,该学校的竞赛水平均不如其它参赛学校,要想获得冠军只有选择发挥不很稳定的一组参加比赛才有可能,因为s eq \\al(\s\up1(2),\s\d1(甲))
数据分析的要点
(1)要正确处理此类问题,首先要抓住问题中的关键词语,全方位地进行必要的计算、分析,而不能习惯性地仅从样本方差的大小去决定哪一组的成绩好,像这样的实际问题还得从实际的角度去分析,如本例的“满分人数”;其次要在恰当地评估后,组织好正确的语言作出结论.
(2)在进行数据分析时,不同的标准没有对和错的问题,也不存在唯一解的问题,而是根据需要来选择“好”的决策,至于决策的好坏,是根据提出的标准而定的.
1.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.
2.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性,用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.
1.思考辨析(正确的画“√”,错误的画“×”)
(1)一个样本的众数、平均数和中位数都是唯一的.( )
(2)样本的平均数是频率分布直方图中最高长方形的中点对应的数据.
( )
(3)若改变一组数据中其中的一个数,则这组数据的平均数、中位数、众数都会发生改变.( )
[提示] (1)错误.一个样本的平均数和中位数是唯一的.若数据中有两个或两个以上出现得最多,且出现次数一样多,则这些数据都叫众数,若一组数据中每个数据出现的次数一样多,则没有众数,可见一个样本的众数可能多个,也可能没有.
(2)错误.样本的平均数等于每个小矩形的面积乘小矩形底边中点的横坐标之和.
(3)错误.若改变一组数据中的一个数,则这组数据的平均数一定会改变,而中位数与众数可能不变.
[答案] (1)× (2)× (3)×
2.下列说法不正确的是( )
A.方差是标准差的平方
B.标准差的大小不会超过极差
C.若一组数据的值大小相等,没有波动变化,则标准差为0
D.标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散
D [标准差越大,表明各个样本数据在样本平均数周围越分散;标准差越小,表明各个样本数据在样本平均数周围越集中.]
3.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数、众数、中位数分别为( )
A.85分,85分,85分 B.87分,85分,86分
C.87分,85分,85分 D.87分,85分,90分
C [平均数为 eq \f(100+95+90×2+85×4+80+75,10)=87,众数为85,中位数为85,故选C.]
4.一箱方便面共有50袋,用随机抽样方法从中抽取了10袋,并称其质量(单位:g)结果为:
60.5 61 60 60 61.5 59.5 59.5 58 60 60
(1)指出总体、个体、样本、样本容量;
(2)指出样本数据的众数、中位数、平均数;
[解] (1)总体:50袋方便面的质量,个体:每袋方便面的质量,样本:10袋方便面的质量,样本容量10.
(2)众数,中位数,平均数均为60.学 习 目 标
核 心 素 养
1.会求样本的众数、中位数、平均数、方差、标准差.(重点)
2.能用样本的数字特征估计总体的数字特征,并作出合理解释和决策.(难点)
1.通过对数据特征数的计算,培养数学运算素养.
2.通过利用数据的特征数估计总体分布,培养数据分析素养.
名称
优点
缺点
众数
①体现了样本数据的最大集中点;
②容易计算
①它只能表达样本数据中很少的一部分信息;
②无法客观地反映总体的特征
中位数
①不受少数几个极端数据(即排序靠前或靠后的数据)的影响;
②容易计算,便于利用中间数据的信息
对极端值不敏感
平均数
代表性较好,是反映数据集中趋势的量.一般情况下,可以反映出更多的关于样本数据全体的信息
任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
老板
大厨
二厨
采购员
杂工
服务生
会计
6 000元
900元
700元
800元
640元
640元
820元
成绩(单位:m)
1.50
1.60
1.65
1.70
1.75
1.80
1.85
1.90
人数
2
3
2
3
4
1
1
1
分数
50
60
70
80
90
100
人数
甲组
2
5
10
13
14
6
乙组
4
4
16
2
12
12
相关学案
这是一份北师大版 (2019)必修 第一册4.1 样本的数字特征学案,共8页。
这是一份高中数学北师大版 (2019)必修 第一册4.1 样本的数字特征导学案,共13页。
这是一份北师大版 (2019)必修 第一册4.1 样本的数字特征学案,共9页。