人教B版 (2019)必修 第二册5.1.4 用样本估计总体学案
展开5.1.4 用样本估计总体
学 习 任 务 | 核 心 素 养(教师独具) |
1.会求样本的平均数、标准差、方差.(重点) 2.理解用样本的数字特征估计总体的数字特征的方法.(重点) 3.会应用相关知识解决实际统计问题.(难点) | 1.通过样本数字特征的学习,体现了数据分析的核心素养. 2.借助用样本的数字特征解决实际问题,提升数学运算的核心素养. |
中国体育彩票的种类有:超级大乐透、排列3、排列5、七星彩、地方体彩、足球彩票、竞彩、顶呱刮等等.体育彩票市场曾创造了无数的神话,相当一部分中奖者在谈及自己的中奖经历时都表示他们能够中奖,是经过长期研究体育彩票的走势及中奖号码分布特点后(即作出频率分布表),精心选号的结果.所以说彩民之所以能中大奖是因为他们“推测”的方法是科学的,“推测”的结果是比较可靠的.那么他们是如何“推测”的呢?
问题:(1)“推测”彩票是估计哪些方面?
(2)他们是如何处理中奖数据的?
[提示] (1)他们把中奖号码绘制成图、表等进行观察,分析中奖号码的分布、走势,以此去推测、估计下次的中奖号码.
其主要是利用中奖号码的分布去估计下期中奖号码的分布.
(2)绘成图、表进行分析.
知识点1 用样本的数字特征估计总体的数字特征
1.在容许一定误差存在的情况下,可以用样本的数字特征去估计总体的数字特征,这样就能节省人力和物力等.
2.样本是用分层抽样得到的,由每一层的数字特征估计总体的数字特征.以分两层抽样的情况为例.
条件 | 假设第一层有m个数,分别为x1,x2,…,xm,平均数为,方差为s2;第二层有n个数,分别为y1,y2,…,yn,平均数为,方差为t2 |
结论 | 如果记样本均值为,样本方差为b2,则= ,b2= |
1.下列说法不正确的是( )
A.方差是标准差的平方
B.标准差的大小不会超过极差
C.若一组数据的值大小相等,没有波动变化,则标准差为0
D.标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散
D [标准差越小,表明各个样本数据在样本平均数周围越集中;标准差越大,表明各个样本数据在样本平均数的周围越分散.]
2.甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:
| 甲 | 乙 | 丙 | 丁 |
平均环数 | 8.6 | 8.9 | 8.9 | 8.2 |
方差s2 | 3.5 | 3.5 | 2.1 | 5.6 |
从这四个人中选择一人参加奥运会射击项目比赛,最佳人选是( )
A.甲 B.乙
C.丙 D.丁
C [由表可知,乙、丙的成绩最好,平均环数都为8.9,但乙的方差大,说明乙的波动性大,所以丙为最佳人选.]
知识点2 用样本的分布估计总体的分布
(1)如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不多.特别地,每一组的频率与总体对应的频率相差不会太大.
(2)同数字特征的估计一样,分布的估计一般也有误差.如果总体在每一个分组的频率记为π1,π2,…,πn,样本在每一组对应的频率记为p1,p2,…,pn,一般来说,
(πi-pi)2=[(π1-p1)2+(π2-p2)2+…+(πn-pn)2]
不等于零.同样,大数定律可以保证,当样本的容量越来越大时,上式很小的可能性将越来越大.
3.已知样本10,8,10,8,6,13,11,10,12,7,9,8,12,9,11,12,9,10,
11,10,那么频率为0.2的范围是( )
A.5.5~7.5 B.7.5~9.5
C.9.5~11.5 D.11.5~13.5
D [样本容量为20,频率为0.2的数有4个,而在11.5~13.5之间的数有13,12,12,12,共4个,其他的都不正确.]
4.为了解中学300名男生的身高情况,随机抽取若干名男生进行身高测量,将所得数据整理后,画出频数分布直方图(如图).估计该校男生的身高在169.5 cm~174.5 cm之间的人数有( )
A.12 B.48
C.72 D.96
C [根据图形,身高在169.5 cm~174.5 cm之间的人数的百分比为:×100%=24%,
∴该校男生的身高在169.5 cm~174.5 cm之间的人数有300×24%=72(人).故选C.]
类型1 用样本对总体进行估计
【例1】 甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:
(1)填写下表:
| 平均数 | 方差 | 中位数 | 命中9环及以上 |
甲 | 7 | 1.2 |
| 1 |
乙 |
| 5.4 |
| 3 |
(2)请从四个不同的角度对这次测试进行分析:
①从平均数和方差结合分析偏离程度;
②从平均数和中位数结合分析谁的成绩好些;
③从平均数和命中9环以上的次数相结合看谁的成绩好些;
④从折线图上两人射击命中环数及走势分析谁更有潜力.
[解] (1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10,所以乙=(2+4+6+8+7+7+8+9+9+10)=7;乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是=7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:
| 平均数 | 方差 | 中位数 | 命中9环及以上 |
甲 | 7 | 1.2 | 7 | 1 |
乙 | 7 | 5.4 | 7.5 | 3 |
(2)①甲、乙的平均数相同,均为7,但s<s,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.
②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶成绩比甲好.
③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.
④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.
在日常生活中,当面对一组数据时,相比每一个观测值,有时我们更关心的是能反映这组数据特征的一些值,例如上述数据,我们可以从平均数、中位数、百分位数、众数、极差、方差、标准差等角度进行比较.
1.甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.
(1)分别求出两人得分的平均数与方差;
(2)根据图形和(1)中计算结果,对两人的训练成绩作出评价.
[解] (1)由图可得甲、乙两人五次测试的成绩分别为
甲:10,13,12,14,16;
乙:13,14,12,12,14.
甲==13,
乙==13,
s=×[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
s=×[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
(2)由s>s可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
类型2 方差与标准差的应用
【例2】 某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:
甲 | 127 | 138 | 130 | 137 | 135 | 131 |
乙 | 133 | 129 | 138 | 134 | 128 | 136 |
求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数学竞赛.
[解] 设甲、乙二人成绩的平均数分别为甲、乙,方差分别为s、s.
则甲=130+(-3+8+0+7+5+1)=133,
乙=130+(3-1+8+4-2+6)=133,
s=[(-6)2+52+(-3)2+42+22+(-2)2]=,
s=[02+(-4)2+52+12+(-5)2+32]=.
因此,甲、乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应选乙参加竞赛较合适.
极差、方差与标准差的区别与联系?
[提示] 数据的离散程度可以通过极差、方差或标准差来描述.
(1)极差是数据的最大值与最小值的差,它反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感.
(2)方差或标准差则反映了一组数据围绕平均数波动的大小,为了得到以样本数据的单位表示的波动幅度通常用标准差,即样本方差的算术平方根,是样本数据到平均数的一种平均距离.
2.如图所示,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为sA和sB,则( )
A.A>B,sA>sB B.A<B,sA>sB
C.A>B,sA<sB D.A<B,sA<sB
B [观察图形可得:样本A的数据均小于或等于10,样本B的数据均大于或等于10,故A<B,又样本B的波动范围较小,故sA>sB.]
类型3 分层抽样背景下的样本数字特征估计
【例3】 工厂为了解每个工人对某零件的日加工量,统计员分别从两车间抽取了甲、乙两人日加工量的两个样本.抽到甲的一个样本容量为10,样本平均数为5,方差为1;乙的一个样本容量为12,样本平均数为6,方差为2.现将这两组样本合在一起,求合在一起后的样本的平均数与方差.
[解] 设抽到甲的一个样本数据为x1,x2,…,x10;乙的一个样本数据为y1,y2,…,y12,
由题意知=i=5,方差s2=(xi-5)2=1,
=i=6,方差t2=(yi-6)2=2,
则合在一起后的样本容量为22,
样本平均数为=×(10×5+12×6)≈5.55,
样本方差为b2=×
≈1.79.
样本是用分层抽样得到的,由每一层的数字特征估计总体的数字特征.以分两层抽样的情况为例.
条件 | 假设第一层有m个数,分别为x1,x2,…,xm,平均数为,方差为s2;第二层有n个数,分别为y1,y2,…,yn,平均数为,方差为t2 |
结论 | 如果记样本均值为,样本方差为b2,则= ,b2= |
3.在某学校为了调查高一年级学生每周的锻炼时间(单位:h)时,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5,方差为9;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为16.已知甲、乙两同学抽取的样本合在一起组成一个容量为18的样本,求合在一起后的样本均值与样本方差.
[解] 由题意知,甲同学抽取的样本容量m=10,样本平均值为=5,样本方差为s2=9;乙同学抽取的样本容量n=8,样本平均值为=6,样本方差t2=16.故合在一起后的样本平均值为=≈5.44.样本方差为×=×≈12.36.
类型4 频率分布直方图与数字特征的综合应用
1.观察频率分布直方图,能获得样本数据的原始信息吗?
[提示] 把样本数据做成频率分布直方图后就失去了原始数据.
2.给出样本数据的频率分布直方图,可以求出数据的众数,中位数和平均数吗?
[提示] 可以近似求出.
【例4】 统计局就某地居民的月收入(元)情况调查了10 000人,并根据所得数据画出了样本频率分布直方图(如图),每个分组包括左端点,不包括右端点,如第一组表示月收入在[500,1 000)内.
(1)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层抽样的方法抽出100人作进一步分析,则月收入在[2 000,2 500)内的应抽取多少人?
(2)根据频率分布直方图估计样本数据的中位数;
(3)根据频率分布直方图估计样本数据的平均数.
[思路探究] 结合频率分布直方图求解.
[解] (1)因为(0.000 2+0.000 4+0.000 3+0.000 1)×500=0.5,所以a==0.000 5,月收入在[2 000,2 500)内的频率为0.25,所以100人中月收入在[2 000,2 500)内的人数为0.25×100=25.
(2)因为0.000 2×500=0.1,
0.000 4×500=0.2.
0.000 5×500=0.25.
0.1+0.2+0.25=0.55>0.5,
所以样本数据的中位数是
1 500+=1 900(元).
(3)样本平均数为(750×0.000 2+1 250×0.000 4+1 750×0.000 5+2 250×0.000 5+2 750×0.000 3+3 250×0.000 1)×500=1 900(元).
(变结论)本例条件不变.
(1)若再从这10 000人中用分层抽样的方法抽出若干人,分析居民收入与幸福指数的关系,已知月收入在[2 000,2 500)内的抽取了40人.则月收入在[3 000,3 500]内的该抽多少人?
(2)根据频率分布直方图估计样本数据的众数.
[解] (1)因为(0.000 2+0.000 4+0.000 3+0.000 1)×500=0.5.
所以a==0.000 5.
故月收入在[2 000,2 500)内的频率为0.000 5×500=0.25.
∴新抽样本容量为=160(人).
∴月收入在[3 000,3 500]内的该抽:160×(0.000 1×500)=8(人).
(2)由题图知众数为2 000元.
1.利用频率分布直方图求数字特征
(1)众数是最高的矩形的底边的中点;
(2)中位数左右两侧直方图的面积相等;
(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
2.利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.
1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
B [标准差和方差都能反映一组数据的稳定程度.]
2.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )
A.588 B.480
C.450 D.120
B [∵少于60分的学生人数为600×(0.05+0.15)=120,∴不少于60分的学生人数为600-120=480.]
3.甲、乙两名篮球运动员在某几场比赛中得分的茎叶图如图所示,则甲、乙两人这几场比赛得分的中位数之和是( )
A.63 B.64
C.65 D.66
A [甲、乙两人在这几场比赛中得分的中位数分别是36和27,则中位数之和是36+27=63.]
4.李大伯承包了一个果园,种植了100棵樱桃树,今年已进入收获期,收获时,从中任选并采摘了10棵树的樱桃,分别称得每棵树所产樱桃的质量如下表:
序号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
质量/千克 | 14 | 21 | 27 | 17 | 18 | 20 | 19 | 23 | 19 | 22 |
据调查,市场上今年樱桃的批发价值为每千克15元,用所学的统计知识估计今年此果园樱桃的总产量与按批发价格销售樱桃所得的总收入分别约为( )
A.200千克,3 000元
B.1 900千克,28 500元
C.2 000千克,30 000元
D.1 850千克,27 750元
C [样本平均数为(14+21+27+17+18+20+19+23+19+22)÷10=20(千克).由此可估计每棵樱桃树所产樱桃质量平均约为20千克,所以这100棵樱桃树所产樱桃的质量约为20×100=2 000(千克).根据樱桃批发价格为每千克15元,可得总收入约为15×2 000=30 000(元).]
5.在某市2020年“创建文明城市”知识竞赛中,考评组从中抽取200份试卷进行分析,其分数的频率分布直方图如图所示,则分数在区间[60,70)上的人数大约有________.
80 [根据频率分布直方图,分数在区间[60,70)上的频率为0.04×10=0.4,∴分数在区间[60,70)上的人数为200×0.4=80.]
回顾本节内容,自我完成以下问题:
1.怎样用样本的数字特征估计总体的数字特征?
[提示] 样本的平均数和方差是两个重要的数字特征.在应用平均数和方差解决实际问题时,若平均数不同,则直接应用平均数比较优劣,若平均数相同,则要由方差研究其与平均数的偏离程度.
2.频率分布直方图有哪些性质?
[提示] (1)图中每个小矩形的面积表示相应各组的频率,即小矩形的面积=组距×=频率.
(2)在频率分布直方图中,各小矩形的面积的总和等于1.
(3)=频率,此关系式的变形为=样本容量,样本容量×频率=频数.
(4)频率分布直方图中,各小矩形的面积之比等于频率之比,各小矩形的高度之比也等于频率之比.
高中数学人教B版 (2019)必修 第二册5.1.4 用样本估计总体导学案: 这是一份高中数学人教B版 (2019)必修 第二册5.1.4 用样本估计总体导学案,共17页。学案主要包含了分层抽样的平均数,用样本的分布估计总体的分布等内容,欢迎下载使用。
高中数学人教B版 (2019)必修 第二册5.1.1 数据的收集第2课时学案设计: 这是一份高中数学人教B版 (2019)必修 第二册5.1.1 数据的收集第2课时学案设计,共8页。
高中数学人教B版 (2019)必修 第二册第五章 统计与概率5.1 统计5.1.2 数据的数字特征学案: 这是一份高中数学人教B版 (2019)必修 第二册第五章 统计与概率5.1 统计5.1.2 数据的数字特征学案,共9页。