人教A版 (2019)必修 第二册第九章 统计9.1 随机抽样学案
展开某校高一新生共900人,其中男生500人,女生400人.学校现想了解高一新生对文史类课程的看法,以便开设相关选修课程,准备从高一新生中抽取45人进行访谈.
[问题] (1)如果直接采用简单随机抽样,会有什么缺点?
(2)采用怎样的抽样方法较好?
知识点一 分层随机抽样
1.定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为eq \a\vs4\al(层).
2.比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
3.平均数的计算公式
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n.我们用X1,X2,…,XM表示第1层各个个体的变量值,用x1,x2,…,xm表示第1层样本的各个个体的变量值;用Y1,Y2,…,YN表示第2层各个个体的变量值,用y1,y2,…,yn表示第2层样本的各个个体的变量值,则第1层的总体平均数和样本平均数分别为
eq \x\t(X)=eq \f(X1+X2+…+XM,M)=eq \f(1,M)eq \i\su(i=1,M,X)i,eq \x\t(x)=eq \f(x1+x2+…+xm,m)=eq \f(1,m)eq \i\su(i=1,m,x)i.
第2层的总体平均数和样本平均数分别为
eq \x\t(Y)=eq \f(Y1+Y2+…+YN,N)=eq \f(1,N)eq \i\su(i=1,N,Y)i,eq \x\t(y)=eq \f(y1+y2+…+yn,n)=eq \f(1,n)eq \i\su(i=1,n,y)i.
总体平均数和样本平均数分别为
eq \x\t(W)=eq \f(\i\su(i=1,M,X)i+\i\su(i=1,N,Y)i,M+N),eq \x\t(w)=eq \f(\i\su(i=1,m,x)i+\i\su(i=1,n,y)i,m+n).
由于用第1层的样本平均数eq \x\t(x)可以估计第1层的总体平均数eq \x\t(X),用第2层的样本平均数eq \x\t(y)可以估计第2层的总体平均数eq \x\t(Y),因此我们可以用
eq \f(M×\x\t(x)+N×\x\t(y),M+N)=eq \f(M,M+N)eq \x\t(x)+eq \f(N,M+N)eq \x\t(y)估计总体平均数eq \x\t(W).
在比例分配的分层随机抽样中,eq \f(m,M)=eq \f(n,N)=eq \f(m+n,M+N),可得eq \f(M,M+N)eq \x\t(x)+eq \f(N,M+N)eq \x\t(y)=eq \f(m,m+n)eq \x\t(x)+eq \f(n,m+n)eq \x\t(y)=eq \x\t(w).
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数eq \x\t(w)估计总体平均数eq \x\t(W).
eq \a\vs4\al()
1.分层随机抽样的实施步骤
第一步,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体;
第二步,在每个子总体中独立地进行简单随机抽样;
第三步,把所有子总体中抽取的样本合在一起作为总样本.
2.在比例分配的分层随机抽样中需注意两点
(1)抽样比=eq \f(样本量,总样本量);
(2)可以直接用样本平均数估计总体平均数.
1.判断正误.(正确的画“√”,错误的画“×”)
(1)在统计实践中选择哪种抽样方法关键是看总体的个体数的大小.( )
(2)分层随机抽样中,个体数量较少的层抽取的样本量较少,这是不公平的.( )
(3)从全班50名同学中抽取5人调查作业完成情况适合用分层随机抽样.( )
答案:(1)× (2)× (3)×
2.某单位有职工160人,其中业务员104人,管理人员32人,后勤服务人员24人,现用比例分配的分层随机抽样法从中抽取一容量为20的样本,则抽取管理人员有( )
A.3人 B.4人
C.7人 D.12人
解析:选B 由eq \f(20,160)=eq \f(1,8),设抽取管理人员x人,则eq \f(x,32)=eq \f(1,8),得x=4.故选B.
知识点二 获取数据的基本途径
利用统计报表和年鉴属于哪种获取数据的途径?
提示:属于通过查询获取数据的途径.
1.为了研究近年我国高等教育发展状况,小明需要获取近年来我国大学生入学人数的相关数据,他获取这些数据的途径最好是( )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
答案:D
2.(多选)影响获取数据可靠程度的因素包括( )
A.获取方法设计 B.所用专业测量设备的精度
C.调查人员的认真程度 D.数据的大小
解析:选ABC 数据的大小不影响获取数据的可靠程度,其他三项均影响获取数据的可靠程度.
3.研究下列问题:
①某城市元旦前后的气温;②某种新型电路元件使用寿命的测定;③电视台想知道某一个节目的收视率;④银行在收进储户现金时想知道有没有假钞.
一般通过试验获取数据的是________.
解析:①通过观察获取数制,③④通过调查获取数据,只有②通过试验获取数据.
答案:②
[例1] (链接教科书第184页练习4题)下列问题中,最适合用分层随机抽样抽取样本的是( )
A.从10名同学中抽取3人参加座谈会
B.红星中学共有学生1 600名,其中男生840名,防疫站对此校学生进行身体健康调查,抽取一个容量为200的样本
C.从1 000名工人中,抽取100人调查上班途中所用时间
D.从生产流水线上,抽取样本检查产品质量
[解析] A中总体所含个体无差异且个数较少,适合用简单随机抽样;C和D中总体所含个体无差异且个数较多,不适合分层随机抽样;B中总体所含个体差异明显,适合用分层随机抽样.
[答案] B
eq \a\vs4\al()
分层随机抽样的前提和遵循的两条原则
(1)前提:分层随机抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取;
(2)遵循的两条原则:①每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
②每层样本量与每层个体数量的比等于抽样比.
[跟踪训练]
某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适( )
A.抽签法 B.简单随机抽样法
C.分层随机抽样法 D.随机数法
解析:选C 总体由差异明显的三部分构成,应选用分层随机抽样.故选C.
[例2] (链接教科书第184页练习3题)(1)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层随机抽样调查,假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为( )
A.101 B.808
C.1 212 D.2 012
(2)将一个总体分为A,B,C三层,其个体数之比为5∶3∶2.若用分层随机抽样方法抽取容量为100的样本,则应从C中抽取________个个体;
(3)分层随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层的样本量为30,样本平均数为8,则该样本的平均数为________.
[解析] (1)因为甲社区有驾驶员96人,并且在甲社区抽取的驾驶员的人数为12人,
所以甲社区抽取驾驶员的比例为eq \f(12,96)=eq \f(1,8),
所以驾驶员的总人数为(12+21+25+43)÷eq \f(1,8)=808(人).
(2)因为A,B,C三层个体数之比为5∶3∶2,又有总体中每个个体被抽到的概率相等,所以分层随机抽样应从C中抽取100×eq \f(2,10)=20(个)个体.
(3)eq \x\t(w)=eq \f(20,20+30)×3+eq \f(30,20+30)×8=6.
[答案] (1)B (2)20 (3)6
eq \a\vs4\al()
进行分层随机抽样的相关计算时,常用到的关系
(1)eq \f(样本量n,总体的个数N)=eq \f(该层抽取的个体数,该层的个体数);
(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比;
(3)如果总体分为2层,两层包含的个体数分别为M,N,两层抽取的样本量分别为m,n,两层的样本平均数分别为eq \x\t(x),eq \x\t(y),两层的总体平均数分别为eq \x\t(X),eq \x\t(Y),总体平均数为eq \x\t(W),样本平均数为eq \x\t(w),
则eq \x\t(w)=eq \f(m,m+n)eq \x\t(x)+eq \f(n,m+n)eq \x\t(y),
eq \x\t(W)=eq \f(M,M+N)eq \x\t(X)+eq \f(N,M+N)eq \x\t(Y).
[跟踪训练]
有4万个大于70的两位数,从中随机抽取了3 000个数,统计如下表:
请根据表格中的信息,估计这4万个数的平均数约为________.
解析:这3 000个数的平均数为eq \f(1,3 000)×(78.1×800+85×1 300+91.9×900)=85.23.
于是用样本的平均数去估计总体的平均数,则这4万个数的平均数约为85.23.
答案:85.23
[例3] 在100个产品中,有一等品20个,二等品30个,三等品50个,现要抽取一个容量为30的样本,请说明抽样过程.
[解] 先将产品按等级分成三层:第一层,一等品20个;第二层,二等品30个;第三层,三等品50个.然后确定每一层抽取的个体数,因为抽样比为eq \f(30,100)=eq \f(3,10),所以应在第一层中抽取产品20×eq \f(3,10)=6(个),在第二层中抽取产品30×eq \f(3,10)=9(个),在第三层中抽取产品50×eq \f(3,10)=15(个).分别给这些产品编号并贴上标签,用抽签法或随机数法在各层中抽取,得到一等品6个,二等品9个,三等品15个,这样就通过分层随机抽样得到了一个容量为30的样本.
eq \a\vs4\al()
设计分层随机抽样方案的思路
在分层随机抽样中,确定抽样比k是抽样的关键.一般地,按抽样比k=eq \f(n,N)(N为总体容量,n为样本量)在各层中抽取个体,就能确保抽样的公平性.注意在每层抽样时,应灵活采用简单随机抽样的方法.
[跟踪训练]
一个地区共有5个乡镇,人口3万人,其人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.
解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层随机抽样的方法.
具体过程如下:
第一步,将3万人分为5层,一个乡镇为一层;
第二步,按照抽样比求得各乡镇应抽取的人数分别为60,40,100,40,60;
第三步,采用简单随机抽样的方法,按照各层抽取的人数抽取各乡镇的样本;
第四步,将300人合到一起,即得到一个样本.
[例4] 为了缓解城市的交通拥堵情况,某市准备出台限制私家车的政策,为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果能很好地反映该市市民的意愿吗?
[解] (1)一个城市的交通状况的好坏将直接影响着生活在这个城市中的每个人,关系到每个人的利益.为了调查这个问题,在抽样时应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.
(2)调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该城市的所有市民进行随机抽样调查,不要只关注到拥有私家车的市民.
eq \a\vs4\al()
在统计活动中,尤其是大型的统计活动,为避免一些外界因素的干扰,通常需要确定调查的对象、调查的方法与策略,需要精心设计前期的准备工作和收集数据的方法,然后对数据进行分析,得出统计推断.
[跟踪训练]
为了创建“和谐平安”校园,某校决定在开学前将学校的电灯电路使用情况进行检查,以排除安全隐患,获取电灯电路的相关数据应该用什么方法?为什么?
解:由于一个学校的电灯电路数目不算大,属于有限总体问题,所以应该通过调查获取数据,并且对创建“和谐平安”校园来说,必须排除任一潜在或已存在的安全隐患,故必须用普查的方法.
1.某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从中抽取一个样本量为36的样本,则适合的抽样方法是( )
A.抽签法随机抽样
B.随机数法随机抽样
C.直接运用分层随机抽样
D.先从老年人中剔除1人,再用分层随机抽样
解析:选C 因为总体由差异明显的三部分组成,所以考虑用分层随机抽样.故选C.
2.某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层随机抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( )
A.100 B.150
C.200 D.250
解析:选A 抽样比为eq \f(70,3 500)=eq \f(1,50),该校总人数为1 500+3 500=5 000,则eq \f(n,5 000)=eq \f(1,50),故n=100.
3.某分层随机抽样中,有关数据如下:
此样本的平均数为________.
解析:eq \x\t(w)=eq \f(45,45+35)×4+eq \f(35,45+35)×8=5.75.
答案:5.75
4.为预防某种流感病毒爆发,某生物技术公司研制出一种新流感疫苗,为测试该疫苗的有效性,公司将2 000个流感样本分成三组,测试结果如表:
已知在全体样本中随机抽取1个,抽到B组疫苗有效的可能性是0.33.
(1)求x的值;
(2)现用分层随机抽样的方法在全体样本中抽取360个测试结果,问应在C组抽取多少个?
解:(1)∵在全体样本中随机抽取1个,抽到B组疫苗有效的可能性是0.33,
∴eq \f(x,2 000)=0.33,解得x=660.
(2)C组样本个数是y+z=2 000-(673+77+660+90)=500,
用分层随机抽样的方法在全体样本中抽取360个测试结果,应在C组抽取的个数为360×eq \f(500,2 000)=90.
新课程标准解读
核心素养
1.通过实例,了解分层随机抽样的特点和适用范围,了解分层随机抽样的必要性,掌握各层样本量比例分配的方法
数学建模
2.结合具体实例,掌握分层随机抽样的样本均值
数据分析
3.知道获取数据的基本途径,包括:统计报表和年鉴、社会调查、试验设计、普查和抽样、互联网等
数学抽象
获取数据的基本途径
适用类型
注意问题
通过调查获取数据
对于有限总体问题,一般通过抽样调查或普查的方法获取数据
要充分有效地利用背景信息选择或创建更好的抽样方法,并有效地避免抽样过程中的人为错误
通过试验获取数据
没有现存的数据可以查询
严格控制试验环境,通过精心的设计安排试验,以提高数据质量
通过观察获取数据
自然现象
借助专业测量设备通过长久的持续观察获取数据
通过查询获得数据
众多专家研究过,其收集的数据有所存储
必须根据问题背景知识“清洗”数据,去伪存真
分层随机抽样的概念
分层随机抽样中的计算问题
数据x
70<x<79
80<x<89
90<x<99
个数
800
1 300
900
平均数
78.1
85
91.9
分层随机抽样的方案设计
获取数据途径的方法的设计
样本量
平均数
第1层
45
4
第2层
35
8
A组
B组
C组
疫苗有效
673
x
y
疫苗无效
77
90
z
人教A版 (2019)必修 第二册9.1 随机抽样学案: 这是一份人教A版 (2019)必修 第二册9.1 随机抽样学案,共9页。
高中数学湘教版(2019)必修 第一册6.1 获取数据的途径及统计概念导学案: 这是一份高中数学湘教版(2019)必修 第一册6.1 获取数据的途径及统计概念导学案,共8页。
高中数学人教A版 (2019)必修 第二册第九章 统计9.1 随机抽样学案: 这是一份高中数学人教A版 (2019)必修 第二册第九章 统计9.1 随机抽样学案,共6页。学案主要包含了学习目标,自主学习,小试牛刀,经典例题,跟踪训练,当堂达标,课堂小结,参考答案等内容,欢迎下载使用。