- 高一数学下学期考点精讲+精练(人教A版2019必修第二册)第01讲数系的扩充和复数的概念(原卷版+解析) 试卷 0 次下载
- 高一数学下学期考点精讲+精练(人教A版2019必修第二册)第01讲有限样本空间与随机事件(原卷版+解析) 试卷 0 次下载
- 高一数学下学期考点精讲+精练(人教A版2019必修第二册)第02练事件的关系和运算(原卷版+解析) 试卷 0 次下载
- 高一数学下学期考点精讲+精练(人教A版2019必修第二册)第02练基本立体图形的直观图(原卷版+解析) 试卷 0 次下载
- 高一数学下学期考点精讲+精练(人教A版2019必修第二册)第02练复数的几何意义(原卷版+解析) 试卷 0 次下载
高一数学下学期考点精讲+精练(人教A版2019必修第二册)第01讲随机抽样(原卷版+解析)
展开知识点1 统计的相关概念
普查:像人口普查这样,对每一个调查对象都进行调查的方法,称为全面调查,又叫普查.
抽样调查:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计
和推断的调查方法,称为抽样调查.
样本与样本量的区别:
样本与样本量是两个不同的概念.样本是从总体中抽取的个体组成的集合,是对象;样本量是样本中个体的数目,是一个数.
收集数据时,必须清楚的知道以下两点:要收集的数集是什么;要如何才能收集到高质量的样本数据.
统计的基本思想方法就是用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的情况.
知识点2 简单随机抽样
1、一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
2、简单随机抽样的四个特点
(1)它要求被抽取样本的总体的个数有限,这样便于通过随机抽取的样本对总体进行分析.
(2)它是从总体中逐个抽取,这样便于在抽样实践中进行操作.
(3)它是一种不放回抽样,由于抽样实践中多采用不放回抽样,使其具有较广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算.
(4)它是一种等机会抽样,不仅每次从总体中抽取一个个体时,各个个体被抽到的机会相等,而且在整个抽样的过程中,各个个体被抽取的机会也相等,从而保证了这种抽样方法的公平性.
对简单随机抽样“等可能性”的理解
简单随机抽样是一种等可能抽样.假设总体中共有N个个体,从中逐个不放回地抽取n(n<N)个个体作为样本,则某个个体 a 在整个抽样过程中可能第一次被抽到,也可能第二次被抽到,…,还可能第n次被抽到.
其中第一次被抽到的可能性为,第二次被抽到的可能性为 ,…,第n次被抽到的可能性为.由于以上情况不可能同时发生,所以在整个抽样过程中个体 a 被抽到的可能性为 ++…+=
知识点3 抽签法和随机数法
1.抽签法:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.
2.随机数法:随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.
3.利用随机数法抽取个体时的注意事项
(1)定起点:事先应确定以表中的哪个数(哪行哪列)作为起点.
(2)定方向:读数的方向(向左、向右、向上或向下都可以).
(3)读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,如果出现重复则跳过,直到取满所需的样本个体数.
4.抽签法与随机数法的异同点
知识点4 总体平均数和加权平均数
1.一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,
则称为总体均值,又称总体平均数.
2.一般地,对于f1个x1,f2个x2,…,fn个xn,共f1+f2+…+fn个数组成的一组数据的平均数为eq \f(x1f1+x2f2+…+xnfn,f1+f2+…+fn).这个平均数叫做加权平均数,其中f1, f2,…, fn叫做权,这个“权”,含有权衡所占份量的轻重之意,即fi(i=1,2,…,k)越大,表明xi的个数越多,“权”就越大.
3.样本平均数和总体平均数的区别与联系
平均数的意义:平均数反映一组数据的平均水平.我们把样本中所有个体的平均数称为样本平均数;把总体中所有个体的平均数称为总体平均数.随机样本的容量越大,样本平均数就越接近总体平均数.必要时,可以用样本平均数来估计总体平均数.
区别:总体平均数即为研究对象的全部的平均数(总体均值),是一个常量,而样本平均数是指从总体中抽出的一部分个体的平均数,不同样本的平均数往往是不同的,由于样本的选取是随机的,因此样本平均数(样本均值)也具有随机性.
联系:(1)大部分样本平均数离总体平均数不远,在总体平均数附近波动,可以用样本平均数来估计总体平均数.
(2)随机样本的容量越大,样本平均数就越接近总体平均数.
知识点5 分层随机抽样的概念
(1)定义
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)适用范围
当总体是由差异明显的几个部分组成时,往往采用分层随机抽样.
(3)比例分配
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
(4)分层随机抽样的实施步骤
第一步,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体;
第二步,在每个子总体中独立地进行简单随机抽样;
第三步,把所有子总体中抽取的样本合在一起作为总样本.
(5)分层随机抽样适用于总体中个体之间差异较大的情形
(6)在比例分配的分层抽样中需注意两点
抽样比=eq \f(样本量,总样本量);可以直接用样本平均数估计总体平均数.
考点一 简单随机抽样的概念
解题方略:
简单随机抽样的判断方法
判断所给的抽样是否为简单随机抽样的依据是简单随机抽样的四个特征:
上述四点特征,如果有一点不满足,就不是简单随机抽样.
【例1】下列调查:①每隔5年进行人口普查;②报社等进行舆论调查;③灯泡使用寿命的调查;④对入学报名者的学历检查;⑤从20台电视机中抽出3台进行质量检查,其中属于抽样调查的是( )
A.①②③ B.②③⑤
C.②③④ D.①③⑤
【例2】在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( )
A.总体 B.个体 C.样本量 D.从总体中抽取的一个样本
变式1:从一批零件中抽取10个零件,测得它们的长度(单位:cm)如下:
22.36 22.35 22.33 22.35 22.37 22.34 22.38
22.36 22.32 22.35
由此估计这批零件的平均长度.
在此统计活动中:
(1)总体为:________________________;
(2)个体为:________________________;
(3)样本为:________________________;
(4)样本量为:________________.
【例3】下列抽取样本的方法是简单随机抽样吗?为什么?
(1)从无限多个个体中抽取50个个体作为样本;
(2)箱子里共有100个零件,今从中选取10个零件进行检验,在抽样操作时,从中任意地拿出一个零件进行质量检验后再把它放回箱子里;
(3)从50个个体中一次性抽取5个个体作为样本;
(4)一彩民选号,从装有36个大小、形状都相同的号签的箱子中无放回的抽取6个号签.
变式1:下面的抽样方法是简单随机抽样吗?为什么?
(1)从无数张高考试卷中抽取50张试卷作为样本;
(2)质量监督部门从180种儿童玩具中选出18种玩具进行质量检验,在抽样操作过程中,从中任取一种玩具检验后再放回;
(3)国家跳水队挑出最优秀的10名跳水队员,备战奥运会;
(4)用抽签法从10件产品中选取3件进行质量检验.
【例4】在简单随机抽样中,某一个个体被抽到的可能性( )
A.与第几次抽样有关,第一次抽到的可能性最大
B.与第几次抽样有关,第一次抽到的可能性最小
C.与第几次抽样无关,每一次抽到的可能性相等
D.与第几次抽样无关,与样本量也无关
变式1:用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性,“第二次被抽到”的可能性分别是( )
A.eq \f(1,10),eq \f(1,10) B.eq \f(3,10),eq \f(1,5)
C.eq \f(1,5),eq \f(3,10) D.eq \f(3,10),eq \f(3,10)
变式2:用简单随机抽样的方法从含有6个个体的总体中,抽取一个样本量为2的样本,某一个个体a“第一次被抽到的概率”、“第二次被抽到的概率”、“在整个抽样过程中被抽到的概率”分别是________、________、________.
变式3:一个布袋中有10个同样质地的小球,从中不放回地依次抽取3个小球,则某一特定小球被抽到的可能性是________,第三次抽取时,剩余每个小球被抽到的可能性是________.
考点二 抽签法和随机数法
解题方略:
1.一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.抽签法一般适用于总体中个体数不多的情形.
2.随机数法生成随机数的方法:
(1)用随机试验生成随机数;
(2)用信息技术生成随机数:
①用计算器生成随机数;
②用电子表格软件生成随机数;
③用R统计软件生成随机数.
(一)抽签法
【例5】用抽签法进行抽样有以下几个步骤:①制签;②抽签;③将签摇匀;④编号;⑤将抽取的号码对应的个体取出,组成样本.这些步骤的正确顺序为________(填序号).
变式1:抽签法中确保样本代表性的关键是( )
A.制签 B.搅拌均匀
C.逐一抽取 D.抽取不放回
变式2:下列抽样试验中,适合用抽签法的有( )
A.从某厂生产的3 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3 000件产品中抽取10件进行质量检验
变式3:上海某中学从40名学生中选1人作为上海男篮啦啦队的成员,采用下面两种选法,则抽签法的序号是________.
①将这40名学生从1~40进行编号,相应地制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选;
②将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为啦啦队成员.
变式4:某家具厂要为育才小学一年级新生制作新课桌椅,他们要事先了解全体一年级学生的平均身高,以便设定可调节课桌椅的标准高度. 已知育才小学一年级有165名学生,如果通过简单随机抽样的方法调查一年级学生的平均身高,需抽取16人,需怎样抽取?
变式5:某校高一年级有43名足球运动员,要从中抽出5人调查学习负担情况,用抽签法设计一个抽样方案.
随机数法
【例6】已知总样本量为108,若用随机数法抽取一个容量为10的简单随机样本,下列对总体的编号正确的是( )
A.1,2,…,108 B.01,02,…,108
C.00,01,…,107 D.001,002,…,108
变式1:总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法:从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第5个个体的编号为( )
A.08 B.07
C.02 D.01
变式2:某中学高一年级有400人,高二年级有320人,高三年级有280人,若每人被抽到的可能性都为0.2,用随机数法在该中学抽取容量为n的样本,则n等于( )
A.80 B.160
C.200 D.280
考点三 用样本平均数估计总体平均数
解题方略:
用样本平均数估计总体平均数的步骤
(1)求样本平均数eq \x\t(y);
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,y3,…,yn,
则称eq \x\t(y)=eq \f(y1+y2+…+yn,n)=eq \f(1,n)
(2)用样本平均数eq \x\t(y)去估计总体平均数eq \(Y,\s\up6(-)),即eq \(Y,\s\up6(-))≈eq \x\t(y).
【例7】一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均数为________.
变式1:某校为调查全校学生的睡眠时间,从全体学生中用随机数法抽取了一个容量为100的简单随机样本,他们的睡眠时间如下表(单位:h):
试计算这100名学生的平均睡眠时间并由此估计该校学生的日平均睡眠时间.
变式2:某校为了了解学生课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用如图所示的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间,由此估计该校学生的日平均阅读时间约为( )
A.0.6小时 B.0.9小时
C.1.0小时 D.1.5小时
变式3:某高校有甲、乙两个数学建模兴趣班.其中甲班有40人,乙班有50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是________分.
变式4:某鱼塘去年向鱼塘投入了一批5 000条鱼苗,为了了解这批鱼苗的生长情况,从鱼塘中捕捞了20条,称得它们的质量如下(单位:kg):
1.1 1.0 1.1 1.0 1.1 1.3 1.2 1.1 1.1 1.2
1.1 1.1 1.0 1.2 1.2 1.2 1.1 1.2 1.1 1.1
已知这批鱼苗的成活率是80%,现在的市场价是每千克5.5元,请你帮忙计算一下,现在全部出售的毛收入会是多少?(对数据分析、整理,利用频数进行计算样本平均数,注意计算技巧)
变式5:对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:
分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数并判断选谁参加比赛比较合适?
考点四 分层随机抽样的概念
解题方略:
分层随机抽样的特点
(1)适用于总体由差异明显的几部分组成的情况;
(2)更充分地反映了总体的情况;
(3)等概率抽样,每个个体被抽到的概率都相等.
【例8】分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层抽样为保证每个个体等概率抽样,必须进行( )
A.每层等概率抽样
B.每层可以不等概率抽样
C.所有层按同一抽样比等概率抽样
D.所有层抽个体数量相同
变式1:下列问题中,最适合用分层随机抽样抽取样本的是( )
A.从10名同学中抽取3人参加座谈会
B.红星中学共有学生1 600名,其中男生840名,防疫站对此校学生进行身体健康调查,抽取一个容量为200的样本
C.从1 000名工人中,抽取100人调查上班途中所用时间
D.从生产流水线上,抽取样本检查产品质量
变式2:某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适( )
A.抽签法 B.简单随机抽样法
C.分层随机抽样法 D.随机数法
变式3:对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样和分层随机抽样两种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,则( )
A.p1
考点五 比例分配的分层抽样的运用
解题方略:
确定比例分配的分层随机抽样中各层个体数的方法
(1)先计算出抽样比=eq \f(样本量,总样本量),获得各层抽样数的百分比;
(2)按抽样比确定每层需要抽取的个体数:
抽样比×该层个体数目=eq \f(样本量,总样本量)×该层个体数目.
【例9】在120个零件中,一级品24个,二级品36个,三级品60个,用分层随机抽样的方法从中抽取容量为20的样本,则每个个体被抽取的可能性是________.
变式1:在1 000个球中有红球50个,从中抽取100个进行分析,如果用比例分配的分层随机抽样的方法对球进行抽样,则应抽红球( )
A.33个 B.20个
C.5个 D.10个
变式2:某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层随机抽样抽取容量为30的样本,则抽取的各职称的人数分别为( )
A.5,10,15 B.3,9,18
C.3,10,17 D.5,9,16
变式3:某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20 000人,其中各种态度对应的人数如下表所示:
电视台为了了解观众的具体想法和意见,打算从中抽取100人进行详细的调查,为此要进行分层随机抽样,那么在分层随机抽样时,每类人中应抽取的人数分别为( )
A.25,25,25,25 B.48,72,64,16
C.20,40,30,10 D.24,36,32,8
变式4:某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层随机抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.
变式5:某工厂生产的A,B,C三种不同型号的产品数量之比为2∶3∶5,为研究这三种产品的质量,现用分层抽样的方法从该工厂生产的A,B,C三种产品中抽出样本量为n的样本,若样本中A型产品有10件,则n的值为( )
A.15 B.25
C.50 D.60
变式6:某校老年、中年和青年教师的人数如表所示,采用分层随机抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本的老年教师人数为( )
A.90 B.100
C.180 D.300
变式7:某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人.教育部门为了了解在职人员对学校机构改革的意见,要从中抽取一个容量为20的样本,请利用分层随机抽样的方法抽取,写出抽样过程.
变式8:一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?
变式9:在分层随机抽样中,每层中的样本抽取应采用简单随机抽样,如:在第一层中应从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为eq \f(1,3),则在整个抽样过程中,每个个体被抽到的概率为( )
A.eq \f(1,4) B.eq \f(1,3)
C.eq \f(5,14) D.eq \f(10,27)
练习一 简单随机抽样的概念
1、为了抽查汽车排放尾气的合格率,某环保局在某一路口随机抽查,这种抽查是( )
A.简单随机抽样 B.系统抽样
C.分层抽样 D.有放回抽样
2、已知下列抽取样本的方式:
①从无限多个个体中抽取100个个体作为样本;
②盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出1个零件进行质量检验后再把它放回盒子里;
③从20件玩具中一次性抽取3件进行质量检验;
④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
其中,不是简单随机抽样的是________(填序号).
3、一个总体中含有100个个体,以简单随机抽样方法从该总体中抽取一个容量为5的简单随机样本,则指定的某个个体被抽到的可能性为________.
从总体容量为N的一批零件中,抽取一个容量为30的样本,若每个零件被抽到的可能性为0.25,则N的值为( )
A.120 B.200
C.150 D.100
练习二 抽签法和随机数法
1、采用抽签法从含有3个个体的总体{1,3,8}中抽取一个样本量为2的样本,则所有可能的样本是________.
2、某卫生单位为了支援抗震救灾,要在18名志愿者中选取6人组成医疗小组去参加救治工作,请用抽签法设计抽样方案.
3、现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个样本量为6的样本进行质量检验.如何用随机数法设计抽样方案?
4、假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,应如何操作?
练习三 用样本平均数估计总体平均数
1、已知样本数据x1,x2,…,xn的均值eq \x\t(x)=5,则样本数据2x1+1,2x2+1,…,2xn+1的均值为________.
2、已知样本x1,x2,…,xn的平均数为x;样本y1,y2,…,ym的平均数为y(x≠y),若样本x1,x2,…,xn,y1,y2,…,ym的平均数z=ax+(1-a)y,其中0A.n=m B.n≥m
C.n
3、从A,B两个班中各抽取10名学生参加技能测试,成绩如下表(单位:分):
试估计哪个班的技能成绩较好.
4、为宣传节约用水,小明随机调查了某小区部分家庭5月份的用水情况,并将收集的数据整理成如下统计图.
(1)小明一共调查了多少户家庭?
(2)求所调查家庭5月份用水量的平均数;
(3)若该小区有400户居民,请你估计这个小区5月份的用水量.
练习四 分层随机抽样的概念
1、某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从中抽取一个容量为36的样本,则适合的抽样方法是( )
A.抽签法随机抽样
B.随机数法随机抽样
C.直接运用分层随机抽样
D.先从老年人中剔除1人,再用分层随机抽样
2、某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )
A.抽签法 B.随机数法
C.分层随机抽样法 D.任何抽样法都可以
练习五 比例分配的分层抽样的运用
1、交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为________.
2、已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取2%的学生进行调查,则样本量和抽取的高中生近视人数分别为( )
A.200,20 B.100,20
C.200,10 D.100,10
3、为了了解高一、高二、高三年级学生的身体状况,现用分层随机抽样的方法抽取一个容量为1 200的样本,三个年级学生人数之比依次为k∶5∶3,已知高一年级共抽取了240人,则高三年级抽取的人数为________人.
4、某市化工厂三个车间共有工人1 000名,各车间男、女工人数如下表:
已知在全厂工人中随机抽取1名,抽到第二车间男工的可能性是0.15.
(1)求x的值;
(2)现用分层随机抽样的方法在全厂抽取50名工人,问应在第三车间抽取多少名?
5、某班有40名男生,20名女生,已知男女身高有明显不同,现欲调查平均身高,准备抽取eq \f(1,30),采用比例分配分层随机抽样方法,抽取男生1名,女生1名,你认为这种做法是否妥当?如果让你来调查,你准备怎样做?
6、某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%,登山组的职工占参加活动总人数的eq \f(1,4),且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层的职工对本次活动的满意程度,现用比例分配分层随机抽样的方法从参加活动的全体职工中抽取容量为200的样本.试求:
(1)游泳组中,青年人、中年人、老年人分别所占的比例;
(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.
名称
定义
总体
调查对象的全体称为整体
个体
组成整体的每一个调查对象称为个体
样本
从总体中抽取的那部分个体称为样本
样本容量
样本中包含的个体数称为样本容量
相同点
①都属于简单随机抽样,并且要求被抽取样本的总体的个体数有限;
②都是从总体中逐个不放回地进行抽取
不同点
①抽签法比随机数法操作简单;
②随机数法更适用于总体中个体数较多的时候,而抽签法适用于总体中个体数较少的情况,所以当总体中的个体数较多时,应当选用随机数法,可以节约大量的人力和制作号签的成本
7816
6572
0802
6314
0702
4369
9728
0198
3204
9234
4935
8200
3623
4869
6938
7481
睡眠
时间
[6,6.5)
[6.5,7)
[7,7.5)
[7.5,8)
[8,8.5)
[8.5,9)
合
计
人数
5
17
33
37
6
2
100
甲
27
38
30
37
35
31
乙
35
29
40
34
30
36
最喜爱
喜爱
一般
不喜欢
4 800
7 200
6 400
1 600
类别
人数
老年教师
900
中年教师
1 800
青年教师
1 600
合计
4 300
A班
67
72
93
69
86
84
45
77
88
91
B班
78
96
56
83
86
48
98
67
62
72
第一车间
第二车间
第三车间
女工
173
100
y
男工
177
x
z
第1讲 随机抽样
知识点1 统计的相关概念
普查:像人口普查这样,对每一个调查对象都进行调查的方法,称为全面调查,又叫普查.
抽样调查:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计
和推断的调查方法,称为抽样调查.
样本与样本量的区别:
样本与样本量是两个不同的概念.样本是从总体中抽取的个体组成的集合,是对象;样本量是样本中个体的数目,是一个数.
收集数据时,必须清楚的知道以下两点:要收集的数集是什么;要如何才能收集到高质量的样本数据.
统计的基本思想方法就是用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的情况.
知识点2 简单随机抽样
1、一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
2、简单随机抽样的四个特点
(1)它要求被抽取样本的总体的个数有限,这样便于通过随机抽取的样本对总体进行分析.
(2)它是从总体中逐个抽取,这样便于在抽样实践中进行操作.
(3)它是一种不放回抽样,由于抽样实践中多采用不放回抽样,使其具有较广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算.
(4)它是一种等机会抽样,不仅每次从总体中抽取一个个体时,各个个体被抽到的机会相等,而且在整个抽样的过程中,各个个体被抽取的机会也相等,从而保证了这种抽样方法的公平性.
对简单随机抽样“等可能性”的理解
简单随机抽样是一种等可能抽样.假设总体中共有N个个体,从中逐个不放回地抽取n(n<N)个个体作为样本,则某个个体 a 在整个抽样过程中可能第一次被抽到,也可能第二次被抽到,…,还可能第n次被抽到.
其中第一次被抽到的可能性为,第二次被抽到的可能性为 ,…,第n次被抽到的可能性为.由于以上情况不可能同时发生,所以在整个抽样过程中个体 a 被抽到的可能性为 ++…+=
知识点3 抽签法和随机数法
1.抽签法:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.
2.随机数法:随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.
3.利用随机数法抽取个体时的注意事项
(1)定起点:事先应确定以表中的哪个数(哪行哪列)作为起点.
(2)定方向:读数的方向(向左、向右、向上或向下都可以).
(3)读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,如果出现重复则跳过,直到取满所需的样本个体数.
4.抽签法与随机数法的异同点
知识点4 总体平均数和加权平均数
1.一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,
则称为总体均值,又称总体平均数.
2.一般地,对于f1个x1,f2个x2,…,fn个xn,共f1+f2+…+fn个数组成的一组数据的平均数为eq \f(x1f1+x2f2+…+xnfn,f1+f2+…+fn).这个平均数叫做加权平均数,其中f1, f2,…, fn叫做权,这个“权”,含有权衡所占份量的轻重之意,即fi(i=1,2,…,k)越大,表明xi的个数越多,“权”就越大.
3.样本平均数和总体平均数的区别与联系
平均数的意义:平均数反映一组数据的平均水平.我们把样本中所有个体的平均数称为样本平均数;把总体中所有个体的平均数称为总体平均数.随机样本的容量越大,样本平均数就越接近总体平均数.必要时,可以用样本平均数来估计总体平均数.
区别:总体平均数即为研究对象的全部的平均数(总体均值),是一个常量,而样本平均数是指从总体中抽出的一部分个体的平均数,不同样本的平均数往往是不同的,由于样本的选取是随机的,因此样本平均数(样本均值)也具有随机性.
联系:(1)大部分样本平均数离总体平均数不远,在总体平均数附近波动,可以用样本平均数来估计总体平均数.
(2)随机样本的容量越大,样本平均数就越接近总体平均数.
知识点5 分层随机抽样的概念
(1)定义
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)适用范围
当总体是由差异明显的几个部分组成时,往往采用分层随机抽样.
(3)比例分配
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
(4)分层随机抽样的实施步骤
第一步,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体;
第二步,在每个子总体中独立地进行简单随机抽样;
第三步,把所有子总体中抽取的样本合在一起作为总样本.
(5)分层随机抽样适用于总体中个体之间差异较大的情形
(6)在比例分配的分层抽样中需注意两点
抽样比=eq \f(样本量,总样本量);可以直接用样本平均数估计总体平均数.
考点一 简单随机抽样的概念
解题方略:
简单随机抽样的判断方法
判断所给的抽样是否为简单随机抽样的依据是简单随机抽样的四个特征:
上述四点特征,如果有一点不满足,就不是简单随机抽样.
【例1】下列调查:①每隔5年进行人口普查;②报社等进行舆论调查;③灯泡使用寿命的调查;④对入学报名者的学历检查;⑤从20台电视机中抽出3台进行质量检查,其中属于抽样调查的是( )
A.①②③ B.②③⑤
C.②③④ D.①③⑤
【解析】①④属于普查,不属于抽样调查.故选B.
【例2】在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( )
A.总体 B.个体 C.样本量 D.从总体中抽取的一个样本
【解析】5 000名居民的阅读时间的全体是总体,每名居民的阅读时间是个体,200是样本量.故选A.
变式1:从一批零件中抽取10个零件,测得它们的长度(单位:cm)如下:
22.36 22.35 22.33 22.35 22.37 22.34 22.38
22.36 22.32 22.35
由此估计这批零件的平均长度.
在此统计活动中:
(1)总体为:________________________;
(2)个体为:________________________;
(3)样本为:________________________;
(4)样本量为:________________.
【解析】(1)这批零件的长度 (2)每个零件的长度
(3)抽取的10个零件的长度 (4)10
【例3】下列抽取样本的方法是简单随机抽样吗?为什么?
(1)从无限多个个体中抽取50个个体作为样本;
(2)箱子里共有100个零件,今从中选取10个零件进行检验,在抽样操作时,从中任意地拿出一个零件进行质量检验后再把它放回箱子里;
(3)从50个个体中一次性抽取5个个体作为样本;
(4)一彩民选号,从装有36个大小、形状都相同的号签的箱子中无放回的抽取6个号签.
【解析】(1)不是简单随机抽样,因为被抽取的样本的总体的个数是无限的而不是有限的;
(2)不是简单随机抽样,因为它是有放回的抽样;
(3)不是简单随机抽样,因为它是一次性抽取,而不是“逐个”抽取;
(4)是简单随机抽样,因为总体中的个体是有限的,并且是从总体中逐个抽取、不放回的、等概率的抽样.
变式1:下面的抽样方法是简单随机抽样吗?为什么?
(1)从无数张高考试卷中抽取50张试卷作为样本;
(2)质量监督部门从180种儿童玩具中选出18种玩具进行质量检验,在抽样操作过程中,从中任取一种玩具检验后再放回;
(3)国家跳水队挑出最优秀的10名跳水队员,备战奥运会;
(4)用抽签法从10件产品中选取3件进行质量检验.
【解析】(1)不是简单随机抽样,因为样本总体数目不确定;
(2)不是简单随机抽样,因为简单随机抽样要求逐个不放回地抽取样本;
(3)不是简单随机抽样,因为这10名跳水队员是挑选出来的最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等概率抽样”的要求;
(4)是简单随机抽样,因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的,是不放回、等概率的抽样.
【例4】在简单随机抽样中,某一个个体被抽到的可能性( )
A.与第几次抽样有关,第一次抽到的可能性最大
B.与第几次抽样有关,第一次抽到的可能性最小
C.与第几次抽样无关,每一次抽到的可能性相等
D.与第几次抽样无关,与样本量也无关
【解析】由简单随机抽样的定义知C正确,故选C.
变式1:用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性,“第二次被抽到”的可能性分别是( )
A.eq \f(1,10),eq \f(1,10) B.eq \f(3,10),eq \f(1,5)
C.eq \f(1,5),eq \f(3,10) D.eq \f(3,10),eq \f(3,10)
【解析】简单随机抽样中每个个体被抽取的概率都相等,都为eq \f(1,10).故选A.
变式2:用简单随机抽样的方法从含有6个个体的总体中,抽取一个样本量为2的样本,某一个个体a“第一次被抽到的概率”、“第二次被抽到的概率”、“在整个抽样过程中被抽到的概率”分别是________、________、________.
【解析】从6个个体中抽1个个体,每个个体被抽到的概率均为eq \f(1,6),与抽取的次数无关,第二次被抽到的概率仍为eq \f(1,6).但由于在整个抽样过程中是从6个个体中抽2个样本,故个体a被抽到的概率为eq \f(1,3).
答案:eq \f(1,6) eq \f(1,6) eq \f(1,3)
变式3:一个布袋中有10个同样质地的小球,从中不放回地依次抽取3个小球,则某一特定小球被抽到的可能性是________,第三次抽取时,剩余每个小球被抽到的可能性是________.
【解析】因为简单随机抽样过程中每个个体被抽到的可能性均为eq \f(n,N),所以第一个空填eq \f(3,10).因为本题中的抽样是不放回抽样,所以第一次抽取时,每个小球被抽到的可能性为eq \f(1,10),第二次抽取时,剩余9个小球,每个小球被抽到的可能性为eq \f(1,9),第三次抽取时,剩余8个小球,每个小球被抽到的可能性为eq \f(1,8).
考点二 抽签法和随机数法
解题方略:
1.一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.抽签法一般适用于总体中个体数不多的情形.
2.随机数法生成随机数的方法:
(1)用随机试验生成随机数;
(2)用信息技术生成随机数:
①用计算器生成随机数;
②用电子表格软件生成随机数;
③用R统计软件生成随机数.
(一)抽签法
【例5】用抽签法进行抽样有以下几个步骤:①制签;②抽签;③将签摇匀;④编号;⑤将抽取的号码对应的个体取出,组成样本.这些步骤的正确顺序为________(填序号).
【解析】由抽签法的步骤知,正确顺序为④①③②⑤.
答案:④①③②⑤
变式1:抽签法中确保样本代表性的关键是( )
A.制签 B.搅拌均匀
C.逐一抽取 D.抽取不放回
【解析】逐一抽取、抽取不放回是简单随机抽样的特点,但不是确保代表性的关键,一次抽取与有放回抽取也不影响样本的代表性,制签也一样.故选B.
变式2:下列抽样试验中,适合用抽签法的有( )
A.从某厂生产的3 000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
D.从某厂生产的3 000件产品中抽取10件进行质量检验
【解析】个体数和样本容量较小时适合用抽签法,排除A、D;C中甲、乙两厂生产的两箱产品质量可能差别较大,也不适用.故选B.
变式3:上海某中学从40名学生中选1人作为上海男篮啦啦队的成员,采用下面两种选法,则抽签法的序号是________.
①将这40名学生从1~40进行编号,相应地制作1~40的40个号签,把这40个号签放在一个暗箱中搅匀,最后随机地从中抽取1个号签,与这个号签编号一致的学生幸运入选;
②将39个白球与1个红球(球除颜色外,其他完全相同)混合放在一个暗箱中搅匀,让40名学生逐一从中摸取一球,摸到红球的学生成为啦啦队成员.
【解析】①满足抽签法的特征,是抽签法;②不是抽签法,因为抽签法要求所有的号签编号互不相同,而②中39个白球无法相互区分.
[答案] ①
变式4:某家具厂要为育才小学一年级新生制作新课桌椅,他们要事先了解全体一年级学生的平均身高,以便设定可调节课桌椅的标准高度. 已知育才小学一年级有165名学生,如果通过简单随机抽样的方法调查一年级学生的平均身高,需抽取16人,需怎样抽取?
【解析】①先给165名学生编号,如编号为1~165;
②准备10个大小、质地一样的小球,小球上分别写上数字0,1,2,3,4,5,6,7,8,9,把它们放入一个不透明的袋中;
③从袋中有放回的摸取3次,每次摸取前充分搅拌,并把第一、二、三次摸到的数字分别作为百、十、个位数,这样就生成一个三位随机数;
④如果这个三位数在1~165范围内,就代表对应编号的学生被抽中,如果编号有重复就剔除编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的人数.
变式5:某校高一年级有43名足球运动员,要从中抽出5人调查学习负担情况,用抽签法设计一个抽样方案.
【解析】第一步:编号,把43名运动员编号为1~43;
第二步:制签,做好大小、形状相同的号签,分别写上这43个数;
第三步:搅拌,将这些号签放在暗箱中,进行均匀搅拌;
第四步:抽签入样,每次从中抽取一个,连续抽取5次(不放回抽取),从而得到容量为5的简单随机样本.
随机数法
【例6】已知总样本量为108,若用随机数法抽取一个容量为10的简单随机样本,下列对总体的编号正确的是( )
A.1,2,…,108 B.01,02,…,108
C.00,01,…,107 D.001,002,…,108
【解析】用随机数法选取样本时,样本的编号位数要一致.故选D.
变式1:总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法:从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第5个个体的编号为( )
A.08 B.07
C.02 D.01
【解析】从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字开始向右读,第一个数为65,不符合条件,第二个数为72,不符合条件,第三个数为08,符合条件,以下符合条件的数字依次为02,14,07,01,故第5个数为01.故选D.
变式2:某中学高一年级有400人,高二年级有320人,高三年级有280人,若每人被抽到的可能性都为0.2,用随机数法在该中学抽取容量为n的样本,则n等于( )
A.80 B.160
C.200 D.280
【解析】由题意可知,eq \f(n,400+320+280)=0.2,解得n=200.故选C.
考点三 用样本平均数估计总体平均数
解题方略:
用样本平均数估计总体平均数的步骤
(1)求样本平均数eq \x\t(y);
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,y3,…,yn,
则称eq \x\t(y)=eq \f(y1+y2+…+yn,n)=eq \f(1,n)
(2)用样本平均数eq \x\t(y)去估计总体平均数eq \(Y,\s\up6(-)),即eq \(Y,\s\up6(-))≈eq \x\t(y).
【例7】一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均数为________.
【解析】eq \x\t(x)=eq \f(4×3+3×2+5×4+6×2,3+2+4+2)≈4.55.
答案:4.55
变式1:某校为调查全校学生的睡眠时间,从全体学生中用随机数法抽取了一个容量为100的简单随机样本,他们的睡眠时间如下表(单位:h):
试计算这100名学生的平均睡眠时间并由此估计该校学生的日平均睡眠时间.
【解析】以睡眠区间的平均值为睡眠时间,则这100名学生的日平均睡眠时间为eq \x\t(y)=1/100×(5×6.25+17×6.75+33×7.25+37×7.75+6×8.25+2×8.75)= 1/100×739=7.39(h).
所以估计该校学生的日平均睡眠时间约为7.39 h.
变式2:某校为了了解学生课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用如图所示的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间,由此估计该校学生的日平均阅读时间约为( )
A.0.6小时 B.0.9小时
C.1.0小时 D.1.5小时
【解析】欲求平均每人的课外阅读时间,用50人所用的总时间除以50即可,而50人所用时间可由统计图表计算,eq \x\t(y)=eq \f(1,50)(5×0+20×0.5+10×1.0+10×1.5+5×2.0)=0.9(小时),即该校学生日平均阅读时间约为0.9小时.故选B.
变式3:某高校有甲、乙两个数学建模兴趣班.其中甲班有40人,乙班有50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是________分.
【解析】由题意得,该校数学建模兴趣班的平均成绩是eq \f(40×90+50×81,90)=85(分).
答案:85
变式4:某鱼塘去年向鱼塘投入了一批5 000条鱼苗,为了了解这批鱼苗的生长情况,从鱼塘中捕捞了20条,称得它们的质量如下(单位:kg):
1.1 1.0 1.1 1.0 1.1 1.3 1.2 1.1 1.1 1.2
1.1 1.1 1.0 1.2 1.2 1.2 1.1 1.2 1.1 1.1
已知这批鱼苗的成活率是80%,现在的市场价是每千克5.5元,请你帮忙计算一下,现在全部出售的毛收入会是多少?(对数据分析、整理,利用频数进行计算样本平均数,注意计算技巧)
【解析】这组数据的平均数为:
(1.0×3+1.1×10+1.2×6+1.3×1) ÷ 20≈1.12(kg),
估计鱼塘中鱼的平均重量为1.12千克/条.
5.5×5 000×80%×1.12=24 640 (元).
答:这批鱼现在全部出售的毛收入是24 640元.
变式5:对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:
分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数并判断选谁参加比赛比较合适?
【解析】eq \x\t(y)甲=eq \f(27+38+30+37+35+31,6)=33.
eq \x\t(y)乙=eq \f(35+29+40+34+30+36,6)=34.因为eq \x\t(y)甲<eq \x\t(y)乙,故选乙参加比赛较合适.
考点四 分层随机抽样的概念
解题方略:
分层随机抽样的特点
(1)适用于总体由差异明显的几部分组成的情况;
(2)更充分地反映了总体的情况;
(3)等概率抽样,每个个体被抽到的概率都相等.
【例8】分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层抽样为保证每个个体等概率抽样,必须进行( )
A.每层等概率抽样
B.每层可以不等概率抽样
C.所有层按同一抽样比等概率抽样
D.所有层抽个体数量相同
【解析】保证每个个体等概率的被抽取是三种基本抽样方式的共同特征,为了保证这一点,分层抽样时必须在所有层都按同一抽样比等概率抽取.故选C.
变式1:下列问题中,最适合用分层随机抽样抽取样本的是( )
A.从10名同学中抽取3人参加座谈会
B.红星中学共有学生1 600名,其中男生840名,防疫站对此校学生进行身体健康调查,抽取一个容量为200的样本
C.从1 000名工人中,抽取100人调查上班途中所用时间
D.从生产流水线上,抽取样本检查产品质量
【解析】A中总体所含个体无差异且个数较少,适合用简单随机抽样;C和D中总体所含个体无差异且个数较多,不适合用简单随机抽样和分层随机抽样;B中总体所含个体差异明显,适合用分层随机抽样.故选B.
变式2:某政府机关在编人员共100人,其中副处级以上干部10人,一般干部70人,工人20人,上级部门为了了解该机关对政府机构改革的意见,要从中抽取20人,用下列哪种方法最合适( )
A.抽签法 B.简单随机抽样法
C.分层随机抽样法 D.随机数法
【解析】总体由差异明显的三部分构成,应选用分层随机抽样.故选C.
变式3:对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样和分层随机抽样两种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,则( )
A.p1
【解析】不管是简单随机抽样还是分层随机抽样,它们都是等概率抽样,每个个体被抽中的概率均为eq \f(n,N).故选C.
考点五 比例分配的分层抽样的运用
解题方略:
确定比例分配的分层随机抽样中各层个体数的方法
(1)先计算出抽样比=eq \f(样本量,总样本量),获得各层抽样数的百分比;
(2)按抽样比确定每层需要抽取的个体数:
抽样比×该层个体数目=eq \f(样本量,总样本量)×该层个体数目.
【例9】在120个零件中,一级品24个,二级品36个,三级品60个,用分层随机抽样的方法从中抽取容量为20的样本,则每个个体被抽取的可能性是________.
【解析】在分层抽样中,每个个体被抽取的可能性相等,且为eq \f(样本量,总样本量). 所以每个个体被抽取的可能性是eq \f(20,120)=eq \f(1,6).
答案:eq \f(1,6)
变式1:在1 000个球中有红球50个,从中抽取100个进行分析,如果用比例分配的分层随机抽样的方法对球进行抽样,则应抽红球( )
A.33个 B.20个
C.5个 D.10个
【解析】样本抽样比为eq \f(100,1000),设应抽红球x个,则eq \f(100,1 000)=eq \f(x,50),故x=5.故选C.
变式2:某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层随机抽样抽取容量为30的样本,则抽取的各职称的人数分别为( )
A.5,10,15 B.3,9,18
C.3,10,17 D.5,9,16
【解析】高级、中级、初级职称的人数所占的比例分别为eq \f(15,150)=10%,eq \f(45,150)=30%,eq \f(90,150)=60%,则所抽取的高级、中级、初级职称的人数分别为10%×30=3(人),30%×30=9(人),60%×30=18(人).故选B.
变式3:某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20 000人,其中各种态度对应的人数如下表所示:
电视台为了了解观众的具体想法和意见,打算从中抽取100人进行详细的调查,为此要进行分层随机抽样,那么在分层随机抽样时,每类人中应抽取的人数分别为( )
A.25,25,25,25 B.48,72,64,16
C.20,40,30,10 D.24,36,32,8
【解析】因为抽样比为eq \f(100,20 000)=eq \f(1,200),所以每类人中应抽取的人数分别为4 800×eq \f(1,200)=24(人),7 200×eq \f(1,200)=36(人),6 400×eq \f(1,200)=32(人),1 600×eq \f(1,200)=8(人).故选D.
变式4:某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层随机抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.
【解析】设应从高二年级抽取x名学生,则x∶50=3∶10.解得x=15.
变式5:某工厂生产的A,B,C三种不同型号的产品数量之比为2∶3∶5,为研究这三种产品的质量,现用分层抽样的方法从该工厂生产的A,B,C三种产品中抽出样本量为n的样本,若样本中A型产品有10件,则n的值为( )
A.15 B.25
C.50 D.60
【解析】由分层抽样的特征知eq \f(10,n)=eq \f(2,2+3+5),解得n=50.故选C.
变式6:某校老年、中年和青年教师的人数如表所示,采用分层随机抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本的老年教师人数为( )
A.90 B.100
C.180 D.300
【解析】设该样本中的老年教师人数为x,由题意及比例分配分层随机抽样的特点得eq \f(x,900)=eq \f(320,1 600),故x=180.故选C.
变式7:某学校有在职人员160人,其中行政人员有16人,教师有112人,后勤人员有32人.教育部门为了了解在职人员对学校机构改革的意见,要从中抽取一个容量为20的样本,请利用分层随机抽样的方法抽取,写出抽样过程.
【解析】由题意知,该抽样为比例分配的分层随机抽样,抽样过程如下:
第一步,确定抽样比,样本量与总样本量的比为eq \f(20,160)=eq \f(1,8);
第二步,确定分别从三类人员中抽取的人数,从行政人员中抽取16×eq \f(1,8)=2(人);从教师中抽取112×eq \f(1,8)=14(人);从后勤人员中抽取32×eq \f(1,8)=4(人);
第三步,采用简单随机抽样的方法,抽取行政人员2人,教师14人,后勤人员4人;
第四步,把抽取的个体组合在一起构成所需样本.
变式8:一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?
【解析】由题意知,该抽样为比例分配的分层随机抽样,抽取步骤如下:
(1)分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.
(2)确定每层抽取个体的个数.抽样比为eq \f(100,500)=eq \f(1,5),则在不到35岁的职工中抽取125×eq \f(1,5)=25(人);在35岁至49岁的职工中抽取280×eq \f(1,5)=56(人);在50岁及50岁以上的职工中抽取95×eq \f(1,5)=19(人).
(3)在各层按随机数法抽取样本.
(4)汇总每层抽样,组成样本.
变式9:在分层随机抽样中,每层中的样本抽取应采用简单随机抽样,如:在第一层中应从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为eq \f(1,3),则在整个抽样过程中,每个个体被抽到的概率为( )
A.eq \f(1,4) B.eq \f(1,3)
C.eq \f(5,14) D.eq \f(10,27)
【解析】根据题意,eq \f(9,n-1)=eq \f(1,3),解得n=28.
故在整个抽样过程中每个个体被抽到的概率为eq \f(10,28)=eq \f(5,14).故选C.
练习一 简单随机抽样的概念
1、为了抽查汽车排放尾气的合格率,某环保局在某一路口随机抽查,这种抽查是( )
A.简单随机抽样 B.系统抽样
C.分层抽样 D.有放回抽样
【解析】根据题意,知在某一路口随机抽查,符合简单随机抽样的特征,故选A.
2、已知下列抽取样本的方式:
①从无限多个个体中抽取100个个体作为样本;
②盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出1个零件进行质量检验后再把它放回盒子里;
③从20件玩具中一次性抽取3件进行质量检验;
④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
其中,不是简单随机抽样的是________(填序号).
【解析】①不是简单随机抽样,因为被抽取的总体的个体数是无限的,而不是有限的;②不是简单随机抽样,因为它是放回抽样;③不是简单随机抽样,因为这是“一次性”抽取,而不是“逐个”抽取;④不是简单随机抽样,因为指定个子最高的5名同学是56名同学中特指的,不存在随机性,不是等概率抽样.
答案:①②③④
3、一个总体中含有100个个体,以简单随机抽样方法从该总体中抽取一个容量为5的简单随机样本,则指定的某个个体被抽到的可能性为________.
【解析】因为是简单随机抽样,故每个个体被抽到的概率都相等,所以指定的某个个体被抽到的可能性为eq \f(1,20).
从总体容量为N的一批零件中,抽取一个容量为30的样本,若每个零件被抽到的可能性为0.25,则N的值为( )
A.120 B.200
C.150 D.100
【解析】因为从含有N个个体的总体中抽取一个容量为30的样本时,在每次抽取一个个体的过程中任意一个个体被抽到的可能性为eq \f(1,N),在整个抽样过程中每个个体被抽到的可能性为eq \f(30,N),所以eq \f(30,N)=0.25,从而有N=120.故选A.
练习二 抽签法和随机数法
1、采用抽签法从含有3个个体的总体{1,3,8}中抽取一个样本量为2的样本,则所有可能的样本是________.
【解析】从三个总体中任取两个即可组成样本,
∴所有可能的样本为{1,3},{1,8},{3,8}.
答案:{1,3},{1,8},{3,8}
2、某卫生单位为了支援抗震救灾,要在18名志愿者中选取6人组成医疗小组去参加救治工作,请用抽签法设计抽样方案.
【解析】方案如下:
第一步,将18名志愿者编号,号码为01,02,03,…,18.
第二步,将号码分别写在相同的纸条上,揉成团,制成号签.
第三步,将得到的号签放到一个不透明的盒子中,充分搅匀.
第四步,从盒子中依次取出6个号签,并记录上面的编号.
第五步,与所得号码对应的志愿者就是医疗小组成员.
3、现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个样本量为6的样本进行质量检验.如何用随机数法设计抽样方案?
【解析】第一步,将元件的编号调整为010,011,012,…,099,100,…,600.
第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第6行第7个数9.
第三步,从数9开始,向右读,每次读取三位,凡不在010~600中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到544,354,378,520,384,263.
第四步,与以上这6个号码对应的6个元件就是所要抽取的对象.
4、假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,应如何操作?
【解析】第一步,将800袋牛奶编号为000,001,…,799.
第二步,在随机数表中任选一个数作为起始数(例如选出第8行第7列的数7).
第三步,从选定的数7开始依次向右读(读数的方向也可以是向左、向上、向下等),将编号范围内的数取出,编号范围外的数去掉,直到取满60个号码为止,就得到一个容量为60的样本.
练习三 用样本平均数估计总体平均数
1、已知样本数据x1,x2,…,xn的均值eq \x\t(x)=5,则样本数据2x1+1,2x2+1,…,2xn+1的均值为________.
【解析】由条件知eq \x\t(x)=eq \f(x1+x2+…+xn,n)=5,
则所求均值eq \x\t(x)0=eq \f(2x1+1+2x2+1+…+2xn+1,n)=eq \f(2x1+x2+…+xn+n,n)=2eq \x\t(x)+1=2×5+1=11.
答案:11
2、已知样本x1,x2,…,xn的平均数为x;样本y1,y2,…,ym的平均数为y(x≠y),若样本x1,x2,…,xn,y1,y2,…,ym的平均数z=ax+(1-a)y,其中0A.n=m B.n≥m
C.n
【解析】由题意得z=eq \f(1,n+m)(nx+my)=eq \f(n,n+m)x+eq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(n,n+m)))y,∴a=eq \f(n,n+m),
∵0又n,m∈N*,∴2n
试估计哪个班的技能成绩较好.
【解析】分别计算两班成绩的平均数,得
eq \x\t(y)A=eq \f(1,10)×(67+72+93+69+86+84+45+77+88+91)=77.2(分).
eq \x\t(y)B=eq \f(1,10)×(78+96+56+83+86+48+98+67+62+72)=74.6(分).
由此估计:甲班平均分约为77.2分,乙班平均分约为74.6分,77.2>74.6,
由此估计A班的技能平均水平高于B班.
4、为宣传节约用水,小明随机调查了某小区部分家庭5月份的用水情况,并将收集的数据整理成如下统计图.
(1)小明一共调查了多少户家庭?
(2)求所调查家庭5月份用水量的平均数;
(3)若该小区有400户居民,请你估计这个小区5月份的用水量.
【解析】(1)1+1+3+6+4+2+2+1=20(户).
答:小明一共调查了20户家庭.
(2)(1×1+1×2+3×3+4×6+5×4+6×2+7×2+8×1)÷20=4.5(吨).
答:所调查家庭5月份用水量的平均数为4.5吨.
(3)400×4.5=1 800(吨).
答:估计这个小区5月份的用水量为1 800吨.
练习四 分层随机抽样的概念
1、某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体情况,需从中抽取一个容量为36的样本,则适合的抽样方法是( )
A.抽签法随机抽样
B.随机数法随机抽样
C.直接运用分层随机抽样
D.先从老年人中剔除1人,再用分层随机抽样
【解析】因为总体由差异明显的三部分组成,所以考虑用分层随机抽样.故选C.
2、某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )
A.抽签法 B.随机数法
C.分层随机抽样法 D.任何抽样法都可以
【解析】由于被抽取的个体属性有明显的差异,因此宜采用分层随机抽样法.
练习五 比例分配的分层抽样的运用
1、交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为________.
【解析】根据分层随机抽样的概念知eq \f(12,96)=eq \f(12+21+25+43,N),解得N=808.
2、已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取2%的学生进行调查,则样本量和抽取的高中生近视人数分别为( )
A.200,20 B.100,20
C.200,10 D.100,10
【解析】该地区中小学生总人数为3 500+2 000+4 500=10 000(人),则样本量为10 000×2%=200(人),其中抽取的高中生近视人数为2 000×2%×50%=20(人).故选A.
3、为了了解高一、高二、高三年级学生的身体状况,现用分层随机抽样的方法抽取一个容量为1 200的样本,三个年级学生人数之比依次为k∶5∶3,已知高一年级共抽取了240人,则高三年级抽取的人数为________人.
【解析】因为高一年级抽取学生的比例为eq \f(240,1 200)=eq \f(1,5),所以eq \f(k,k+5+3)=eq \f(1,5),解得k=2,故高三年级抽取的人数为1 200×eq \f(3,2+5+3)=360(人).
答案:360
4、某市化工厂三个车间共有工人1 000名,各车间男、女工人数如下表:
已知在全厂工人中随机抽取1名,抽到第二车间男工的可能性是0.15.
(1)求x的值;
(2)现用分层随机抽样的方法在全厂抽取50名工人,问应在第三车间抽取多少名?
【解析】(1)由eq \f(x,1 000)=0.15,得x=150.
(2)∵第一车间的工人数是173+177=350(人),第二车间的工人数是100+150=250(人),
∴第三车间的工人数是1 000-350-250=400(人).
设应从第三车间抽取m名工人,则由eq \f(m,400)=eq \f(50,1 000),
得m=20.
∴应在第三车间抽取20名工人.
5、某班有40名男生,20名女生,已知男女身高有明显不同,现欲调查平均身高,准备抽取eq \f(1,30),采用比例分配分层随机抽样方法,抽取男生1名,女生1名,你认为这种做法是否妥当?如果让你来调查,你准备怎样做?
【解析】这种做法不妥当.原因:取样比例数eq \f(1,30)过小,很难准确反映总体情况,况且男、女身高差异较大,抽取人数相同,也不合理.
考虑到本题的情况,可以采用分层随机抽样,可抽取抽样比为eq \f(1,5).
男生抽取40×eq \f(1,5)=8(名),女生抽取20×eq \f(1,5)=4(名),各自用抽签法或随机数法抽取组成样本.
6、某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组.在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%,登山组的职工占参加活动总人数的eq \f(1,4),且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层的职工对本次活动的满意程度,现用比例分配分层随机抽样的方法从参加活动的全体职工中抽取容量为200的样本.试求:
(1)游泳组中,青年人、中年人、老年人分别所占的比例;
(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.
【解析】(1)设登山组人数为x,游泳组中,青年人、中年人、老年人各占比例分别为a,b,c,
则有eq \f(x·40%+3xb,4x)=47.5%,eq \f(x·10%+3xc,4x)=10%.
解得b=50%,c=10%.
故a=1-50%-10%=40%.
即游泳组中,青年人、中年人、老年人各占比例分别为40%,50%,10%.
(2)游泳组中,抽取的青年人人数为200×eq \f(3,4)×40%=60(人);
抽取的中年人人数为200×eq \f(3,4)×50%=75(人);
抽取的老年人人数为200×eq \f(3,4)×10%=15(人).
名称
定义
总体
调查对象的全体称为整体
个体
组成整体的每一个调查对象称为个体
样本
从总体中抽取的那部分个体称为样本
样本容量
样本中包含的个体数称为样本容量
相同点
①都属于简单随机抽样,并且要求被抽取样本的总体的个体数有限;
②都是从总体中逐个不放回地进行抽取
不同点
①抽签法比随机数法操作简单;
②随机数法更适用于总体中个体数较多的时候,而抽签法适用于总体中个体数较少的情况,所以当总体中的个体数较多时,应当选用随机数法,可以节约大量的人力和制作号签的成本
7816
6572
0802
6314
0702
4369
9728
0198
3204
9234
4935
8200
3623
4869
6938
7481
睡眠
时间
[6,6.5)
[6.5,7)
[7,7.5)
[7.5,8)
[8,8.5)
[8.5,9)
合
计
人数
5
17
33
37
6
2
100
甲
27
38
30
37
35
31
乙
35
29
40
34
30
36
最喜爱
喜爱
一般
不喜欢
4 800
7 200
6 400
1 600
类别
人数
老年教师
900
中年教师
1 800
青年教师
1 600
合计
4 300
A班
67
72
93
69
86
84
45
77
88
91
B班
78
96
56
83
86
48
98
67
62
72
第一车间
第二车间
第三车间
女工
173
100
y
男工
177
x
z
高一数学下学期考点精讲+精练(人教A版2019必修第二册)第01讲平面向量的概念(原卷版+解析): 这是一份高一数学下学期考点精讲+精练(人教A版2019必修第二册)第01讲平面向量的概念(原卷版+解析),共21页。试卷主要包含了 零向量的方向是任意的,故选,2,画出向量.等内容,欢迎下载使用。
高一数学下学期考点精讲+精练(人教A版2019必修第二册)第01讲基本立体图形(原卷版+解析): 这是一份高一数学下学期考点精讲+精练(人教A版2019必修第二册)第01讲基本立体图形(原卷版+解析),共63页。试卷主要包含了空间几何体,空间几何体的分类,棱台的结构特征,圆柱的结构特征,圆锥的结构特征,圆台的结构特征,球的结构特征,简单组合体的结构特征等内容,欢迎下载使用。
高一数学下学期考点精讲+精练(人教A版2019必修第二册)第01练随机抽样(原卷版+解析): 这是一份高一数学下学期考点精讲+精练(人教A版2019必修第二册)第01练随机抽样(原卷版+解析),共21页。试卷主要包含了单选题,多选题,填空题,解答题等内容,欢迎下载使用。