高考数学(理数)一轮复习学案11.1《随机抽样》(含详解)
展开11.1 随机抽样
1.简单随机抽样
(1)简单随机抽样:一般地,设一个总体含有N个个体,从中逐个________地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会________,就把这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样方法有两种:________法和________法.
抽签法(抓阄法):一般地,抽签法就是把总体中的N个个体________,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取______个号签,连续抽取________次,就得到一个容量为n的样本.
随机数法:随机数法就是利用______________、随机数骰子或计算机产生的随机数进行抽样.
简单随机抽样有操作简便易行的优点,在总体个数不多的情况下是行之有效的.
2.系统抽样
(1)一般地,假设要从容量为N的总体中抽取容量为n的样本,我们可以按下列步骤进行系统抽样:
①先将总体的N个个体________.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;
②确定分段间隔k,对编号进行分段.当(n是样本容量)是整数时,取k=,如果遇到不是整数的情况,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除;
③在第1段用______________抽样方法确定第一个个体编号l(l≤k);
④按照一定的规则抽取样本.通常是将l加上________得到第2个个体编号________,再________得到第3个个体编号________,依次进行下去,直到获取整个样本.
(2)当总体中元素个数较少时,常采用____________,当总体中元素个数较多时,常采用______________.
3.分层抽样
(1)分层抽样的概念:一般地,在抽样时,将总体分成________的层,然后按照一定的________,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)当总体是由__________的几个部分组成时,往往选用分层抽样的方法.
(3)分层抽样时,每个个体被抽到的机会是________的.
自查自纠:
1.(1)不放回 都相等
(2)抽签 随机数 编号 1 n 随机数表
2.(1)①编号 ③简单随机
④间隔k (l+k) 加k (l+2k)
(2)简单随机抽样 系统抽样
3.(1)互不交叉 比例 (2)差异明显 (3)均等
某城区有农民、工人、知识分子家庭共计 2 000户,其中农民家庭1 600户,工人家庭300户.现要从中抽取容量为40的样本,则在整个抽样过程中,最合理的抽样方法组合是 ( )
①简单随机抽样;②系统抽样;③分层抽样.
A.②③ B.①③ C.①② D.①②③
解:由于各类家庭有明显差异,所以首先应用分层抽样的方法分别从三类家庭中抽出32户、6户、2户.又由于农民家庭户数较多,宜采用系统抽样法,而工人、知识分子家庭户数较少,宜采用简单随机抽样法,故最合理的组合是①②③三种抽样方法.故选D.
()为考察某企业生产的袋装牛奶的质量是否达标,现从500袋牛奶中抽取6袋进行检验,利用随机数表法抽取样本时,先将500袋牛奶按000,001,…,499进行编号,使用下面随机数表中各个5位数组的后3位,选定第7行第5组数开始,取出047作为抽取的代号,继续向右读,随后检验的5袋牛奶的号码是(下面摘取了某随机数表第7行至第9行) ( )
84421 75331 57245 50688 77047 44767 21763
35025 83921 20676 63016 37859 16955 56719
98105 07175 12867 35807 44395 23879 33211
A.245,331,421,025,016
B.025,016,105,175,395
C.025,016,245,331,175
D.447,176,335,025,212
解:由图表可知,依次是:767(剔除),763(剔除),025,921(剔除),676(剔除),016,859(剔除),955(剔除),719(剔除),105,175,867(剔除),807(剔除),395.故随后检验的5袋牛奶的号码是025,016,105,175,395.故选B.
将800个个体编号为001~800,然后利用系统抽样的方法从中抽取20个个体作为样本,则在编号为121~400的个体中抽取的个体数为 ( )
A.10 B.9 C.8 D.7
解:抽样的间隔为=40,所以第4组的编号为121~160,第10组的编号为361~400,所以在编号为121~400的个体中被抽取的个体每组一个,一共有7个.故选D.
()某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是______________.
解:由于对不同年龄段客户进行抽样调查,故采用分层抽样最合适.故填分层抽样.
()某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200件,400件,300件,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件______________.
解:应从丙种型号的产品中抽取60×=18(件).故填18.
类型一 简单随机抽样
高一(3)班有学生60人,为了解学生对网购的看法,现要从中抽取一个容量为10的样本,问此样本若采用简单随机抽样,将如何获得?试设计抽样方案.
解:方法一(抽签法)
①编号,将这60名学生编号为1,2,…,60;
②制签,将这60个号码分别写在60张大小、形状相同的纸片上;
③搅拌,将这60张纸片放到一个不透明的盒子里搅拌均匀;
④抽签入样,抽出一张记下上面的号码(不放回),然后再搅拌均匀,接着抽取第2张,记下号码.重复这个过程直到取到10个号码为止.
这样,与这10个号码对应的10名学生就构成了一个简单的随机样本.
方法二(随机数表法)
①将60名学生编号,可以编为00,01,02,…,59;
②选定随机数表中的起始数,任选一方向作为读数方向,如指定从随机数表中的第2行第2个数7开始;
③从选定的起始数7开始向右每次读取两位,凡不在00~59中的数或已读过的数,都跳过不作记录,直至取得10个不同号码.
于是得到抽取的样本号码是42,46,24,28,11,45,04,25,33,23,这样,与这10个号码对应的10名学生就构成了一个简单的随机样本.
点 拨:
考虑到总体中个体数较少,利用抽签法或随机数表法很容易获取样本,但须按这两种抽样方法的操作步骤进行.注意掌握随机数表的使用方法.
某颁奖典礼准备邀请20名艺人参与演出,其中从30名舞蹈艺人中随机挑选10人,从18名歌唱艺人中随机挑选6人,从10名相声艺人中随机挑选4人.试用抽签法确定选中的艺人,并确定他们的表演顺序.
解:第一步,先确定艺人:①将30名舞蹈艺人从01~30编号,然后用相同的纸条做成30个号签,分别写上这些编号,再放入一个不透明小盒中摇匀,从中抽出10个号签,则相应编号的艺人参加演出.②运用相同的办法分别从10名相声艺人中抽取4人,从18名歌唱艺人中抽取6人.
第二步,确定演出顺序:确定了演出人员后,再用相同的纸条做成20个号签,上面写上1~20这20个数字,代表演出的顺序,放在暗盒中搅匀后让每个艺人抽一张,每人抽到的号签上的数字就是这位艺人的演出顺序,再汇总即可.
类型二 系统抽样
某批产品共有1 564件,产品按出厂顺序编号,号码从1到1 564,检测员要从中抽取15件产品作检测,请给出一个系统抽样方案.
解:①先从1 564件产品中,随机找到4件产品,将其剔除(可用随机数法).
②将余下的1 560件产品编号:1,2,3,…,1 560.
③确定分段间隔k==104,将总体均分为15组,每组含104个个体.
④从第一组即1号到104号中随机抽取一个号s.
⑤将编号为s,104+s,208+s,…,1 456+s的15个个体选出,即得到一个容量为15的样本.
点 拨:
①总体容量和样本容量都较大时,选用系统抽样比较合适;②系统抽样的号码成等差数列,公差为每组的容量;③总体中的每个个体都必须等可能的入样,若总体容量不能被样本容量整除,可以先从总体中随机的剔除几个个体,然后再分段.
(1)()某公司对一批产品的质量进行检测,现采用系统抽样的方法从100件产品中抽取5件进行检测,对这100件产品随机编号后分成5组,第一组1~20号,第二组21~40号,…,第五组81~100号,若在第二组中抽取的编号为24,则在第四组中抽取的编号为______________.
解:因为系统抽样的号码成等差数列,且公差为每组的容量,所以第四组抽取的编号为24+2×20=64.故填64.
(2)将参加学校期末考试的高三年级的400名学生编号为001,002,…,400,已知这400名学生到甲、乙、丙三栋楼去考试,从001到200号在甲楼,从201到295号在乙楼,从296到400号在丙楼.现采用系统抽样方法抽取一个容量为50的样本,且随机抽得的首个号码为003,则三栋楼被抽中的人数依次为________.
解:由系统抽样的方法先确定分段的间隔k,k==8,故甲楼被抽中的人数为:=25(人).
因为95=11×8 +7,故乙楼被抽中的人数为12人.
故丙楼被抽中的人数为50-25-12=13(人).
故填25,12,13.
类型三 分层抽样
某企业共有5个分布在不同区域的工厂,职工3万人,其中职工比例为3∶2∶5∶2∶3.现从3万人中抽取一个300人的样本,分析员工的生产效率.已知生产效率与不同的地理位置的生活习俗及文化传统有关,问应采取什么样的方法?并写出具体过程.
解:应采取分层抽样的方法.过程如下:
①将3万人分为五层,其中一个工厂为一层.
②按照样本容量的比例随机抽取各工厂应抽取的样本:
300×=60(人);300×=40(人);
300×=100(人);300×=40(人);
300×=60(人).
因此各工厂应抽取的人数分别为60人,40人,100人,40人,60人.
③将300人组到一起即得到一个样本.
点 拨:
分层抽样的实质为按比例抽取,当总体由差异明显的几部分组成时,多用分层抽样.应认识到,在各层抽取样本时,又可能会用到简单随机抽样,系统抽样,甚至分层抽样来抽取样本.
(1)()如图,某学校共有教师120人,现用分层抽样的方法从中选出一个30人的样本,则其中被选出的青年女教师的人数为 ( )
A.12 B.6 C.4 D.3
解:青年教师的人数为120×30%=36人,所以青年女教师为12人,故青年女教师被选出的人数为12×=3.故选D.
(2)()我国古代数学名著《九章算术》有一抽样问题:“今有北乡若干人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,而北乡需遣一百零八人,问北乡人数几何?”依分层抽样的方法,则北乡共有________人.
解:设北乡有x人,则=,解得x=8 100.故填8 100.
1.简单随机抽样是系统抽样和分层抽样的基础,是一种等概率的抽样,它的特点是:①它要求总体个数较少;②它是从总体中逐个抽取的;③它是一种不放回抽样.
2.系统抽样又称等距抽样,号码序列一旦确定,样本即确定好了.但要注意,如果编号的个体特征随编号的变化呈现一定的周期性,那么样本的代表性是不可靠的,甚至会导致明显的偏向.
3.分层抽样一般在总体是由差异明显的几个部分组成时使用.
4.抽样方法经常交叉使用,比如系统抽样中均匀分段后的第一段,可采用简单随机抽样;分层抽样中,若每层中个体数量仍很大时,则可辅之以系统抽样等.
5.三种抽样方法的比较
类别
共同点
各自特点
相互联系
适用范围
简单随机抽样
抽样过程中每个个体被抽取的概率相等
从总体中逐个抽样
总体中的个体数较少
系统
抽样
将总体均分成几部分,按事先确定的规则在各部分抽取
在起始部分抽样时采用简单随机抽样
总体中的个体数较多
分层
抽样
将总体分成几层,分层进行抽取
分层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
1.()为了解某校高一年级400名学生的身高情况,从中抽取了50名学生的身高进行统计分析,在这个问题中,样本是指 ( )
A.400名学生 B.50名学生
C.400名学生的身高 D.50名学生的身高
解:研究对象是某校高一年级400名学生的身高情况,所以样本是50名学生的身高.故选D.
2.有下列抽样调查:
①学校为了解高一学生的数学学习情况,从每班(各班人数相等)抽2人进行座谈;
②一次数学竞赛中,某班有15人在100分以上,35人在90~100分,10人低于90分,现在从中抽取12人座谈了解情况;
③运动会比赛后为了解10名参赛选手的心理情况,从中随机抽取3人进行采访.
就这三个调查,最合理的抽样方法依次为
( )
A.分层抽样,系统抽样,简单随机抽样
B.系统抽样,系统抽样,简单随机抽样
C.分层抽样,简单随机抽样,简单随机抽样
D.系统抽样,分层抽样,简单随机抽样
解:最合理的抽样方法:①是系统抽样,因为各班人数相等,每班抽取2人;②是分层抽样,因为60人中分数有明显差异;③是简单随机抽样,因为总体个数较少.故选D.
3.()总体由编号为00,01,02,…,48,49的50个个体组成,利用下面的随机数表选取8个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第4个个体的编号为
( )
附:第6行至第9行的随机数表如下.
2635 7900 3370 9160 1620 3882 7757 4950
3211 4919 7306 4916 7677 8733 9974 6732
2748 6198 7164 4148 7086 2888 8519 1620
7477 0111 1630 2404 2979 7991 9683 5125
A.3 B.16 C.38 D.49
解:从随机数表第6行的第9列和第10列数字开始由左到右依次选取两个数字,列举出选出来编号在00~49的前4个个体的编号为33,16,20,38,所以选出来的第4个个体的编号为38.故选C.
4.从2 019名学生中选取50名学生参与一项调查,若采用下面的方法选取:先用简单随机抽样从2 019人中剔除19人,剩下的2 000人再按系统抽样的方法抽取,则每人入选的概率 ( )
A.不全相等 B.均不相等
C.都相等,且为 D.都相等,且为
解:因为简单随机抽样和系统抽样都是等可能抽样,从N个个体中抽取M个个体,则每个个体被抽到的概率都等于,所以每人入选的概率都相等,且为.故选C.
5.()某中学有高中生3 000人,初中生2 000人,男、女生所占的比例如下图所示,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取女生21人,则从初中生中抽取的男生人数是 ( )
A.12 B.15 C.20 D.21
解:因为分层抽样的抽取比例为=,所以初中生中抽取的男生人数是=12(人).故选A.
6.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.
若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是 ( )
A.3 B.4 C.5 D.6
解:因为35÷7=5,因此可将编号为1~35的35个数据分成7组,每组有5个数据,在区间[139,151]上共有20个数据,分在4个小组中,每组取1人,共取4人.故选B.
7.()某机构对某镇的学生的身体素质状况按年级段进行分层抽样调查,得到了如下表所示的数据,则=________.
年级段
小学
初中
高中
总人数
800
x
y
样本中人数
16
15
z
解:根据分层抽样原理知,==,所以 =15.故填15.
8.()某校高三年级有男生220人,学籍编号为1,2,…,220;女生380人,学籍编号为221,222,…,600.为了解学生学习的心理状态,按学籍编号采用系统抽样的方法从这600名学生中抽取75人进行问卷调查(第一组采用简单随机抽样,抽到的学籍编号为5),则女生被抽取的人数为人________.
解:由题意共600名学生,要抽取75人,按照系统抽样则每组600÷75=8(人),第一组抽到的学籍编号为5,令5+8(n-1)≤220,得n≤27.875,所以男生抽取人数为27,则女生被抽取人数为75-27=48(人).故填48.
9.为了考察某校的教学水平,将抽查该校高三年级部分学生本学年的考试成绩进行考察.为了全面地反映实际情况,采用以下三种方式进行抽样(已知该校高三年级共有20个教学班,并且每个班内的学生已经按随机方式编好了学号,假定该校每班学生人数都相同):①从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考察他们的学习成绩;②每个班都抽取1人,共计20人,考察这20个学生的成绩;③把学生按成绩分成优秀、良好、普通三个级别,从中抽取100名学生进行考察(已知若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人).根据上面的叙述,回答下列问题:
(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的样本中,其样本容量分别是多少?
(2)上面三种抽取方式中各自采用了何种抽取样本的方法?
解:(1)这三种抽取方式中,其总体都是指该校高三全体学生本学年的考试成绩,个体都是指高三年级每个学生本学年的考试成绩.其中第一种抽取方式中样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第二种抽取方式中,样本为所抽取的20名学生本学年的考试成绩,样本容量为20;第三种抽取方式中,样本为所抽取的100名学生本学年的考试成绩,样本容量为100.
(2)第一种采用简单随机抽样法;第二种采用系统抽样法和简单随机抽样法;第三种采用分层抽样法和简单随机抽样法.
10.()某集团有员工1 019人,其中获得过国家级表彰的有29人,其他人员990人.该集团拟组织一次出国学习,参加人员确定为:获得过国家级表彰的人员5人,其他人员30人.如何确定人选?
解:获得过国家级表彰的人员选5人,数量较少,适用抽签法;其他人员选30人,数量较多,且没有明显的差异,适用系统抽样法.
(1)确定获得过国家级表彰的人员人选:
①用随机方式给29人编号,号码为1,2,…,29;
②将这29个号码分别写在大小、形状相同的小纸条上,揉成小球,制成号签;
③将得到的号签放入一个不透明的袋子中,搅拌均匀;
④从袋子中逐个抽取5个号签(不放回抽取),并记录上面的号码;
⑤从总体中将与抽取的号签的号码相一致的个体抽出,人选就确定了.
(2)确定其他人员人选:
①将990名其他人员重新编号(分别为1,2,…,990),并分成30段,每段33人;②在第一段1,2,…,33这33个编号中用简单随机抽样法抽出一个(如3)作为起始号码;③将编号为3,36,69,…,960的个体抽出,人选就确定了.
(1)、(2)确定的人选合在一起就是最终确定的人选.
11.()已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16. 现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.
(1)应从甲、乙、丙三个部门的员工中分别抽取多少人?
(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.
(Ⅰ)用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期望;
(Ⅱ)设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率.
解:(1)由已知,甲、乙、丙三个部门的员工人数之比为3∶2∶2,由于采用分层抽样的方法从中抽取7人,因此应从甲、乙、丙三个部门的员工中分别抽取3人,2人,2人.
(2)(Ⅰ)随机变量X的所有可能取值为0,1,2,
所以,随机变量X的分布列为
X
0
1
2
3
P
随机变量X的数学期望E(X)=0×+1×+2×+3×=.
(Ⅱ)设事件B为“抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人”;事件C为“抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人”,则A=B∪C,且B与C互斥,由(Ⅰ)知,P(B)=P(X=2),P(C)=P(X=1),故P(A)=P(B∪C)=P(X=2)+P(X=1)=.所以,事件A发生的概率为.
()某班运动队由足球队员18人、篮球队员12人、乒乓球队员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n的样本,若分别采用系统抽样和分层抽样法,则都不用剔除个体;当样本容量为n+1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n为____________.
解:由题意得,n为18+12+6=36的正约数,因为18∶12∶6=3∶2∶1,所以n为6的倍数,因此n可能为6,12,18或36.因为当样本容量为n+1时,若采用系统抽样法,则需要剔除1个个体,所以n+1为35的正约数,因此n=6.故填6.
(新高考)高考数学一轮复习学案11.1《随机抽样、用样本估计总体》(含详解): 这是一份(新高考)高考数学一轮复习学案11.1《随机抽样、用样本估计总体》(含详解),共16页。学案主要包含了知识梳理,教材衍化等内容,欢迎下载使用。
高考数学(理数)一轮复习学案10.9《正态分布》(含详解): 这是一份高考数学(理数)一轮复习学案10.9《正态分布》(含详解),共10页。
高考数学(理数)一轮复习学案9.7《双曲线》(含详解): 这是一份高考数学(理数)一轮复习学案9.7《双曲线》(含详解),共9页。