《高考总复习》数学 第九章 第4讲 随机抽样[配套课件]
展开
这是一份《高考总复习》数学 第九章 第4讲 随机抽样[配套课件],共43页。PPT课件主要包含了简单随机抽样,抽签法,l+2k,分层抽样,题组一,走出误区,题组二,走进教材,答案A,题组三等内容,欢迎下载使用。
(1)定义:设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:________和随机数法.
2.系统抽样的步骤假设要从容量为 N 的总体中抽取容量为 n 的样本.(1)编号:先将总体的 N 个个体编号;(3)确定首个个体:在第 1 段用简单随机抽样确定第 1 个个
体编号 l(l≤k);
(4)获取样本:按照一定的规则抽取样本,通常是将 l 加上间隔 k 得到第 2 个个体编号 l+k,再加 k 得到第 3 个个体编号________,依次进行下去,直到获取整个样本.
(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样;(2)分层抽样的应用范围:当总体是由差异明显的几个部分
组成时,往往选用分层抽样.
1.(多选题)下列结论中正确的是(
A.简单随机抽样是从总体中逐个不放回地抽取样本B.系统抽样在起始部分抽样时采用简单随机抽样C.要从 1002 个学生中用系统抽样的方法选取一个容量为20 的样本,需要剔除 2 个学生,这样对被剔除者不公平D.抽签法中,先抽的人抽中的可能性大答案:AB
2.(必修3P100A组第2题改编)某公司有员工500人,其中不到 35 岁的有 125 人,35~49 岁的有 280 人,50 岁以上的有95 人,为了调查员工的身体健康状况,从中抽取 100 名员工,
则应在这三个年龄段分别抽取的人数为(
A.33,34,33C.30,40,30
B.25,56,19D.30,50,20
解析:因为 125∶280∶95=25∶56∶19,所以抽取人数分别为 25,56,19.答案:B
3.(必修3P100A组第1题改编)(2014年四川)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了 200 名居民的阅读时间进行统计分析.在这个问题中,5000
名居民的阅读时间的全体是(A.总体B.个体C.样本的容量D.从总体中抽取的一个样本
解析:为了了解 5000 名居民某天的阅读时间,从中抽取了200 名居民的阅读时间进行统计分析.样本的容量为 200,每个居民的阅读时间就是一个个体,5000 名居民的阅读时间的全体是总体.
4.(2018 年全国Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是____________.解析:因为不同年龄段客户对其服务的评价有较大差异.所以最合适的抽样方法是分层抽样.答案:分层抽样
5.(2019 年全国Ⅰ)某学校为了解 1000 名新生的身体素质,将这些学生编号为 1,2,…,1000,从这些新生中用系统抽样方法等距抽取 100 名学生进行体质测验.若 46 号学生被抽到,则
下面 4 名学生中被抽到的是(A.8 号学生C.616 号学生
)B.200 号学生D.815 号学生
解析:用系统抽样方法等距抽取 100 名学生进行体质测验.即分段间隔 k=10,l=6,616 号学生可能被抽到.答案:C
简单随机抽样 自主练习
1.某工厂利用随机数表对生产的 600 个零件进行抽样测试,先将 600 个零件进行编号,编号分别为 001,002,…,599,600,从中抽取 60 个样本,下面提供随机数表的第 4 行到第 6 行:32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 7735 78 90 56 4284 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 0723 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 3245 77 89 23 45若从表中第 6 行第 6 列开始向右依次读取 3 个数据,则得
到的第 5 个样本编号是(
解析:所得样本编号依次为 436,535,577,348,522,第 5 个是 522.故选 A.答案:A
2.(2018 年河南十校联考)有一批计算机,其编号分别为001,002,003,…,112,为了调查计算机的质量问题,打算抽取4 台入样.现在利用随机数表法抽样,在随机数表中选第 10 行第6 个数“0”作为开始,向右读,那么抽取的第 4 台计算机的编号
)附:随机数表中第 10~12 行如下.
解析:结合所给部分随机数表以及读法规则即知,依次可得到需要的编号分别是 076,068,072,021.故抽取的第 4 台计算机的编号为 021.
3.(2013 年江西)总体由编号为 01,02,…,19,20 的 20 个个体组成.利用下面的随机数表选取 5 个个体,选取方法是从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个
数字,则选出来的第 5 个个体的编号为(
解析:从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个数字开始向右读,第一个数为 65,不符合条件,第二个数为 72,不符合条件,第三个数为 08,符合条件,按照此方法符合条件的依次为 08,02,14,07,02,01,02 重复的数字要去掉,故第 5 个数为 01.
【题后反思】本题为教材例题的变式题,主要考查随机数表法.解题时,需要找准起始位置,明确选取的方式,同时必须遵循选数的规则,把握好这些细节问题即可顺利获解.一般地,利用随机数表法抽取样本时,从第几行的第几个数开始,按照什么方向取数完全是任意的,事先应确定好,中途不得改变;在选数过程中,不但要去掉不符合要求的号码,而且还要去掉与前面重复的号码.
[例 1](1)(2020 年广东湛江二模)高二某班共有学生45 人,学号依次为 1,2,3,…,45,现按学号用系统抽样的办法抽取一个容量为 5 的样本,已知学号为 6,24,33 的学生在样本中,那么
样本中还有两个学生的学号应为(
(2)(2015 年湖南)在一次马拉松比赛中,35 名运动员的成绩(单位:分钟)的茎叶图如图 9-4-1,若将运动员按成绩由好到差编为 1~35 号,再用系统抽样方法从中抽取 7 人,则其中成绩在区间[139,151]上的运动员人数是 __________.图 9-4-1
系统抽样的性质,可知人数为 20×
解析:由茎叶图可知,在区间[139,151]的人数为 20,再由
(3)(2010 年湖北)将参加夏令营的 600 名学生编号为 001,002,…,600.采用系统抽样方法抽取一个容量为 50 的样本,且随机抽得的号码为 003,这 600 名学生分住在三个营区.从 001到 300 在第Ⅰ营区,从 301 到 495 在第Ⅱ营区,从 496 到 600
在第Ⅲ营区.三个营区被抽中的人数依次为(
A.26,16,8C.25,16,9
B.25,17,8D.24,17,9
解析:根据系统抽样的特点可知抽取的号码间隔为
12,故抽取的号码构成以 3 为首项,公差为 12 的等差数列.在第Ⅰ营区 001~300 号恰好有 25 组,故抽取 25 人,在第Ⅱ营区301~495 号有 195 人,共有 16 组多 3 人,因为抽取的第一个数是 3,所以Ⅱ营区共抽取 17 人,剩余 50-25-17=8 人,需从Ⅲ营区抽取.
【题后反思】当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方式叫做系统抽样.系统抽样也叫等距抽样.
【考法全练】(2020 年湖北武汉统测)某校有高中生1500人,现采用系统抽样法抽取 50 人作问卷调查,将高一、高二、高三学生(高一、高二、高三分别有学生 495 人、490 人、515 人)按 1,2,3,…,1500 编号,若第一组用简单随机抽样的方法抽取的号码为 23,
则所抽样本中高二学生的人数为(
解析:由系统抽样法知,按编号依次每 30 个编号作为一组,
高二学生编号为 496 到 985,在第 17 组到 33 组内,第 17 组编号为 16×30+23=503,为高二学生,第 33 组编号为 32×30+23=983,为高二学生,故所抽样本中高二学生的人数为 33-17+1=17.故选 C.
[例 2](1)(2017 年江苏)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为 200,400,300,100 件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取 60 件进行检验,则应从丙种型号的产品中抽取________件.
(2)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为 N,其中甲社区有驾驶员 96 人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为
12,21,25,43,则这四个社区驾驶员的总人数 N 为(
(3)已知某地区中小学生人数和近视情况分别如图 9-4-2(1)和图 9-4-2(2)所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的
高中生近视人数分别为((1)
解析:该地区中小学生总人数为 3500+2000+4500=
10 000,则样本容量为 10 000×2%=200,其中抽取的高中生近视人数为 2000×2%×50%=20.
(4)某校有行政人员、教学人员和教辅人员共 200 人,其中教学人员与教辅人员人数的比为 10∶1,行政人员有 24 人,现采取分层抽样的方法抽取容量为 50 的样本,那么教学人员应抽
解析:设有教辅人员 x 人,则 10x+x+24=200,
得 x=16,∴教学人员应抽取 16×10×
【题后反思】当总体由差异明显的几个部分组成,按某种特征抽样时,将总体中的各个个体分成互不交叉的层,然后按照一定的比例,从各层中独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫做分层抽样.在三种基本抽样中,分层抽样在高考中考查得最多,主要考查比例的运算.
【考法全练】(2014 年上海)某校高一、高二、高三分别有学生 1600 名、1200 名、800 名,为了解该校高中学生的牙齿健康状况,按各年级的学生人数进行分层抽样,若高三抽取20名学生,则高一、高二共抽取的学生人数为________.
⊙抽样方式与概率的结合
[例 3]某市某县区甲、乙、丙三所高中的高三文科学生共有
800 人,各学校男、女生人数如下表:
已知在三所高中的所有高三文科学生中随机抽取 1 人,抽
到乙高中女生的概率为 0.2.
(1)求表中 x 的值;
(2)某市第三次调研考试后,该县区决定从三所高中的所有高三文科学生中利用随机数表法抽取 100 人进行成绩统计分析,先将 800 人按 001,002,…,800 进行编号.如果从第 8 行第7 列的数开始向右读,请你依次写出最先抽取的 3 个人的编号;(下面摘取了随机数表中第 7 行至第 9 行)
(3)已知 y≥145,z≥145,求丙高中高三文科学生中的女生
=0.2,得 x=160,即表中 x 的值为 160.
(2)依题意,最先抽到的 3 个人的编号依次为 165,538,629.(3)设“丙高中高三文科学生中的女生比男生人数多 ”为事件 A,其中女生、男生数记为(y,z).由(1)知,x=160,则 y+z=300,且 y≥145,z≥145,y,z∈N,所以满足条件的(y,z)有(145,155),(146,154),(147,153),(148,152),(149,151),(150,150),(151,149),(152,148),(153,147),(154,146),(155,145),共 11 组,且每组出现的可能性相同.
其中事件 A 包含的基本事件(y,z),即满足 y>z 的有
(151,149),(152,148),(153,147),(154,146),(155,145),共
所以丙高中高三文科学生中的女生比男生人数多的概率
【策略指导】分层抽样是历年高考的重要考点之一,高考中常把分层抽样、频率分布、概率综合起来进行考查,反映了当前高考的命题方向.这类试题难度不大,但考查的知识面较为宽广,在解题中要注意准确使用所学知识,不然在一个点上的错误就会导致整体失误.
(2017 年广西南宁一模)某购物中心为了了解顾客使用新推出的某购物卡的顾客的年龄分布情况,随机调查了 100 位到购物中心购物的顾客年龄,并整理后画出频率分布直方图如图9-4-3 所示,年龄落在区间[55,65),[65,75),[75,85]内的频率之比为 4∶2∶1.
(1)求顾客年龄值落在区间[75,85]内的频率;
(2)拟利用分层抽样从年龄在[55,65),[65,75)的顾客中选取6 人召开一个座谈会,现从这 6 人中选出 2 人,求这两人在不同年龄组的概率.
解:(1)设顾客年龄值落在区间[75,85]内的频率为 x,则顾客年龄值落在区间[55,65),[65,75)内的频率分别为 4x 和 2x.依题意得(0.004+0.012+0.019+0.030)×10+4x+2x+x=1,解得 x=0.05,所以顾客年龄值落在区间[75,85]内的频率为
(2)方法一,根据题意得,需从年龄在[55,65),[65,75)中分别抽取 4 人和 2 人.设年龄在[55,65)的 4 人分别为 a,b,c,d,在[65,75)的 2 人分别为 m,n,则所抽取的结果共有 15 种:(a,b),(a,c),(a,d),(a,m),(a,n),(b,c),(b,d),(b,m),(b,n),(c,d),(c,m),(c,n),(d,m),(d,n),(m,n).
1.根据总体的情况采取适当的抽样方式,无论采用哪种抽样方式,必须保证在整个过程中每个个体被抽到的机会相等.其中简单随机抽样是最基本的抽样方法,是其他两种方法的基础,系统抽样和分层抽样在高考中是比较常考的.
相关课件
这是一份《高考总复习》数学 第九章 第11讲 条件概率与正态分布[配套课件],共51页。PPT课件主要包含了正态分布,分布越集中,x=μ,PABPA,为事件,题组一,走出误区,图9-11-1,答案AD,题组二等内容,欢迎下载使用。
这是一份《高考总复习》数学 第九章 第8讲 二项式定理[配套课件],共40页。
这是一份《高考总复习》数学 第九章 第7讲 计数原理与排列组合[配套课件],共49页。PPT课件主要包含了m1·m2··mn,排列与排列数,组合与组合数,题组一,走出误区,法是各不相同的,答案BCD,题组二,走进教材,选法共有等内容,欢迎下载使用。