高中数学人教A版 (2019)必修 第二册9.1 随机抽样综合训练题
展开9.1.2分层随机抽样+9.1.3获取数据的途径 (精讲)
一、必备知识
知识点1:分层随机抽样的概念及特点
(1)分层随机抽样的概念
一般地,按一个或多个变量把总体划分为若干个子总体,每个个体属于且仅属于一个子总体,在每个字总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
(2)分层随机抽样的特点
①从分层随机抽样的定义可看出,分层随机抽样适用于总体由差异明显的几个部分组成的情况.
②分层随机抽样是等可能抽样.用分层随机抽样从个体数为的总体中抽取一个容量为的样本时,在整个抽样过程中,每个个体被抽到的可能性相等,都等于.
③分层随机抽样是建立在简单随机抽样的基础之上的,由于它充分利用了已知信息,因此利用它获取的样本更具有代表注,更能充分反映总体的情况,在实践中的应用也更广泛.
(3)对分层抽样的“层”的理解
在分层抽样中,将具有某种共同特征的对象归为同一层,不同层之间的对象要有明显的差异,并且这些特征的差异应该是对所研究的问题有影响的例如,要从某中学抽取一些学生构成一个样本,如果研究他们的视力情况,那么应该按照年龄分层,或按照年级分层,都是合理的分层方式;但如果按照性别分层,就不合适了,因为性别对视力的影响可能是很小的,如果研究他们对篮球运动的兴趣,那么按照性别分层就比按年龄或年级分层会更合理在实际中,对于一些复杂的问题,可能还需要对层内再进一步细分层.
知识点2:分层随机抽样的步骤
①根据己经掌握的信息,将总体分成互不相交的层;
②根据总体中的个体数和样本量计算抽样比;
③确定第层应该抽取的个体数目(为第层所包含的个体数),使得各之和为;
④在各个层中,按步骤③中确定的数目在各层中随机抽取个体,合在一起得到容量为的样本.
知识点3:简单随机抽样与分层随机抽样的比较
类别 | 共同点 | 各自特点 | 相互联系 | 适用范围 |
简单随机抽样 | 抽样过程中每个个体被抽取的概率是相同的 | 从总体中逐个抽取 |
| 总体中的个体数较少 |
分层抽样 | 将总体分成几层,分层进行抽取 | 各层抽样时采用简单随机抽样或系统 | 总体由差异明显的几部分组成 |
知识点4:分层随机抽样的平均数
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为和,抽取的样本量分别为和.我们用表示第1层各个个体的变量值,用表示第1层样本的各个个体的变量值;用表示第2层各个个体的变量值,用表示第2层样本的各个个体的变量值,则第1层的总体平均数和样本平均数分别为
.
第2层的总体平均数和样本平均数分别为
.
总体平均数和样本平均数分别为
.
由于用第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用.
知识点5:获取数据的途径
在实际统计调查中,一般先要确定调查的目的、对象,即统计调查要解决的问题和需要调查的总体;还要确定好调查的项目,也就是要统计的变量.接下来就开始收集数据,收集数据的基本途径如下:
(1)通过调查获取数据
设计调查问卷:
调查问卷一般由一组有目的、有系统、有顺序的题目组成.问题由调查人员根据调查的目的、项目进行设计
设计调查问卷的注意事项:
①问题要具体,有针对性,使受调查者能够容易作答.
②语言简单、准确,含义清楚,避免出现有歧义或意思含混的句子
③题目不能出现引导受调查者答题倾向的语句
④设计问题时要注意“如何得到敏感性问题的诚实回答”.
(2)通过试验获取数据
根据调查项目的要求设计一些合适的试验,能够直接地获得样本数据.试验时要注意准备好试验用具(或组织好观测的对象)、指定专门的记录人员等.做试验通常能得到可靠的数据资料,但需花费的人力、物力、时间较多,有时带有破坏性.
(3)通过观察获取数据
对于有些现象,不能用试验或者抽样等方法来获取数据,只能通过长久持续的观察获取,主要是一些自然现象,如地震、降水、大气污染、宇宙射线等.一般地,通过观察自然现象所获取的数据性质比较复杂,其中蕴含着所观察现象的本质信息,需要通过统计学理论和方法来挖掘.
(4)通过查询获得数据
有些数据资料不容易直接调查得到,这时可以通过查阅统计年鉴、图书馆文献等方法获得所需或相关的数据,比如全国历次人口普查的数据都可以在统计年鉴中查阅到;还可以通过互联网上的资源得到数据资料.
二、重点题型
题型1: 分层随机抽样概念的理解及应用
1.(2022·全国·高一课时练习)为了保证分层随机抽样时每个个体被等可能地抽取,必须要求( )
A.每层等可能抽取
B.每层抽取的个体数相等
C.每层抽取的个体数可以不一样多,但必须满足抽取个个体(其中i是层的序号,k是总层数,n为抽取的样本量,Ni是第i层中的个体数,N是总样本量)
D.只要抽取的样本量一定,每层抽取的个体数没有限制
【答案】C
【详解】
分层随机抽样时,在各层中按层中所含个体在总体中所占的比例进行抽样,
A中,虽然每层等可能地抽样,但是没有指明各层中应抽取几个个体,故A不正确;
B中,由于每层的个体数不一定相等,每层抽取同样多的个体数,
显然从总体来看,各层的个体被抽取的可能性就不相等了,因此B也不正确;
C中,对于第i层的每个个体,它被抽到的可能性与层数i无关,
即对于每个个体来说,被抽取为样本的可能性是相同的,故C正确;
D显然不正确.
故选:C.
2.(2022·全国·)分层随机抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体等可能抽样,必须进行( )
A.每层等可能抽样 B.每层可以不等可能抽样
C.所有层按同一抽样比等可能抽样 D.所有层抽取的个体数量相同
【答案】C
【详解】
保证每个个体等可能入样是三种基本抽样方式的共同特征,为了保证这一点,分层随机抽样时必须在所有层都按同一抽样比等可能抽取.
故选:.
3.(2022·全国·高一课时练习)现要完成下列3项抽样调查:
①从15种疫苗中抽取5种检测是否合格.②某中学共有480名教职工,其中一线教师360名,行政人员48名,后勤人员72名.为了解教职工对学校校务公开方面的意见,拟抽取一个容量为20的样本,③在中秋节前,某食品监督局从某品牌的10盒月饼中随机抽取3盒进行食品卫生检查.较为合理的抽样方法是( )
A.①③简单随机抽样,②分层随机抽样 B.①②简单随机抽样,③分层随机抽样
C.②③简单随机抽样,①分层随机抽样 D.①简单随机抽样,②③分层随机抽样
【答案】A
【详解】
①③中总体数量较少,且个体没有明显差别,适合用简单随机抽样;②中总体是由有明显差异的几部分组成的,适合用分层随机抽样,
故选:A.
题型2:分层随机抽样中的相关运算
1.(2022·广西·鹿寨县鹿寨中学高二阶段练习(文))2022年北京冬季奥运会将在北京和张家口两个城市举行,某校为此举办了主题为“迎冬奥运,冬奥知识竞赛”的活动,已知该学校高一学生有600人,高二学生有650人,高三学生有700人,现采用分层抽样的方法从三个年级抽取39人参加竞赛活动,则高二年级应该抽取( )
A.12人 B.13人 C.14人 D.39人
【答案】B
【详解】
高二年级应该抽取人,
故选:B.
2.(2022·陕西·西安中学高二期中(理))2022年9月在西安举行了第十四届全运会,西安中学体育馆承办了男子排球U20的比赛,这是全运会历史上第一次进入一所高中校园.为了让中学生也能在家门口看全运,浓厚校园体育氛围,学校采用分层抽样的方法从高一1200人、高二1450人、高三n人中,抽取80人观看排球决赛,已知高一被抽取的人数为24,那么高三年级人数为( )
A.1250 B.1300 C.1350 D.1400
【答案】C
【详解】
利用分层抽样的方法从高一1200人、高二1450人、高三n人中,抽取80人观看排球决赛,
则抽取比例为,又高一被抽取的人数为24,即=,解得n=1350.
故选:C.
3.(2022·浙江宁波·高一期末)某小区有人自愿接种新冠疫苗,其中岁的有人,岁的有人,其余为符合接种条件的其他年龄段的居民.在一项接种疫苗的追踪调查中,要用分层抽样的方法从该小区名接种疫苗的人群中抽取人,则从符合接种条件的其他年龄段的居民中抽取的人数是( )
A. B. C. D.
【答案】C
【详解】
解:依题意从其余符合接种条件的其它年龄段的居民中抽取的人数为:.
故选:.
4.(2022·全国·高一课时练习)为践行“绿水青山就是金山银山”的发展理念,某城区对辖区内,,三类行业共200个单位的生态环境治理成效进行了考核评估,考评分数达到80分及其以上的单位被称为“星级”环保单位,未达到80分的单位被称为“非星级”环保单位,现通过分层抽样的方法抽取了这三类行业的20个单位,其考评分数如下:
类行业:85,82,77,78,83,87;
类行业:76,67,80,85,79,81;
类行业:87,89,76,86,75,84,90,82.
则该城区这三类行业中每类行业的单位个数分别为______.
【答案】60,60,80
【详解】
由题意,得抽取的,,三类行业单位个数之比为.
由分层抽样的定义,有
类行业的单位个数为,
类行业的单位个数为,
类行业的单位个数为,
故该城区,,三类行业中每类行业的单位个数分别为60,60,80.
5.(2022·广西河池·高二阶段练习(文))某校有高一学生名,其中男生数与女生数之比为,为了解学生的视力情况,现要求按分层抽样的方法抽取一个样本容量为的样本,若样本中男生比女生多人,则_______.
【答案】
【详解】
依题意可得,解得.
故答案为1320
6.(2022·江西省都昌县第二中学高二阶段练习(文))某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为时,若采用系统抽样法,则需要剔除1个个体,那么样本容量为________.
【答案】6
【详解】
n为18+12+6=36的正约数,因为18:12:6=3:2:1,所以n为6的倍数,因此
因为当样本容量为时,若采用系统抽样法,则需要剔除1个个体,所以n+1为35的正约数,因此
题型3:分层随机抽样的方案设计
1.(2022·全国·高一课时练习)某所学校有小学部、初中部和高中部,在校小学生、初中生和高中生的人数之比为5∶2∶3,且已知初中生有800人.现要从这所学校中抽取1个容量为80的样本以了解他们对某一问题的看法,应采用什么抽样方法?从小学部、初中部及高中部各抽取多少名学生?总体上看,平均多少名学生中抽取到1名学生?
【答案】答案见解析
【详解】
因为不同学段对问题的看法具有差异性,所以应采用分层抽样的方法.
因为小学生、初中生和高中生的人数之比为5∶2∶3,且已知初中生有800人,故总人数为,
因为要抽取1个容量为80的样本,则抽样比为,
所以从小学部抽取人,初中部抽取人,
高中部抽取人,
由抽样比为可得总体上看,平均50名学生中抽取到1名学生.
2.(2022·全国·高一课时练习)某中学举行了体育运动会,同时进行了全校精神文明擂台赛,为了解这次活动在全校师生中产生的影响,分别对全校500名教职工、3000名初中生、4000名高中生进行问卷调查.
(1)如果要在所有问卷中抽出120份用于评估,请说明如何抽取才能得到比较客观的评估结论,并写出抽样过程.
(2)要从3000份初中生的问卷中抽取一个容量为48的样本,如果采用简单随机抽样,应选什么方法?请说明理由.
【答案】
(1)采取分层抽样的方法,过程见解析
(2)采用随机数法,理由见解析
(1)由于总体容量较大,这次活动对教职工、初中生、高中生产生的影响差异较大,故采取分层抽样的方法进行抽样才能得到比较客观的评估结论.
因为样本容量为120,总体容量为,
则抽样比为,,,,
所以在教职工、初中生、高中生中抽取的个体数分别是8,48,64.
分层抽样的步骤如下:
①分层:分为教职工、初中生、高中生,共三层;
②确定每层抽取个体的个数:在教职工、初中生、高中生中抽取的个体数分别是8,48,64;
③各层分别按简单随机抽样的方法抽取样本;
④综合每层抽取的个体,组成样本.
这样便完成了整个抽样过程,就能得到比较客观的评估结论;
(2)简单随机抽样有两种方法:抽签法和随机数法.
若用抽签法,则要做3000个号签,费时费力,因此应采用随机数法抽取样本.
题型4:分层随机抽样的平均数
1.(2022·安徽·合肥艺术中学 )某校高一年级共有学生500人,其中男生300人,女生200人,按男女生比例进行分层随机抽样,样本容量为进行身高测量(单位,男生样本30人的身高平均数为,女生样本20人的身高平均数为,则可估计该校高一年级学生的平均身高为__________.
【答案】
【详解】
解:平均身高为.
故答案为:166.6.
2.(2022·全国·高一课时练习)在考察某高中的学生身高时,采用分层随机抽样的方法,得到了男生身高的平均数为172,女生身高的平均数为162.
(1)如果没有其他信息,怎样估计总体平均数?
(2)如果知道抽取的样本中,男生有20人,女生有15人,怎样估计总体平均数?
【答案】
(1)估计总体平均数为,详解见解析;
(2)估计总体平均数为,详解见解析
(1)
作为估计来说,我们可以选择男生(或女生)样本的平均数作为总体对应值的估计,但这样的选择没有充分利用已有的数据,显然不够好,另外一种估计的方法是取每一层样本平均数作为总体的估计,即估计总体平均数为.
(2)
由加权平均数公式代入,得样本的平均数为,因此估计总体平均数为.
3.(2022·全国·)对某中学高一年级学生身高(单位:cm)的调查中,采用分层随机抽样的方法,抽取了男生23人,其身高的平均数和方差分别为170.6和12.59,抽取了女生27人,其身高的平均数和方差分别为160.6和38.62,你能由这些数据计算出样本的平均数和方差,并估计高一年级全体学生身高的平均数?
【答案】样本的平均数为165.2,方差为51.4862;估计身高的平均数为165.2
【详解】
把样本中23名男生身高的平均数记为,;把样本中27名女生身高的平均数记为,,把样本的平均数记为,则,,
因此样本的平均数为165.2,可估计高一年级全体学生身高的平均数为165.2
4.(2020·全国·)某学校在上报《国家学生体质健康标准》高一年级学生的肺活量单项数据中,采用样本量按比例分配的分层随机抽样方法.如果不知道样本数据,只知道抽取了男生20人,其肺活量平均数,方差为10;抽取了女生30人,其肺活量平均数为,方差为20,估计高一年级全体学生肺活量的平均数.
【答案】平均数为2700ml
【详解】
把男生样本记为,其平均数记为,;把女生样本记为,其平均数记为,;把总样本数据的平均数记为,.
由,,根据按比例分配分层随机抽样总样本平均数与各层样本平均数的关系,可得总样本平均数为.
据此估计高一年级全体学生肺活量的平均数为,方差为60280.
5.(2022·全国·)高二年级有男生490人,女生510人,张华按男生、女生进行分层,通过分层随机抽样的方法,得到男生、女生的平均身高分别为170.2cm和160.8cm.
(1)如果张华在各层中按比例分配样本,总样本量为100,那么在男生、女生中分别抽取了多少名?在这种情况下,请估计高二年级全体学生的平均身高.
(2)如果张华从男生、女生中抽取的样本量分别为30和70,那么在这种情况下,如何估计高二年级全体学生的平均身高更合理?
【答案】(1)男生49人,女生51人,平均身高165.4cm(2)见解析
【详解】
(1)抽取男生人数为,抽取女生人数为.
高二年级全体学生的平均身高估计为(cm).
(2)仍按(1)方式进行估计,即(cm).
题型5:两种抽样方法的选取及综合应用
1.(2022·云南·弥勒市一中高一阶段练习)(1)某小区有800户家庭,其中高收入家庭200户,中等收入家庭480户,低收入家庭120户,为了解有关家用轿车购买力的某个指标,从中抽取一个容量为100的样本;(2)从10名学生中抽取3名参加座谈会.问题和抽样方法配对正确的是( )
A.(1)简单随机抽样法,(2)分层随机抽样法
B.(1)分层随机抽样法,(2)简单随机抽样法
C.(1)简单随机抽样法,(2)简单随机抽样法
D.(1)分层随机抽样法,(2)分层随机抽样法
【答案】B
【详解】
解:对于(1),该小区的家庭收入差别显著,故采取分层抽样的方法更适合,
对于(2),由于是从10名学生中抽取3名参加座谈会,故适合简单随机抽样.
故选:B
2.(2022·全国·高一课时练习)完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户,调查社会购买能力的某项指标;②从某中学的15名艺术特长生中选出3名调查学习负担情况.宜采用的抽样方法依次是( )
A.①用简单随机抽样,②用分层抽样
B.①用分层抽样,②用简单随机抽样
C.①②都用简单随机抽样
D.①②都用分层抽样
【答案】B
【详解】
因为社会购买能力的某项指标受到家庭收入的影响,而社区中各个家庭收入差别明显,所以①用分层抽样法;
从某中学的15名艺术特长生中选出3名调查学习负担情况,个体之间差别不大,且总体和样本容量较小,所以②用简单随机抽样法.
故选:B.
3.(2022·江苏·高三专题练习)现要完成下列两项抽样调查:①从20罐奶粉中抽取4罐进行食品安全卫生检查;②从某社区100户高收入家庭,270户中等收入家庭,80户低收入家庭中选出45户进行消费水平调查.较为合理的抽样方法是( )
A.①简单随机抽样,②简单随机抽样 B.①分层随机抽样,②分层随机抽样
C.①分层随机抽样,②简单随机抽样 D.①简单随机抽样,②分层随机抽样
【答案】D
【详解】
①中个体数量较少,且个体间无明显差异,故采用简单随机抽样;
②中高收入家庭、中等收入家庭和低收入家庭的消费水平差异明显,故采用分层随机抽样.
故选:D.
4.(2022·四川省广安代市中学校高二阶段练习(理))现要完成下列两项调查:①从某社区70户高收入家庭、335户中等收入家庭、95户低收入家庭中选出100户,调查社会购买能力的某项指标;②从某中学的15名艺术特长生中选出3名调查学习负担情况.这两项调查宜采用的抽样方法是( )
A.①简单随机抽样,②分层抽样 B.①分层抽样,②简单随机抽样
C.①②都用简单随机抽样 D.①②都用分层抽样
【答案】B
【详解】
在①中,由于购买能力与收入有关,应该采用分层抽样;在②中,由于个体没有明显差别,而且数目较少,应该采用简单随机抽样.
故选:B.
5.(2022·河北省盐山中学高一阶段练习)要完成下列两项调查:(1)某社区有100户高收入家庭,210户中等收入家庭,90户低收入家庭,从中抽取100户调查有关消费购买力的某项指标;(2)从某中学高二年级的10名体育特长生中抽取3人调查学习情况应采用的抽样方法分别是( )
A.(1)用简单随机抽样,(2)用分层随机抽样
B.(1)用分层随机抽样,(2)用其他抽样方法
C.(1)用分层随机抽样,(2)用简单随机抽样
D.(1)(2)都用分层随机抽样
【答案】C
【详解】
因为有关消费购买力的某项指标受家庭收入的影响,而社区家庭收入差距明显,所以①用分层抽样;
从10名体育特长生中抽取3人调查学习情况,个体之间差别不大,且总体和样本容量较小,所以②用简单随机抽样.
故选:C
高中数学人教A版 (2019)必修 第二册第九章 统计9.1 随机抽样练习: 这是一份高中数学人教A版 (2019)必修 第二册<a href="/sx/tb_c4000309_t7/?tag_id=28" target="_blank">第九章 统计9.1 随机抽样练习</a>,共31页。试卷主要包含了5%,中年人占37等内容,欢迎下载使用。
2020-2021学年8.5 空间直线、平面的平行复习练习题: 这是一份2020-2021学年8.5 空间直线、平面的平行复习练习题,文件包含853平面与平面平行精练解析版-精讲精练2022-2023学年高一数学同步精讲精练人教A版2019必修第二册docx、853平面与平面平行精讲解析版docx、853平面与平面平行精讲原卷版docx、853平面与平面平行精练原卷版-精讲精练2022-2023学年高一数学同步精讲精练人教A版2019必修第二册docx等4份试卷配套教学资源,其中试卷共43页, 欢迎下载使用。
人教A版 (2019)必修 第二册8.4 空间点、直线、平面之间的位置关系巩固练习: 这是一份人教A版 (2019)必修 第二册8.4 空间点、直线、平面之间的位置关系巩固练习,文件包含851直线与直线平行精练解析版-精讲精练2022-2023学年高一数学同步精讲精练人教A版2019必修第二册docx、851直线与直线平行精讲解析版docx、851直线与直线平行精练原卷版-精讲精练2022-2023学年高一数学同步精讲精练人教A版2019必修第二册docx、851直线与直线平行精讲原卷版docx等4份试卷配套教学资源,其中试卷共27页, 欢迎下载使用。