2023届高考人教B版数学一轮复习课件(适用于新高考新教材) 第十章 概率、随机变量及其分布 10.1 随机抽样、用样本估计总体
展开
这是一份2023届高考人教B版数学一轮复习课件(适用于新高考新教材) 第十章 概率、随机变量及其分布 10.1 随机抽样、用样本估计总体,共60页。PPT课件主要包含了内容索引,必备知识预案自诊,知识梳理,统计的有关概念,对象全体,每个对象,个体数目,每个个体,抽签法,随机数表法等内容,欢迎下载使用。
素养提升微专题11——实际应用问题中的数据分析素养
2.普查与抽样调查一般地,对总体中 都进行考察的方法称为普查(也称全面调查),只抽取 进行考察的方法称为抽样调查.
3.简单随机抽样(1)定义:一般地,简单随机抽样(也称纯随机抽样)就是从总体中不加任何 、划类、 等,完全随机地抽取个体. (2)两种常见方法:① ;② . 4.分层抽样一般地,如果相对于要考察的问题来说,总体可以分成 的、 的几部分时,每一部分可称为层,在各层中按 进行随机抽样的方法称为分层随机抽样(简称分层抽样).
温馨提示分层抽样又称类型抽样,应用分层抽样应遵循以下要求:(1)分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则.(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比跟样本容量与总体容量的比相等.
6.数据的直观表示(1)柱形图:也称为 ,可以形象地比较各种数据之间的数量关系. 一般地,柱形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,柱形图中每一矩形都是 的. (2)折线图:一般地,如果数据是随 变化的,想了解数据的变化情况,可将数据用折线图来表示. (3)扇形图:也称为 、 ,可以形象地表示出各部分数据在全部数据中所占的 情况.扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成 . (4)茎叶图:茎叶图的中间像植物的茎,两边像植物茎上生长的叶子.茎叶图中,所有的茎都 排列,而叶沿 方向排列.
7.频数分布直方图与频率分布直方图(1)画法:①找出最值,计算极差;②合理分组,确定区间;③整理数据;④作出有关图示.(2)频数分布直方图的纵坐标是频数,每一组数对应的矩形高度与频数成正比;频率分布直方图的纵坐标是 ,每一组数对应的矩形高度与 成正比,而且每个矩形的面积等于这一组数对应的 ,从而可知频率分布直方图中,所有矩形的面积之和为 . (3)将每个矩形上面一边的 用线段连接起来可以得到频数分布折线图和频率分布折线图.
8.分层抽样下用样本的数字特征估计总体的数字特征
9.用样本的分布估计总体的分布同数字特征的估计一样,分布的估计一般也有误差.如果总体在每一个分组的频率记为:π1,π2,…,πn,样本在每一组对应的频率记为p1,p2,…,pn,一般来说,同样,当样本的容量越来越大时,上式很小的可能性将 .
在频率分布直方图中:(1)最高的小矩形底边中点的横坐标即是众数;(2)中位数左边和右边的所有小矩形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标之和.
1.判断下列结论是否正确,正确的画“√”,错误的画“×”.(1)在简单随机抽样中,某一个个体被抽到的可能性与第几次抽取有关,第一次被抽到的可能性最大.( )(2)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( )(3)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数估计值.( )
2.为客观了解上海市民家庭存书量,上海市统计局社情民意调查中心通过电话调查系统开展专项调查,成功访问了2 007位市民,在这项调查中,总体、样本及样本的容量分别是( )A.总体是上海市民家庭总数量,样本是2 007位市民家庭的存书量,样本的容量是2 007B.总体是上海市民家庭的存书量,样本是2 007位市民家庭的存书量,样本的容量是2 007C.总体是上海市民家庭的存书量,样本是2 007位市民,样本的容量是2 007D.总体是上海市民家庭总数量,样本是2 007位市民,样本的容量是2 007
答案 B 解析根据题目可知,总体是上海市民家庭的存书量,样本是2 007位市民家庭的存书量,样本的容量是2 007,故选B.
3.(2020北京101中学高三月考)某同学对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A.46,45,56B.46,45,53C.47,45,56D.45,47,53
答案A 解析中位数是中间两数的平均数,即 =46,众数是45,极差为68-12=56.故选A.
4.(2020黑龙江大庆高三三模)在某次数学测验后,将参加考试的500名学生的数学成绩制成频率分布直方图(如图),则在该次测验中成绩不低于100分的人数是( )A.210D.195
答案 C 解析由频率分布直方图可知,低于100分的人数的频率为(0.012+0.018+0.030)×10=0.6,所以低于100分的人数为500×0.6=300,则不低于100分的人数为500-300=200.
5.某同学在7天内每天参加体育锻炼的时间(单位:分钟)如下:65,65,66,74,73,81,80,则它们的第三四分位数是 .
答案 80 解析从小到大排序为65,65,66,73,74,80,81,第三四分位数即75%分位数,7×75%=5.25,所以第三四分位数是第6项数据80.
【例1】 (1)某校高一共有10个班,编号01至10,某项调查要从中抽取三个班作为样本,现用抽签法抽取样本,每次抽取一个号码,共抽3次,设五班第一次被抽到的可能性为a,第二次被抽到的可能性为b,则( )
(2)(2020山西太原高三质检)某口罩生产工厂为了了解口罩的质量,现将生产的50个口罩编号为01,02,…,50,利用如下随机数表从中抽取10个进行检测,若从下表中第1行第7列的数字开始向右依次读取2个数据作为1个编号,则被抽取的第8个个体的编号为( )A.18B.11C.50D.17
72 84 71 14 35 19 11 58 49 26 50 11 17 17 76 86 31 57 20 18 95 60 78 46 7588 78 28 16 84 13 52 53 94 53 75 45 69 30 96 73 89 65 70 31 99 14 43 48 76
答案 (1)D (2)D 解析 (1)由简单随机抽样的定义知,在每次抽取中每个个体都有相同的可能性被抽到,故五班在每次抽样中被抽到的可能性都是(2)随机数表中第1行第7列的数字为1,所以第一个抽取的为14,被抽取的10个个体的编号依次为14,35,19,11,49,26,50,17,31,20,所以被抽取的第8个个体编号为17.
解题心得1.简单随机抽样需满足:(1)被抽取的样本总体的个体数有限;(2)逐个抽取;(3)等可能抽取.2.应用随机数法的两个关键点:(1)确定以表中的哪个数(哪行哪列)为起点,以哪个方向为读数的方向;(2)读数时注意结合编号特点进行读取,若编号为两位数字,则两位两位地读取,若编号为三位数字,则三位三位地读取,有超过总体号码或出现重复号码的数字舍去,这样继续下去,直到获取整个样本.
对点训练1(1)在简单随机抽样中,某一个个体被抽到的可能性( )A.与第n次有关,第一次可能性最大B.与第n次有关,第一次可能性最小C.与第n次无关,与抽取的第n个样本有关D.与第n次无关,每次可能性相等
(2)某工厂利用随机数表对生产的600个零件进行抽样测试,先将600个零件进行编号,编号分别为001,002,…,599,600,从中抽取60个样本,下面提供随机数表的第4行到第6行:32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78 90 56 4284 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 0432 56 78 08 43 67 89 53 55 77 34 89 94 83 74 36 53 55 28 32 45 77 89 23 45若从表中第6行第6列开始向右依次读取3个数字,则得到的第5个样本编号是( )A.522B.324 C.528D.535
【例2】 (1)某电视台在因特网上就观众对其某一节目的喜爱程度进行了调查,参加调查的一共有20 000人,其中各种态度对应的人数如下表所示:
电视台为了了解观众的具体想法和意见,打算从中抽取100人进行详细的调查,为此要进行分层随机抽样,那么在分层随机抽样时,每类人中应抽取的人数分别为( )A.25,25,25,25B.48,72,64,16C.20,40,30,10D.24,36,32,8
(2)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层随机抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 件. (3)我国古代数学专著《九章算术》中有一衰分问题:今有北乡八千一百人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,则北乡遣( )A.104人B.108人C.112人D.120人
答案 (1)D (2)18 (3)B
解题心得分层随机抽样问题类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之:根据分层随机抽样就是按比例抽样,列比例式进行计算.(3)确定是否应用分层随机抽样:分层随机抽样适用于总体中个体差异较大的情况.
对点训练2(1)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种,10种,30种,20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层随机抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是 . (2)某林场共有白猫与黑猫1 000只,其中白猫比黑猫多400只,为调查猫的生长情况,采用分层随机抽样的方法抽取一个容量为n的样本,若样本中黑猫有6只,则n= . (3)我国南宋数学家秦九韶所著《数书九章》中有“米谷粒分”问题:粮仓开仓收粮,粮农送来米512石,验得米内夹谷,抽样取米一把,数得216粒内夹谷27粒,则这批米内夹谷约( )A.128石 B.64石C.256石D.32石
答案 (1)6 (2)20 (3)B
【例3】 (多选)在发生公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.过去10日,甲、乙、丙、丁四地新增疑似病例数据信息如下,一定符合没有发生大规模群体感染标志的是( )A.甲地:中位数为2,极差为5B.乙地:总体平均数为2,众数为2C.丙地:总体平均数为1,总体方差大于0D.丁地:总体平均数为2,总体方差为3
答案 AD 解析因为甲地中位数为2,极差为5,故最大值不会大于2+5=7,故A正确;若乙地过去10日分别为0,0,0,2,2,2,2,2,2,8,则满足总体平均数为2,众数为2,但不满足每天新增疑似病例不超过7人,故B错误;若丙地过去10日分别为0,0,0,0,0,0,0,0,1,9,则满足总体平均数为1,总体方差大于0,但不满足每天新增疑似病例不超过7人,故C错误;若丁地至少有一天疑似病例超过7人,则方差大于 (8-2)2=3.6>3,故连续10天,每天新增疑似病例不超过7人,故D正确.故选AD.
解题心得1.众数、中位数、平均数及方差的意义(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述;(2)平均数、中位数、众数描述一组数据的集中趋势,方差和标准差描述其波动大小.2.平均数、方差的公式推广(2)若数据x1,x2,…,xn的方差为s2,则②数据x1+b,x2+b,…,xn+b的方差也为s2;③数据ax1,ax2,…,axn的方差为a2s2.
对点训练3一家保险公司决定对推销员实行目标管理,按以往月销售额(单位:千元)把推销员分为甲、乙、丙三个层次,各层次人数如下:(1)为了了解推销员对目标设定的意见,决定从甲、乙、丙三个层次中采取比例分配的分层随机抽样抽取30人进行座谈,请计算甲、乙、丙三个层次各应抽取多少人?
(2)确定销售目标是否合适,直接影响到公司的经济效益,如果目标定得过高,多数推销员完不成任务,会使推销员失去信心;如果目标定得太低,将不利于挖掘推销员的工作潜力.现已知按上面的方法抽取了部分推销员的月销售额(单位:千元):14.2,15.8,17.7,19.2,22.4,18.2,16.4,21.8,15.6,24.6,23.2,19.8,12.8,13.5,16.3,11.5,13.6,14.9,15.7,16.2,17.0,17.2,17.8,18.0,18.4,19.5,20.5,22.1,24.0,24.8.公司为了使70%的推销员能够完成销售目标,根据这组样本数据,应将销售目标定为多少比较合理?
(2)将30个数据按照从小到大的顺序进行排序,可得:11.5,12.8,13.5,13.6,14.2,14.9,15.6,15.7,15.8,16.2,16.3,16.4,17.0,17.2,17.7,17.8,18.0,18.2,18.4,19.2,19.5,19.8,20.5,21.8,22.1,22.4,23.2,24.0,24.6,24.8,为使得70%的销售员完成目标,只需求出第30百分位数即可.由30×30%=9可知样本数据的第30百分位数为第9项与第10项数据的
【例4】 军训时,甲、乙两名同学进行射击比赛,共比赛10场,每场比赛各射击四次,且用每场击中环数之和作为该场比赛的成绩.数学老师将甲、乙两名同学的10场比赛成绩绘成如图所示的茎叶图,并给出下列4个结论:①甲的平均成绩比乙的平均成绩高;②甲的成绩的极差是29;③乙的成绩的众数是21;④乙的成绩的中位数是18.则这4个结论中,正确结论的个数为( )A.1B.2C.3D.4
答案 C 解析根据茎叶图知甲的平均成绩为21.4,乙的平均成绩为16.9,因此①对;甲的成绩的极差是37-8=29,②对;乙的成绩的众数是21,③对;乙的成绩的中位数是 =18.5,④错,故选C.
解题心得(1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.
对点训练4某中学数学竞赛培训班共有10人,分为甲,乙两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,已知甲组5名同学成绩的平均数为81,乙组5名同学成绩的中位数为73,则x-y的值为( )A.2B.-2C.3D.-3
解析根据茎叶图中的数据,得甲组5名同学成绩的平均数为 ×(72+77+80+x+86+90)=81,解得x=0;又乙组5名同学的中位数为73,则y=3;x-y=0-3=-3.故选D.
【例5】 某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(单位:吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照
[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(单位:吨),估计x的值,并说明理由.
解 (1)由频率分布直方图知,月均用水量在[0,0.5)内的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]内的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1)可知,100位居民中每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.根据样本中的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73
相关课件
这是一份2024届高考数学一轮复习(新教材人教A版强基版)第十章计数原理、概率、随机变量及其分布10.1两个计数原理课件,共60页。PPT课件主要包含了落实主干知识,探究核心题型,课时精练,m+n,m×n等内容,欢迎下载使用。
这是一份2023届高考人教B版数学一轮复习课件(适用于新高考新教材) 第十章 概率、随机变量及其分布 10.6 离散型随机变量的数字特征 最后俩没粘答案,共60页。PPT课件主要包含了内容索引,必备知识预案自诊,关键能力学案突破,知识梳理,平均取值,aEx+b,a2DX,p1-p,np1-p,常用结论等内容,欢迎下载使用。
这是一份2023届高考人教B版数学一轮复习课件(适用于新高考新教材) 第十章 概率、随机变量及其分布 10.3 随机事件的独立性、条件概率与全概率公式,共38页。PPT课件主要包含了内容索引,必备知识预案自诊,知识梳理,也相互独立,考点自诊,答案B,答案C,关键能力学案突破等内容,欢迎下载使用。