年终活动
搜索
    上传资料 赚现金
    英语朗读宝

    (苏教版2019必修第二册)高一数学寒假精品课第12讲统计(原卷版+解析)

    立即下载
    加入资料篮
    (苏教版2019必修第二册)高一数学寒假精品课第12讲统计(原卷版+解析)第1页
    (苏教版2019必修第二册)高一数学寒假精品课第12讲统计(原卷版+解析)第2页
    (苏教版2019必修第二册)高一数学寒假精品课第12讲统计(原卷版+解析)第3页
    还剩53页未读, 继续阅读
    下载需要10学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    (苏教版2019必修第二册)高一数学寒假精品课第12讲统计(原卷版+解析)

    展开

    这是一份(苏教版2019必修第二册)高一数学寒假精品课第12讲统计(原卷版+解析),共56页。
    1.掌握抽样的方法。
    2.会根据统计图表求解相关问题。
    3.了解用样本估计总体的思想。
    4.掌握样本数字特征的求解。
    【基础知识】
    一.总体与样本
    1.总体与样本的概念:
    考察问题涉及的对象的全体是总体,总体中每个对象都是个体,抽取的部分对象组成总体的一个样本,一个样本中包含的个体数目是样本容量
    2.普查与抽样的概念:
    一般地,对总体中每个个体都进行考查地方法称为普查(也称为全面调查),只抽取样本进行考查的方法称为抽样调查。
    二.简单随机抽样
    1.简单随机抽样的定义:
    一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本.
    2.简单随机抽样必须具备下列特点:
    (1)简单随机抽样要求被抽取的样本的总体个数N是有限的.
    (2)简单随机样本数n小于等于样本总体的个数N.
    (3)简单随机样本是从总体中逐个抽取的.
    (4)简单随机抽样是一种不放回的抽样.
    (5)简单随机抽样的每个个体入样的可能性均为.
    常见的简单随机抽样方法有抽签法和随机数表法.
    3.抽签法的定义.
    一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.
    4.抽签法的一般步骤:
    (1)将总体中的N个个体编号(号码从1到N);
    (2)将这N个号码写在形状、大小相同的号签上;
    (3)将号签放在同一箱中,并搅拌均匀;
    (4)从箱中每次抽出1个号签,并记录其编号,连续抽出n次;
    (5)将总体中与抽到的号签编号一致的n个个体取出.
    5.随机数表
    随机数表是由随机数(通常为0,1,2,…,9)相乘的数表,表中的每一个位置出现的数是随机的下列是一个随机数表的一部分.
    6.随机数表进行简单随机抽样的一般步骤为:
    (1)对总体进行编号;
    (2)在随机数表中任意指定一个开始选取的位置,位置的确定可以闭着眼睛用手指随机确定,也可用其他方式随机确定;
    (3)按照一定规则选取编号.
    (4)按照得到的编号,找到对应的个体.
    三.分层抽样
    1.分层抽样的定义
    一般地,如果相对于要考察的问题来说,总体可以分成的,的几部分时,每一部分可称为,在各层中按层在总体中所占进行的方法称为分层随机抽样(简称分层抽样)
    注意:分层抽样又称类型抽样,应用分层抽样应遵循以下要求:
    (1)分层:将相似的个体归人一类,即为一层,分层要求每层的各个个体,即遵循不重复、不遗漏的原则.
    (2)分层抽样为保证每个个体入样,需遵循在各层中进行,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比.
    2.分层抽样的步骤:
    (1)分层:按某种特征将总体分成若干部分.
    (2)按比例确定每层抽取个体的个数.
    (3)各层分别按简单随机抽样的方法抽取.
    (4)综合每层抽样,组成样本.
    四.折线图
    一般地,如果数据是随时间变化的,想了解数据的变化情况,可将数据用折线图来表示.
    五.扇形图
    扇形图(也称为饼图 、饼形图 ),可以形象地表示出各部分数据在全部数据中所占的比例情况.扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.
    六.频数分布直方图与频率分布直方图
    1.频数分布直方图与频率分布直方图的画法:
    (1)找出最值,计算极差;(2)合理分组,确定区间;(3)整理数据;(4)作出有关图示.
    2.频数分布直方图的纵坐标是频数,每一组数对应的矩形高度与频数成正比;频率分布直方图的纵坐标是,每一组数对应的矩形高度与频率成正比,而且每个矩形的面积等于这一组数对应的频率,从而可知频率分布直方图中,所有矩形的面积之和为1.
    3.将每个矩形上面一边的中点用线段连接起来可以得到频数分布折线图和频率分布折线图.
    注:为了方便看图,折线图都画成与横轴相交,所以折线图与横轴的左右两个交点是没有实际意义的.
    七.最值
    一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况,一般地,最大值用max表示,最小值用min表示.
    八.平均数
    如果给定的一组数是,则这组数的平均数为:
    这一公式在数学中常简记为:
    注:(1)其中的符号表示求和,读作“西格玛“,右边式子中的i表示求和的范围,其最小值和最大值分别写在的下面和上面.
    (2)求和符号具有以下性质:
    = 1 \* GB3 ① = 2 \* GB3 ② = 3 \* GB3 ③
    (3)平均数会受每一个数的影响,尤其是最大值、最小值.很多情况下,为了避免过于极端的值影响结果太大等,会去掉最低分与最高分后再计算平均数.
    (4)一般地,利用平均数地计算公式可知,如果的平均数为,且为常数,则的平均数为
    九.中位数、百分位数
    1.一般地,有时也可以借助中位数来表示一组数的中心位置:
    (1)如果一组数有奇数个数,且按照从小到大排列后为,则称为这组数的中位数;
    (2)如果一组数有偶数个数,且按照从小到大排列后为,则称为这组数的中位数.
    2.一组数的分位数指的是满足下列条件的一个数值:至少有的数据不大于该值,且至少有的数据不小于该值.
    注:(1)直观来说,一组数的分位数指的是,将这组数按照从小到大的顺序排列后,处于位置的数,例如中位数就是一个分位数.
    (2)按照定义可知,分位数可能不唯一
    (3)设一组数按照从小到大排列后为,计算的值,如果不是整数,设为大于的最小整数,取为分位数:如果是整数,取为分位数.特别的,规定:0分位数是(是最小值),100分位数是(即最大值).
    (4)实际应用中,除了中位数外,经常使用的是分位数(简称为第一四分位数)与分位数(简称为第三四分位数)
    十.众数
    一组数据中,某个数据出现的次数称为这个数据的频数,重复出现的次数最多的数据称为这组数据的众数.
    十一.极差、方差、标准差
    1.极差:一组数的极差指的是这组数的最大值减最小值,不难看出,极差反映了一组数的变化范围,描述了这组数的离散程度.
    描述一组数的离散程度的量还有方差和标准差.
    2.方差:如果的平均数为,则方差可用求和符号表示为:
    注:如果a,b为常数,则:的方差为.
    3.标准差:方差的算术平方根称为标准差;
    注:如果一组数中,各数据值都相等,则标准差为0,表面数据没有波动,数据没有离散;若各数据的值与平均数的差的绝对值较大,则标准差越大,表明数据的波动幅度越大,数据的离散程度较高,因此标准差描述了数据相对平均数的离散程度.
    十二.用样本的数字特征估计总体的数字特征
    一般情况下,如果样本容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也成为样本方差)与总体对应地值相差不会太大.
    十三.分层抽样下用样本的数字特征估计总体的数字特征
    假设第一层有个数,分别为 ,平均数为,方差为;第二层有个数,分别为,平均数为,方差为,则

    如果记样本均值为,样本方差为,则可以计算出

    十四.用样本的分布估计总体的分布
    同数字特征的估计一样,分布的估计一般也有误差.如果总体在每一个分组的频率记为: ,样本 每一组对应的频率为,一般来说,
    不等于0,
    同样,当样本的容量越来越大时,上式很小的可能性越来越大.
    【考点剖析】
    考点一:样本与总体
    例1.在北京长安街上每遇见的第20个人作为访问的对象这一抽样过程中,总体是( )
    A.全世界的人B.所有中国人
    C.当时在北京长安街上的人D.全体北京人

    变1.北京是一座美丽的城市,为增强市民的环保意识,配合6月5日的“世界环境日”活动,某校以家庭为单位进行了废塑料袋情况的调查.其中,八年级一班的50名学生在一天中调查了各自家庭丢弃废塑料袋的情况,这个问题中50名学生所在家庭一天丢弃废塑料袋的情况是( )
    A.总体B.样本C.个体D.样本的数目

    考点二:简单随机抽样的特征及适用条件
    例2-1.下列4个抽样中,简单随机抽样的个数是
    ①一儿童从玩具箱的20件玩具中任意拿一件玩,玩后放回再拿一件,连续玩了5件;
    ②仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;
    ③某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴灾区开展救灾工作;
    ④一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签.
    A.0B.1C.2D.3

    例2-2.一个班级有50名学生,采用简单随机抽样法从中抽取5人作为班级代表参加学代会,那么学号为01的同学被抽到的可能性为( )
    A.2%B.20%C.50%D.10%

    变2-1.下列抽样方法是简单随机抽样的是
    A.坛子中有1个大球,4个小球,搅拌均匀后,从中随机摸出一个球
    B.在校园里随意选三名同学进行调查
    C.在剧院里抽取三名观众调查,将所有座号写在同样的纸片上,放入箱子搅匀后逐个抽取,共取三张
    D.买彩票时随手写几组号


    变2-2.从总数为的一批零件中抽取一个容量为的样本,若每个零件被抽取的可能性为,则为
    A.B.C.D.

    考点三:随机数表法
    例3.某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:
    若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是( )
    A.10B.05C.09D.20

    变3.总体由编号为的20个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第一行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第6个个体的编号为
    A.08B.07C.02D.05
    考点四:分层抽样的特征及适用条件
    例4-1.某地区的高一新生中,来自东部平原地区的学生有2400人,中部丘陵地区的学生有1600人,西部山区的学生有1000人.计划从中选取100人调查学生的视力情况,现已了解到来自东部、中部、西部三个地区学生的视力情况有较大差异,而这三个地区男、女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是( )
    A.抽签法B.按性别分层抽样C.随机数法D.按地区分层抽样

    例4-2.某奶制品工厂某天甲、乙、丙、丁四类奶制品的产量分别为2000盒、1250盒、1250盒、500盒.若按产量比例用分层随机抽样的方法抽取一个样本容量为60的样本,则样本中甲类奶制品的数量为( )
    A.6盒B.15盒C.20盒D.24盒

    变4-1.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是( )
    A.简单随机抽样法B.抽签法
    C.随机数表法D.分层抽样法

    变4-2.某公司有120名员工,其中男员工有72人,为做某项调查,拟采用分层抽样抽取容量为15的样本,则女员工应选取的人数是( ).
    A.5B.6C.7D.8

    考点五:折线图
    例5.城乡居民人均可支配收入是国民经济决策的重要依据,增长得越快,说明生活水平越高,消费能力越强.某地区2010年至2019年城乡居民人均可支配收入如图所示,则下列说法中错误的是( )
    A.这些年该地区居民生活水平在逐步提高
    B.该地区每一户家庭的可支配收入每年都在增加
    C.这些年该地区城镇人均可支配收入与农村人均可支配收入有显著差异
    D.这些年该地区城镇人均可支配收入与农村人均可支配收入的差距略有扩大

    变5.某同学从6岁到12岁的年龄与身高的折线图如图所示,根据折线图,下列说法正确的是( )
    A.9岁到10岁的身高增长速度最快
    B.从6岁到12岁,每年身高平均增长了5cm
    C.7岁时,该同学的身高就超过了120cm
    D.9岁到12岁比6岁到9岁的身高增长速度更快


    考点六:扇形图与雷达图
    例6-1.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
    A.93B.123C.137D.167

    例6-2.2021年起,我市将试行“3+1+2”的普通高考新模式,即除语文、数学、外语3门必选科目外,考生再从物理、历史中选1门,从化学、生物、地理、政治中选2门作为选考科目.为了帮助学生合理选科,某中学将高一每个学生的六门科目综合成绩按比例均缩放成5分制,绘制成雷达图.甲同学的成绩雷达图如图所示,下面叙述一定不正确的是( )
    A.甲的化学成绩领先年级平均分最多.
    B.甲有2个科目的成绩低于年级平均分.
    C.甲的成绩最好的前两个科目是化学和地理.
    D.对甲而言,物理、化学、地理是比较理想的一种选科结果.

    变6-1.小明把自己一周零花钱的支出情况用如图所示的统计图来表示,下列说法正确的是( )
    A.从图中可以直接看出各项消费额占总消费额的百分比
    B.从图中可以直接看出具体消费额
    C.从图中可以直接看出总消费额
    D.从图中可以直接看出各项消费额在一周中的具体变化情况

    变6-2.目前,国内很多评价机构经过反复调研论证,研制出“增值评价”方式.下面实例是某市对“增值评价”的简单应用,该市教育评价部门对本市所高中按照分层抽样的方式抽出所(其中,“重点高中”所分别记为,“普通高中”所分别记为),进行跟踪统计分析,将所高中新生进行了统的入学测试高考后,该市教育评价部门将人学测试成绩与高考成绩的各校平均总分绘制成了雷达图.点表示学校入学测试平均总分大约分,点表示学校高考平均总分大约分,则下列叙述不正确的是( )
    A.各校人学统一测试的成绩都在分以上
    B.高考平均总分超过分的学校有所
    C.学校成绩出现负增幅现象
    D.“普通高中”学生成绩上升比较明显
    考点七:平均数、中位数、众数
    例7.已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有( )
    A.a>b>cB.a>c>b
    C.c>a>bD.c>b>a

    变7.如果五个数的平均数是7,那么这五个数的平均数是( )
    A.5B.6C.7D.8

    考点八:百分位数
    例8.某车间9名工人一天生产某产品的数量分别为18.8,13,15.7,14.6,15.2,15、14.8,19,17,则所给数据的第75分位数为( )
    A.14.8B.17C.15.7D.15

    变8.下列一组数据的25百分位数是( )
    2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6
    A.3.2B.3.0C.4.4D.2.5
    考点九:极差、方差、标准差
    例9.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.

    变9.已知数据的标准差为,则数据,的方差为___________________.

    考点十:用样本的分布估计总体的分布
    例10-1.一般情况下,用样本估计总体,下列说法正确的是( )
    A.样本的结果就是总体的结果
    B.样本的标准差可以近似地反映总体的平均状态
    C.数据的方差越大,说明数据越稳定
    D.样本容量越大,估计就越精确

    例10-2.有甲、乙两种水稻,测得每种水稻各10株的分蘖数据,计算出样本均值,方差分别为,.由此可以估计( )
    A.甲种水稻比乙种水稻分蘖整齐
    B.乙种水稻比甲种水稻分蘖整齐
    C.甲、乙两种水稻分蘖整齐程度相同
    D.甲、乙两种水稻分蘖整齐程度不能比较

    变10.某大学为了解该校学生的体重情况,从中抽取了若干个样本进行研究,将数据整理后得到如图所示的频率分布直方图,已知图中从左到右前四组的频率之比为,其中第二组的频数为60,则下列说法错误的是( )
    A.抽取的样本量为400
    B.样本中体重在的频率为0.25
    C.若该大学共有学生36000人,则体重超过的估计有600人
    D.估计抽取的学生体重的中位数约为66

    【真题演练】
    1.已知某地区中小学生人数和近视情况分别如图(1)和图(2)所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取的学生进行调查,则在抽取的高中生中,近视人数约为( )
    A.1000B.40C.27D.20

    2.(2017·全国·高考真题(理))某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论错误的是( )
    A.月接待游客量逐月增加
    B.年接待游客量逐年增加
    C.各年的月接待游客量高峰期大致在7,8月
    D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳

    3.(2021·天津·高考真题)从某网络平台推荐的影视作品中抽取部,统计其评分数据,将所得个评分数据分为组:、、、,并整理得到如下的频率分布直方图,则评分在区间内的影视作品数量是( )
    A.B.C.D.

    4.下列统计量中,能度量样本的离散程度的是( )
    A.样本的标准差B.样本的中位数
    C.样本的极差D.样本的平均数

    5.(2021·全国·高考真题)有一组样本数据,,…,,由这组数据得到新样本数据,,…,,其中(为非零常数,则( )
    A.两组样本数据的样本平均数相同
    B.两组样本数据的样本中位数相同
    C.两组样本数据的样本标准差相同
    D.两组样数据的样本极差相同

    6.(2021·全国·高考真题(理))某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
    旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
    (1)求,,,;
    (2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).

    【过关检测】
    1. 在中国共产党建党100周年之际,广安市某中学组织了“党史知识竞赛”活动,已知该校共有高中学生1000人,用分层抽样的方法从该校高中学生中抽取一个容量为25的样本参加活动,其中高二年级抽取了8人,则该校高二年级学生人数为( )
    A.960B.720C.640D.320

    2.国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的末来”.某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每一学生从01到50编号,从下面所给的随机数表的第2行第4列的数开始,每次从左向右选取两个数字,则选取的第三个号码为( )
    随机数表如下:
    A.13B.24C.33D.36

    3.某高校调查了200名学生每周的自习时间(单位:小时),其中自习时间的范围是[17.5,30],并制成了频率分布直方图,如图所示,样本数据分组为[17.5,20), [20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
    A.56B.60C.120D.140

    4.根据第七次全国人口普查结果,居住在城镇的人口为90199万人,占全国人口的63.9%,与第六次全国人口普查相比,城镇人口比重上升14.2个百分点.随着我国新型工业化、信息化和农业现代化的深入发展和农业转移人口市民化政策落实落地,10年来我国新型城镇化进程稳步推进,城镇化建设取得了历史性成就.如图所示的是历次全国人口普查城镇人口及城镇人口比重的统计图:
    根据图中信息,下列说法正确的是( )
    A.这七次全国人口普查的城镇人口比重上升越来越快
    B.第七次全国人口普查的城镇人口比第六次全国人口普查的城镇人口增加了63.9%
    C.这七次全国人口普查城镇人口逐次增加
    D.这七次全国人口普查非城镇人口逐次减少

    5.某年的足球联赛上,甲队每场比赛平均失球数是个,全年比赛失球个数的标准差为;乙队每场比赛平均失球数是个,全年比赛失球个数的标准差为,下列说法正确的是( )
    A.甲乙两队相比,乙队很少失球
    B.甲队比乙队技术水平更稳定
    C.平均来说,甲队比乙队防守技术好
    D.乙队有时表现很差,有时表现又非常好

    6.为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
    根据此频率分布直方图,下面结论中正确的是( )
    A.估计该地农户家庭年收入的平均值不超过6.5万元
    B.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
    C.该地农户家庭年收入的6%分位数的估计值为4.5万元
    D.该地农户家庭年收入的90%分位数的估计值为10.5万元

    7.某单位200名职工的年龄分布情况如图所示,现要从中抽取一个容量为40的样本,用分层抽样法应抽取50岁以上年龄段的职工___________人.

    8.下列一组数据的分位数是___________.

    9.某食品公司为了调查消费者对某款新食品的认可情况,随机抽取了100位消费者进行食品认可度(共设,,,四个等级)的调查,每位被调查的消费者均对该食品认可度等级进行了评定,调查的结果如下图(表):
    男性消费者
    (1)求,,的值,并求被调查者中,认可度等级为级的女性消费者人数;
    (2)公司计划按性别采用分层抽样的方法从认可度等级为级或级的消费者中选取11人派送礼品,分别求被选中的男性消费者人数和女性消费者人数.

    10.某工厂为了解甲、乙两条生产线所生产产品的质量,分别从甲、乙两条生产线生产的产品中各随机抽取了1000件产品,并对所抽取产品的某一质量指数进行检测,根据检测结果按,,,分组,得到如图所示的频率分布直方图,若工厂认定产品的质量指数不低于6为优良级产品,质量指数不低于5为合格级产品.
    (1)用统计有关知识判断甲、乙两条生产线所生产产品的质量哪一条更好,并说明理由(同一组中的数据用该组区间的中点值作代表);
    (2)质量部门认定:若一个工厂的产品合格率不低于75%,则可获得“品牌工厂”称号.根据上述两条生产线抽取的产品合格率情况,用样本估计总体的思想,估计该工厂是否能够获得“品牌工厂”称号?

    11.从某城市抽取100户居民进行月用电量调查,发现他们的用电量都在50到350度之间,将数据按照分成6组,画出的频率分布直方图如下图所示.
    (1)求直方图中的值和月平均用电量的众数;
    (2)已知该市有200万户居民,估计居民中用电量落在区间内的总户数,并说明理由.

    7816
    6572
    0802
    6314
    0702
    4369
    1128
    0598
    3204
    9234
    4935
    8200
    3623
    4869
    6938
    7481
    旧设备
    9.8
    10.3
    10.0
    10.2
    9.9
    9.8
    10.0
    10.1
    10.2
    9.7
    新设备
    10.1
    10.4
    10.1
    10.0
    10.1
    10.3
    10.6
    10.5
    10.4
    10.5
    认可度等级
    频数
    频率

    18
    0.3

    24
    0.4


    第12讲 统计
    【学习目标】
    1.掌握抽样的方法。
    2.会根据统计图表求解相关问题。
    3.了解用样本估计总体的思想。
    4.掌握样本数字特征的求解。
    【基础知识】
    一.总体与样本
    1.总体与样本的概念:
    考察问题涉及的对象的全体是总体,总体中每个对象都是个体,抽取的部分对象组成总体的一个样本,一个样本中包含的个体数目是样本容量
    2.普查与抽样的概念:
    一般地,对总体中每个个体都进行考查地方法称为普查(也称为全面调查),只抽取样本进行考查的方法称为抽样调查。
    二.简单随机抽样
    1.简单随机抽样的定义:
    一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本.
    2.简单随机抽样必须具备下列特点:
    (1)简单随机抽样要求被抽取的样本的总体个数N是有限的.
    (2)简单随机样本数n小于等于样本总体的个数N.
    (3)简单随机样本是从总体中逐个抽取的.
    (4)简单随机抽样是一种不放回的抽样.
    (5)简单随机抽样的每个个体入样的可能性均为.
    常见的简单随机抽样方法有抽签法和随机数表法.
    3.抽签法的定义.
    一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.
    4.抽签法的一般步骤:
    (1)将总体中的N个个体编号(号码从1到N);
    (2)将这N个号码写在形状、大小相同的号签上;
    (3)将号签放在同一箱中,并搅拌均匀;
    (4)从箱中每次抽出1个号签,并记录其编号,连续抽出n次;
    (5)将总体中与抽到的号签编号一致的n个个体取出.
    5.随机数表
    随机数表是由随机数(通常为0,1,2,…,9)相乘的数表,表中的每一个位置出现的数是随机的下列是一个随机数表的一部分.
    6.随机数表进行简单随机抽样的一般步骤为:
    (1)对总体进行编号;
    (2)在随机数表中任意指定一个开始选取的位置,位置的确定可以闭着眼睛用手指随机确定,也可用其他方式随机确定;
    (3)按照一定规则选取编号.
    (4)按照得到的编号,找到对应的个体.
    三.分层抽样
    1.分层抽样的定义
    一般地,如果相对于要考察的问题来说,总体可以分成的,的几部分时,每一部分可称为,在各层中按层在总体中所占进行的方法称为分层随机抽样(简称分层抽样)
    注意:分层抽样又称类型抽样,应用分层抽样应遵循以下要求:
    (1)分层:将相似的个体归人一类,即为一层,分层要求每层的各个个体,即遵循不重复、不遗漏的原则.
    (2)分层抽样为保证每个个体入样,需遵循在各层中进行,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比.
    2.分层抽样的步骤:
    (1)分层:按某种特征将总体分成若干部分.
    (2)按比例确定每层抽取个体的个数.
    (3)各层分别按简单随机抽样的方法抽取.
    (4)综合每层抽样,组成样本.
    四.折线图
    一般地,如果数据是随时间变化的,想了解数据的变化情况,可将数据用折线图来表示.
    五.扇形图
    扇形图(也称为饼图 、饼形图 ),可以形象地表示出各部分数据在全部数据中所占的比例情况.扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.
    六.频数分布直方图与频率分布直方图
    1.频数分布直方图与频率分布直方图的画法:
    (1)找出最值,计算极差;(2)合理分组,确定区间;(3)整理数据;(4)作出有关图示.
    2.频数分布直方图的纵坐标是频数,每一组数对应的矩形高度与频数成正比;频率分布直方图的纵坐标是,每一组数对应的矩形高度与频率成正比,而且每个矩形的面积等于这一组数对应的频率,从而可知频率分布直方图中,所有矩形的面积之和为1.
    3.将每个矩形上面一边的中点用线段连接起来可以得到频数分布折线图和频率分布折线图.
    注:为了方便看图,折线图都画成与横轴相交,所以折线图与横轴的左右两个交点是没有实际意义的.
    七.最值
    一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况,一般地,最大值用max表示,最小值用min表示.
    八.平均数
    如果给定的一组数是,则这组数的平均数为:
    这一公式在数学中常简记为:
    注:(1)其中的符号表示求和,读作“西格玛“,右边式子中的i表示求和的范围,其最小值和最大值分别写在的下面和上面.
    (2)求和符号具有以下性质:
    = 1 \* GB3 ① = 2 \* GB3 ② = 3 \* GB3 ③
    (3)平均数会受每一个数的影响,尤其是最大值、最小值.很多情况下,为了避免过于极端的值影响结果太大等,会去掉最低分与最高分后再计算平均数.
    (4)一般地,利用平均数地计算公式可知,如果的平均数为,且为常数,则的平均数为
    九.中位数、百分位数
    1.一般地,有时也可以借助中位数来表示一组数的中心位置:
    (1)如果一组数有奇数个数,且按照从小到大排列后为,则称为这组数的中位数;
    (2)如果一组数有偶数个数,且按照从小到大排列后为,则称为这组数的中位数.
    2.一组数的分位数指的是满足下列条件的一个数值:至少有的数据不大于该值,且至少有的数据不小于该值.
    注:(1)直观来说,一组数的分位数指的是,将这组数按照从小到大的顺序排列后,处于位置的数,例如中位数就是一个分位数.
    (2)按照定义可知,分位数可能不唯一
    (3)设一组数按照从小到大排列后为,计算的值,如果不是整数,设为大于的最小整数,取为分位数:如果是整数,取为分位数.特别的,规定:0分位数是(是最小值),100分位数是(即最大值).
    (4)实际应用中,除了中位数外,经常使用的是分位数(简称为第一四分位数)与分位数(简称为第三四分位数)
    十.众数
    一组数据中,某个数据出现的次数称为这个数据的频数,重复出现的次数最多的数据称为这组数据的众数.
    十一.极差、方差、标准差
    1.极差:一组数的极差指的是这组数的最大值减最小值,不难看出,极差反映了一组数的变化范围,描述了这组数的离散程度.
    描述一组数的离散程度的量还有方差和标准差.
    2.方差:如果的平均数为,则方差可用求和符号表示为:
    注:如果a,b为常数,则:的方差为.
    3.标准差:方差的算术平方根称为标准差;
    注:如果一组数中,各数据值都相等,则标准差为0,表面数据没有波动,数据没有离散;若各数据的值与平均数的差的绝对值较大,则标准差越大,表明数据的波动幅度越大,数据的离散程度较高,因此标准差描述了数据相对平均数的离散程度.
    十二.用样本的数字特征估计总体的数字特征
    一般情况下,如果样本容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也成为样本方差)与总体对应地值相差不会太大.
    十三.分层抽样下用样本的数字特征估计总体的数字特征
    假设第一层有个数,分别为 ,平均数为,方差为;第二层有个数,分别为,平均数为,方差为,则

    如果记样本均值为,样本方差为,则可以计算出

    十四.用样本的分布估计总体的分布
    同数字特征的估计一样,分布的估计一般也有误差.如果总体在每一个分组的频率记为: ,样本 每一组对应的频率为,一般来说,
    不等于0,
    同样,当样本的容量越来越大时,上式很小的可能性越来越大.
    【考点剖析】
    考点一:样本与总体
    例1.在北京长安街上每遇见的第20个人作为访问的对象这一抽样过程中,总体是( )
    A.全世界的人B.所有中国人
    C.当时在北京长安街上的人D.全体北京人
    【答案】C
    【分析】
    根据总体的概念判断即可.
    【详解】
    在北京长安街上每遇见的第20个人作为访问的对象这一抽样过程中,总体是当时在北京长安街上的人.
    故选:C.
    变1.北京是一座美丽的城市,为增强市民的环保意识,配合6月5日的“世界环境日”活动,某校以家庭为单位进行了废塑料袋情况的调查.其中,八年级一班的50名学生在一天中调查了各自家庭丢弃废塑料袋的情况,这个问题中50名学生所在家庭一天丢弃废塑料袋的情况是( )
    A.总体B.样本C.个体D.样本的数目
    【答案】B
    【分析】
    根据样本的概念可得答案.
    【详解】
    八年级一班的50名学生所在家庭一天丢弃废塑料袋的情况是某校以家庭为单位进行了废塑料袋情况的调查的一个部分,故50名学生所在家庭一天丢弃废塑料袋的情况是样本.
    故选:B.

    考点二:简单随机抽样的特征及适用条件
    例2-1.下列4个抽样中,简单随机抽样的个数是
    ①一儿童从玩具箱的20件玩具中任意拿一件玩,玩后放回再拿一件,连续玩了5件;
    ②仓库中有1万支奥运火炬,从中一次性抽取100支火炬进行质量检查;
    ③某连队从200名党员官兵中,挑选出50名最优秀的官兵赶赴灾区开展救灾工作;
    ④一彩民选号,从装有36个大小、形状都相同的号签的盒子中无放回地抽出6个号签.
    A.0B.1C.2D.3
    【答案】B
    【分析】
    根据简单随机抽样的特点逐个判断即可.
    【详解】
    ①:不是简单随机抽样.因为一儿童从玩具箱的20件玩具中任意拿一件玩,玩后放回再拿一件,连续玩了5件,它不是“逐个抽取”.
    ②:不是简单随机抽样.虽然“一次性抽取”和“逐个抽取”不影响个体被抽到的可能性,但简单随机抽样要求的是“逐个抽取”
    ③:不是简单随机抽样.因为50名官兵是从中挑出来的,是最优秀的,每个个体被抽到的可能性不同,不符合简单随机抽样中“等可能抽样”的要求.
    ④:是简单随机抽样.因为总体中的个体数是有限的,并且是从总体中逐个进行抽取的、等可能的抽样.
    综上,只有④是简单随机抽样.
    故选:B
    【点睛】
    本题考查了简单抽样的定义,属于基础题.
    例2-2.一个班级有50名学生,采用简单随机抽样法从中抽取5人作为班级代表参加学代会,那么学号为01的同学被抽到的可能性为( )
    A.2%B.20%C.50%D.10%
    【答案】D
    【分析】
    根据简单随机抽样的定义,即可求解,
    【详解】
    每个学生被抽到的可能性都是,
    所以学号为01的同学被抽到的可能性为.
    故选:D
    变2-1.下列抽样方法是简单随机抽样的是
    A.坛子中有1个大球,4个小球,搅拌均匀后,从中随机摸出一个球
    B.在校园里随意选三名同学进行调查
    C.在剧院里抽取三名观众调查,将所有座号写在同样的纸片上,放入箱子搅匀后逐个抽取,共取三张
    D.买彩票时随手写几组号
    【答案】C
    【分析】
    根据简单随机抽样的定义直接判断即可.
    【详解】
    解析:A不是,因为球大小不同,造成不公平.B,D不是,因为“随意选”“随手写”并不说明对每个个体机会均等.C符合随机抽样的定义,是简单随机抽样.
    【点睛】
    本题考查了简单随机抽样的定义,属于基础题.

    变2-2.从总数为的一批零件中抽取一个容量为的样本,若每个零件被抽取的可能性为,则为
    A.B.C.D.
    【答案】A
    【分析】
    由样本容量、总容量以及个体入样可能性三者之间的关系,列等式求出的值.
    【详解】
    由题意可得,解得,故选A.
    【点睛】
    本题考查抽样概念的理解,了解样本容量、总体容量以及个体入样可能性三者之间的关系是解题的关键,考查计算能力,属于基础题.


    考点三:随机数表法
    例3.某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:
    若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是( )
    A.10B.05C.09D.20
    【答案】C
    【分析】
    根据随机数表法抽样的定义进行抽取即可.
    【详解】
    依题意,读取的第一个数为14,向右每两位读取数据,依次为:64,05,71,11,05,65,09,
    其中64,71,65不在编号范围内,舍去,而后一个05与前一个05重复,应舍去后一个05,
    读取符合要求的两位数据依次为:14,05,11,09,则09刚好是第四个符合要求的编号,
    所以得到的第4个样本编号是09.
    故选:C

    变3.总体由编号为的20个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第一行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第6个个体的编号为
    A.08B.07C.02D.05
    【答案】D
    【分析】
    根据随机数表的使用方法进行选取数字即可.
    【详解】
    解析:从随机数表第一行的第5列和第6列数字开始从左向右依次选取两个数字,开始向右读,依次是65,72,08,02,63,14,07,02,43,69,11,28,05,98,…,
    所以选出来的6个个体的编号是08,02,14,07,11,05,
    所以第6个个体的编号是05.
    故选:D
    【点睛】
    本题考查了随机数法的应用,属于基础题.


    考点四:分层抽样的特征及适用条件
    例4-1.某地区的高一新生中,来自东部平原地区的学生有2400人,中部丘陵地区的学生有1600人,西部山区的学生有1000人.计划从中选取100人调查学生的视力情况,现已了解到来自东部、中部、西部三个地区学生的视力情况有较大差异,而这三个地区男、女生视力情况差异不大,在下面的抽样方法中,最合理的抽样方法是( )
    A.抽签法B.按性别分层抽样C.随机数法D.按地区分层抽样
    【答案】D
    【分析】
    根据分层抽样的概念判断.
    【详解】
    由于来自东部、中部、西部三个地区学生的视力情况有较大差异,故最合理的抽样方法是按地区分层抽样.
    故选:D
    例4-2.某奶制品工厂某天甲、乙、丙、丁四类奶制品的产量分别为2000盒、1250盒、1250盒、500盒.若按产量比例用分层随机抽样的方法抽取一个样本容量为60的样本,则样本中甲类奶制品的数量为( )
    A.6盒B.15盒C.20盒D.24盒
    【答案】D
    【分析】
    先求出分层抽样的抽样比,由此即可求得甲类奶制品的数量.
    【详解】
    某天奶制品的总产量为,
    则用分层抽样抽取容量为60的样本的抽样比为:,
    所以样本中甲类奶制品的数量为.
    故选:D
    变4-1.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是( )
    A.简单随机抽样法B.抽签法
    C.随机数表法D.分层抽样法
    【答案】D
    【解析】
    试题分析:符合分层抽样法的定义,故选D.
    考点:分层抽样.
    变4-2.某公司有120名员工,其中男员工有72人,为做某项调查,拟采用分层抽样抽取容量为15的样本,则女员工应选取的人数是( ).
    A.5B.6C.7D.8
    【答案】B
    【分析】
    利用分层抽样的抽样比求出15人中男员工的人数即可得解.
    【详解】
    依题意,分层抽样的抽样比为,则72名的男员工中应抽人,又,
    所以女员工应选取的人数是6.
    故选:B

    考点五:折线图
    例5.城乡居民人均可支配收入是国民经济决策的重要依据,增长得越快,说明生活水平越高,消费能力越强.某地区2010年至2019年城乡居民人均可支配收入如图所示,则下列说法中错误的是( )
    A.这些年该地区居民生活水平在逐步提高
    B.该地区每一户家庭的可支配收入每年都在增加
    C.这些年该地区城镇人均可支配收入与农村人均可支配收入有显著差异
    D.这些年该地区城镇人均可支配收入与农村人均可支配收入的差距略有扩大
    【答案】B
    【分析】
    根据题中给出的折线图,对照四个选项逐一进行分析判断即可.
    【详解】
    对于A,由于两条折线图都是呈上升趋势,故这些年该地区居民生活水平在逐步提高,故选项A正确;
    对于B,折线图反映的是人均的情况,不能说明每一户的情况,故选项B错误;
    对于C,由两条折线图之间差距可知,这些年该地区城镇人均可支配收入与农村人均可支配收入有显著差异,故选项C正确;
    对于D,由两条折线图的张角在变大可知,这些年该地区城镇人均可支配收入与农村人均可支配收入的差距略有扩大,故选项D正确.
    故选:B.
    变5.某同学从6岁到12岁的年龄与身高的折线图如图所示,根据折线图,下列说法正确的是( )
    A.9岁到10岁的身高增长速度最快
    B.从6岁到12岁,每年身高平均增长了5cm
    C.7岁时,该同学的身高就超过了120cm
    D.9岁到12岁比6岁到9岁的身高增长速度更快
    【答案】D
    【分析】
    根据折线图整理出年份与对应的身高变化的数据,再逐一分析判断作答.
    【详解】
    由所给折线图可知,6岁到7岁,身高增长了2cm;7岁到8岁,身高增长了3cm;8岁到9岁,身高增长了5cm;
    9岁到10岁,身高增长了6 cm;10岁到11岁,身高增长了9 cm;1l岁到12岁,身高增长了3 cm,
    因,即10岁到11岁身高增长速度比9岁到10岁的快,A错误;
    从6岁到12岁,每年身高平均增长了,B错误;
    7岁时,该同学的身高为118 cm,C错误;
    6岁到9岁的身高增长速度为,9岁到12岁的身高增长速度为,显然,D正确.
    故选:D

    考点六:扇形图与雷达图
    例6-1.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
    A.93B.123C.137D.167
    【答案】C
    【分析】
    根据图形分别求出初中部和高中部女教师的人数,最后相加即可.
    【详解】
    由题意,初中部女教师人数为:110×70%=77(人),
    高中部女教师人数为:150×40%=60(人),
    总共有77+60=137人.
    故选:C.
    例6-2.2021年起,我市将试行“3+1+2”的普通高考新模式,即除语文、数学、外语3门必选科目外,考生再从物理、历史中选1门,从化学、生物、地理、政治中选2门作为选考科目.为了帮助学生合理选科,某中学将高一每个学生的六门科目综合成绩按比例均缩放成5分制,绘制成雷达图.甲同学的成绩雷达图如图所示,下面叙述一定不正确的是( )
    A.甲的化学成绩领先年级平均分最多.
    B.甲有2个科目的成绩低于年级平均分.
    C.甲的成绩最好的前两个科目是化学和地理.
    D.对甲而言,物理、化学、地理是比较理想的一种选科结果.
    【答案】A
    【分析】
    根据雷达图,对四个选项逐个分析,可选出答案.
    【详解】
    根据雷达图,可知物理成绩领先年级平均分最多,即A错误;
    甲的政治、历史两个科目的成绩低于年级平均分,即B正确;
    甲的成绩最好的前两个科目是化学和地理,即C正确;
    对甲而言,物理成绩比年级平均分高,历史成绩比年级平均分低,而化学、生物、地理、政治中优势最明显的两科为化学和地理,故物理、化学、地理的成绩是比较理想的一种选科结果,即D正确.
    故选:A.
    【点睛】
    本题考查统计知识,涉及到雷达图的识别及应用,考查学生识图能力、数据分析能力,是一道容易题.
    变6-1.小明把自己一周零花钱的支出情况用如图所示的统计图来表示,下列说法正确的是( )
    A.从图中可以直接看出各项消费额占总消费额的百分比
    B.从图中可以直接看出具体消费额
    C.从图中可以直接看出总消费额
    D.从图中可以直接看出各项消费额在一周中的具体变化情况
    【答案】A
    【分析】
    因为没有总数,所以无法直接看出具体消费数额和各项消费数额在一周中的具体变化情况,由此即可作出选择.
    【详解】
    因为没有总数,所以无法直接看出具体消费数额和各项消费数额在一周中的具体变化情况.但是从图中可以直接看出各项消费数额占总消费数额的百分比.
    故选:A.
    【点睛】
    本题考查的是扇形图的定义:利用圆和扇形来表示总体和部分的关系用圆代表总体,圆中的各个扇形分别代表总体中的不同部分,扇形的大小反映部分占总体的百分比的大小,这样的统计图叫做扇形统计图.
    变6-2.目前,国内很多评价机构经过反复调研论证,研制出“增值评价”方式.下面实例是某市对“增值评价”的简单应用,该市教育评价部门对本市所高中按照分层抽样的方式抽出所(其中,“重点高中”所分别记为,“普通高中”所分别记为),进行跟踪统计分析,将所高中新生进行了统的入学测试高考后,该市教育评价部门将人学测试成绩与高考成绩的各校平均总分绘制成了雷达图.点表示学校入学测试平均总分大约分,点表示学校高考平均总分大约分,则下列叙述不正确的是( )
    A.各校人学统一测试的成绩都在分以上
    B.高考平均总分超过分的学校有所
    C.学校成绩出现负增幅现象
    D.“普通高中”学生成绩上升比较明显
    【答案】B
    【分析】
    依次判断每个选项的正误,得到答案.
    【详解】
    A. 各校人学统一测试的成绩都在分以上,根据图像知,正确
    B. 高考平均总分超过分的学校有所,根据图像知,只有ABC三所,错误
    C. 学校成绩出现负增幅现象,根据图像,高考成绩低于入学测试,正确
    D. “普通高中”学生成绩上升比较明显,根据图像,“普通高中”高考成绩都大于入学测试,正确.
    故答案选B
    【点睛】
    本题考查了雷达图的知识,意在考查学生的应用能力和解决问题的能力.
    考点七:平均数、中位数、众数
    例7.已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有( )
    A.a>b>cB.a>c>b
    C.c>a>bD.c>b>a
    【答案】D
    【分析】
    根据平均数的求法,所有数据的和除以总个数即可,中位数求法是从大到小排列后,最中间一个或两数的平均数,众数是在一组数据中出现次数最多的即是众数,根据以上方法可以确定出众数与中位数.
    【详解】
    解:从小到大排列此数据为:11、13、15、15、16、16、17、18、18、18.
    平均数为
    中位数为是最中间两数的平均数,即;
    众数为,即.
    故选:D.
    【点睛】
    本题属于基础题,考查了确定一组数据的平均数、中位数和众数的能力.要明确定义.注意找中位数的时候一定要先排好顺序,然后再根据奇数和偶数个来确定中位数.如果数据有奇数个,则正中间的数字即为所求;如果是偶数个则找中间两位数的平均数.
    变7.如果五个数的平均数是7,那么这五个数的平均数是( )
    A.5B.6C.7D.8
    【答案】D
    【解析】
    试题分析:利用平均数计算,或利用结论:样本x1,x2,…xn的平均数为7,
    ∴样本x1+1,x2+1,…,xn+1的平均数=7+1=8,故选D.
    考点:本题主要考查平均数的意义及其计算.
    点评:基本题型,注意掌握平均数计算公式.在此基础上推出一般结论更好.
    考点八:百分位数
    例8.某车间9名工人一天生产某产品的数量分别为18.8,13,15.7,14.6,15.2,15、14.8,19,17,则所给数据的第75分位数为( )
    A.14.8B.17C.15.7D.15
    【答案】B
    【分析】
    先将数据由小到大排列,求出数据个数的后可得所给数据的第75分位数.
    【详解】
    9个数据由小到大排列为:,
    因为,故所给数据的第75分位数为,
    故选:B.

    变8.下列一组数据的25百分位数是( )
    2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6
    A.3.2B.3.0C.4.4D.2.5
    【答案】A
    【分析】
    先把数据从小到大排序,结合百分位数的计算方法,即可求解.
    【详解】
    由题意,一组数据2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6,
    从小到大为:2.1,3.0,3.2,3.4, 3.8,4.0,4.2,4.4,5.3,5.6,
    因为,所以该组数据的25百分位数是.
    故选:A.
    考点九:极差、方差、标准差
    例9.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.
    【答案】0.1
    【详解】
    试题分析:这组数据的平均数为,.故答案应填:0.1
    变9.已知数据的标准差为,则数据,的方差为___________________.
    【答案】
    【分析】
    设出数据的平均数,并求出其方差,再利用方差定义计算即得.
    【详解】
    设数据的平均数为,即,
    数据的平均数为,
    数据的标准差为,则这组数据的方差为25,即,
    数据的方差为:,
    所以所求方差为225.
    故答案为:225
    考点十:用样本的分布估计总体的分布
    例10-1.一般情况下,用样本估计总体,下列说法正确的是( )
    A.样本的结果就是总体的结果
    B.样本的标准差可以近似地反映总体的平均状态
    C.数据的方差越大,说明数据越稳定
    D.样本容量越大,估计就越精确
    【答案】D
    【分析】
    根据样本、样本容量以及方差的性质即可求解.
    【详解】
    对于选项A:样本的结果只能估计总体的结果,故A错误;
    对于选项B:标准差反映的是总体的波动大小,不能反映总体的平均状态,故B错误;
    对于选项C:方差越大,数据越分散,越不稳定,故C错误;
    对于选项D:样本估计总体分布的过程中,估计的是否准确只与样本容量在总体中所占的比例有关,
    样本容量越大,在总体中所占比例就越大,估计的就越精确,故D正确.
    故选:D.
    例10-2.有甲、乙两种水稻,测得每种水稻各10株的分蘖数据,计算出样本均值,方差分别为,.由此可以估计( )
    A.甲种水稻比乙种水稻分蘖整齐
    B.乙种水稻比甲种水稻分蘖整齐
    C.甲、乙两种水稻分蘖整齐程度相同
    D.甲、乙两种水稻分蘖整齐程度不能比较
    【答案】B
    【分析】
    可以用样本的方差估计总体的方差,方差越小,分蘖越整齐.
    【详解】
    解:已知样本方差:,
    由此估计,乙种水稻的方差约为,甲种水稻的方差约为.
    因为
    所以乙种水稻比甲种水稻分蘖整齐
    故选:B.
    变10.某大学为了解该校学生的体重情况,从中抽取了若干个样本进行研究,将数据整理后得到如图所示的频率分布直方图,已知图中从左到右前四组的频率之比为,其中第二组的频数为60,则下列说法错误的是( )
    A.抽取的样本量为400
    B.样本中体重在的频率为0.25
    C.若该大学共有学生36000人,则体重超过的估计有600人
    D.估计抽取的学生体重的中位数约为66
    【答案】C
    【分析】
    根据后四组的频率值可得前四组的频率之和,从而可求出第二组的频率,从而可求出抽取的样本量,故可判断选项A;
    根据前四组的频率之和及前四组的频率之比为,可计算出体重在的频率,故可判断选项B;
    通过样本中体重超过的频率可估计大学共有学生36000人时,体重超过的人数,从而可判断选项C;
    利用频率分布直方图估计中位数的方法可计算出中位数,故可判断选项D.
    【详解】
    由后四组的频率值可得前四组的频率之和为,
    所以第二组的频率为,所以抽取的样本量为,故A正确;
    体重在的频率为,B正确;
    若该大学共有学生36000人,则体重超过的估计有人,C错误;
    设抽取学生体重的中位数为,则,解得,D正确.
    故选:C.
    【真题演练】
    1.已知某地区中小学生人数和近视情况分别如图(1)和图(2)所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取的学生进行调查,则在抽取的高中生中,近视人数约为( )
    A.1000B.40C.27D.20
    【答案】D
    【分析】
    根据高中生的总人数乘以抽样比可得所抽的高中生人数,再由近视率为即可求解.
    【详解】
    由图(1)知高中生的总人数为人,
    所以应抽取的高中生为人,
    抽取的高中生中,近视人数约为人,
    故选:D
    2.(2017·全国·高考真题(理))某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论错误的是( )
    A.月接待游客量逐月增加
    B.年接待游客量逐年增加
    C.各年的月接待游客量高峰期大致在7,8月
    D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
    【答案】A
    【分析】
    观察折线图,结合选项逐一判断即可
    【详解】
    对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;
    对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;
    对于选项C,观察折线图,各年的月接待游客量高峰期大致在7,8月份,故C正确;
    对于D选项,观察折线图,各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳,故D正确.
    故选:A
    3.(2021·天津·高考真题)从某网络平台推荐的影视作品中抽取部,统计其评分数据,将所得个评分数据分为组:、、、,并整理得到如下的频率分布直方图,则评分在区间内的影视作品数量是( )
    A.B.C.D.
    【答案】D
    【分析】
    利用频率分布直方图可计算出评分在区间内的影视作品数量.
    【详解】
    由频率分布直方图可知,评分在区间内的影视作品数量为.
    故选:D.
    4.下列统计量中,能度量样本的离散程度的是( )
    A.样本的标准差B.样本的中位数
    C.样本的极差D.样本的平均数
    【答案】AC
    【分析】
    考查所给的选项哪些是考查数据的离散程度,哪些是考查数据的集中趋势即可确定正确选项.
    【详解】
    由标准差的定义可知,标准差考查的是数据的离散程度;
    由中位数的定义可知,中位数考查的是数据的集中趋势;
    由极差的定义可知,极差考查的是数据的离散程度;
    由平均数的定义可知,平均数考查的是数据的集中趋势;
    故选:AC.
    5.(2021·全国·高考真题)有一组样本数据,,…,,由这组数据得到新样本数据,,…,,其中(为非零常数,则( )
    A.两组样本数据的样本平均数相同
    B.两组样本数据的样本中位数相同
    C.两组样本数据的样本标准差相同
    D.两组样数据的样本极差相同
    【答案】CD
    【分析】
    A、C利用两组数据的线性关系有、,即可判断正误;根据中位数、极差的定义,结合已知线性关系可判断B、D的正误.
    【详解】
    A:且,故平均数不相同,错误;
    B:若第一组中位数为,则第二组的中位数为,显然不相同,错误;
    C:,故方差相同,正确;
    D:由极差的定义知:若第一组的极差为,则第二组的极差为,故极差相同,正确;
    故选:CD
    6.(2021·全国·高考真题(理))某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
    旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
    (1)求,,,;
    (2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
    【答案】(1);(2)新设备生产产品的该项指标的均值较旧设备有显著提高.
    【分析】
    (1)根据平均数和方差的计算方法,计算出平均数和方差.
    (2)根据题目所给判断依据,结合(1)的结论进行判断.
    【详解】
    (1),


    .
    (2)依题意,,,
    ,所以新设备生产产品的该项指标的均值较旧设备有显著提高.
    【过关检测】
    1. 在中国共产党建党100周年之际,广安市某中学组织了“党史知识竞赛”活动,已知该校共有高中学生1000人,用分层抽样的方法从该校高中学生中抽取一个容量为25的样本参加活动,其中高二年级抽取了8人,则该校高二年级学生人数为( )
    A.960B.720C.640D.320
    【答案】D
    【分析】
    由分层抽样各层成比例计算即可
    【详解】
    设高二年级学生人数为,则,解得
    故选:D
    2.国家高度重视青少年视力健康问题,指出要“共同呵护好孩子的眼睛,让他们拥有一个光明的末来”.某校为了调查学生的视力健康状况,决定从每班随机抽取5名学生进行调查.若某班有50名学生,将每一学生从01到50编号,从下面所给的随机数表的第2行第4列的数开始,每次从左向右选取两个数字,则选取的第三个号码为( )
    随机数表如下:
    A.13B.24C.33D.36
    【答案】D
    【分析】
    随机数表进行读数时,确定开始的位置以及位数,逐一往后即可,遇到超出范围的数字跳过
    【详解】
    根据随机数表的读取方法,第2行第4列的数为3,每次从左向右选取两个数字,所以第一个数字为32,作为第一个号码;第二个数字58,舍去;第三个数字65,舍去;第四个数字74,舍去;第五个数字13,作为第二个号码;第六个数字36,作为第三个号码,所以选取的第三个号码为36
    故选:D
    3.某高校调查了200名学生每周的自习时间(单位:小时),其中自习时间的范围是[17.5,30],并制成了频率分布直方图,如图所示,样本数据分组为[17.5,20), [20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
    A.56B.60C.120D.140
    【答案】D
    【分析】
    根据直方图确定自习时间不少于22.5小时的频率,再根据频率、频数、总数关系得结果.
    【详解】
    这200名学生中每周的自习时间不少于22.5小时的频率为:
    因此这200名学生中每周的自习时间不少于22.5小时的人数是人.
    故选:D.
    4.根据第七次全国人口普查结果,居住在城镇的人口为90199万人,占全国人口的63.9%,与第六次全国人口普查相比,城镇人口比重上升14.2个百分点.随着我国新型工业化、信息化和农业现代化的深入发展和农业转移人口市民化政策落实落地,10年来我国新型城镇化进程稳步推进,城镇化建设取得了历史性成就.如图所示的是历次全国人口普查城镇人口及城镇人口比重的统计图:
    根据图中信息,下列说法正确的是( )
    A.这七次全国人口普查的城镇人口比重上升越来越快
    B.第七次全国人口普查的城镇人口比第六次全国人口普查的城镇人口增加了63.9%
    C.这七次全国人口普查城镇人口逐次增加
    D.这七次全国人口普查非城镇人口逐次减少
    【答案】C
    【分析】
    根据统计图信息逐项分析可得答案.
    【详解】
    由图可知第三次全国人口普查城镇人口比重上升了20.9-18.3=2.6个百分点,第二次全国人口普查城镇人口比重上升了18.3-13.3=5个百分点,则A错误;
    第七次全国人口普查的城镇人口比重比第六次全国人口普查的城镇人口比重上升了63.9-49.7=14.2个百分点,则B错误;
    这七次全国人口普查城镇人口逐次增加,则C正确;
    这七次全国人口普查城镇人口逐次增加,但由图中信息不能确定总人口数,所以这七次全国人口普查非城镇人口的变化情况不一定是逐次减少,则D错误.
    故选:C.
    5.某年的足球联赛上,甲队每场比赛平均失球数是个,全年比赛失球个数的标准差为;乙队每场比赛平均失球数是个,全年比赛失球个数的标准差为,下列说法正确的是( )
    A.甲乙两队相比,乙队很少失球
    B.甲队比乙队技术水平更稳定
    C.平均来说,甲队比乙队防守技术好
    D.乙队有时表现很差,有时表现又非常好
    【答案】C
    【分析】
    利用甲乙两对的平均失球数大小判断选项AC的真假,失球个数的标准差大小判断选项BD的真假得解.
    【详解】
    解:乙队平均失球大于甲队平均失球,所以选项A错误;
    乙队失球个数的标准差小于甲队失球个数的标准差,选项B和D错误,
    甲队每场比赛平均失球数个,小于乙队每场比赛平均失球数个,所以平均来说,甲队比乙队防守技术好.
    故选:C
    6.为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
    根据此频率分布直方图,下面结论中正确的是( )
    A.估计该地农户家庭年收入的平均值不超过6.5万元
    B.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
    C.该地农户家庭年收入的6%分位数的估计值为4.5万元
    D.该地农户家庭年收入的90%分位数的估计值为10.5万元
    【答案】BCD
    【分析】
    对于A,利用平均值的计算方法求解,对于B,由频率分布直方图求出频率进行判断,对于C,由频率分布直方图计算农户家庭年收入为不高于4.5万元的频率进行判断,对于D,由频率分布直方图计算农户家庭年收入不高于10.5万元的频率进行判断.
    【详解】
    对于A,该地农户家庭年收入的平均值为,所以A错误,
    对于B,因为家庭年收入介于4.5万元至8.5万元之间的频率为,所以估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间,所以B正确,
    对于C,因为农户家庭年收入不高于4.5万元的频率为,所以该地农户家庭年收入的6%分位数的估计值为4.5万元,所以C正确,
    对于D,因为农户家庭年收入不高于10.5万元的频率为,所以该地农户家庭年收入的90%分位数的估计值为10.5万元,所以D正确,
    故选:BCD
    7.某单位200名职工的年龄分布情况如图所示,现要从中抽取一个容量为40的样本,用分层抽样法应抽取50岁以上年龄段的职工___________人.
    【答案】
    【分析】
    按照分层抽样规则计算可得;
    【详解】
    解:依题意50岁以上年龄段的职工应该抽取人;
    故答案为:
    8.下列一组数据的分位数是___________.
    【答案】26
    【分析】
    根据百分位数的定义即可得到结果.
    【详解】
    解:,该组数据的第分位数为从小到大排序后第2与3个数据的平均数,
    第2与3个数据分别是25、27,
    故该组数据的第分位数为,
    故答案为:26.
    9.某食品公司为了调查消费者对某款新食品的认可情况,随机抽取了100位消费者进行食品认可度(共设,,,四个等级)的调查,每位被调查的消费者均对该食品认可度等级进行了评定,调查的结果如下图(表):
    男性消费者
    (1)求,,的值,并求被调查者中,认可度等级为级的女性消费者人数;
    (2)公司计划按性别采用分层抽样的方法从认可度等级为级或级的消费者中选取11人派送礼品,分别求被选中的男性消费者人数和女性消费者人数.
    【答案】
    (1);;;认可度等级为级的女性消费者人数为14;
    (2)被选中的男性消费者人数为7,女性消费者人数为4.
    【分析】
    (1)利用频率的概念及性质可求,,的值,进而可得女性消费者人数,再结合条件即得;
    (2)由题可得认可度等级为级或级的男性消费者及女性消费者人数,再利用分层抽样的概念即求.
    (1)
    由表可知,,即.
    由题可得男性消费者人数为,
    所以,,
    被调查者中,女性消费者人数为,
    故认可度等级为级的女性消费者人数为.
    所以,,,认可度等级为级的女性消费者人数为14;
    (2)
    由题可知认可度等级为级或级的男性消费者有人,认可度等级为级或级的女性消费者有人,
    从中选取11人,则被选中的男性消费者人数为,女性消费者人数为.
    10.某工厂为了解甲、乙两条生产线所生产产品的质量,分别从甲、乙两条生产线生产的产品中各随机抽取了1000件产品,并对所抽取产品的某一质量指数进行检测,根据检测结果按,,,分组,得到如图所示的频率分布直方图,若工厂认定产品的质量指数不低于6为优良级产品,质量指数不低于5为合格级产品.
    (1)用统计有关知识判断甲、乙两条生产线所生产产品的质量哪一条更好,并说明理由(同一组中的数据用该组区间的中点值作代表);
    (2)质量部门认定:若一个工厂的产品合格率不低于75%,则可获得“品牌工厂”称号.根据上述两条生产线抽取的产品合格率情况,用样本估计总体的思想,估计该工厂是否能够获得“品牌工厂”称号?
    【答案】
    (1)甲生产线所生产产品的质量更好;
    (2)该工厂不能够获得“品牌工厂”称号.
    【分析】
    (1)根据频率分布直方图计算甲、乙两条生产线所生产产品的质量指数的平均数,比较大小即可得答案;
    (2)由频率分布直方图,计算甲、乙两条生产线抽取的产品合格率,与75%比较大小即可作出判断.
    (1)
    解:甲生产线所生产产品的质量指数的平均数为:=3×0.05×2+5×0.15×2+7×0.2×2+9×0.1×2=6.4;
    乙生产线所生产产品的质量指数的平均数为:=3×0.15×2+5×0.1×2+7×0.2×2+9×0.05×2=5.6.
    因为,所以甲生产线生产产品质量的平均水平高于乙生产线生产产品质量的平均水平,
    故甲生产线所生产产品的质量更好.
    (2)
    解:由题意,甲、乙两条生产线抽取的产品合格率为,
    所以用样本估计总体的思想,估计该工厂不能够获得“品牌工厂”称号.
    11.从某城市抽取100户居民进行月用电量调查,发现他们的用电量都在50到350度之间,将数据按照分成6组,画出的频率分布直方图如下图所示.
    (1)求直方图中的值和月平均用电量的众数;
    (2)已知该市有200万户居民,估计居民中用电量落在区间内的总户数,并说明理由.
    【答案】
    (1),众数为度
    (2)万户,理由见解析
    【分析】
    (1)根据矩形面积之和为1可得x,由最高矩形底边中点横坐标估计众数;
    (2)先求频率,再由总体频率可得.
    (1)
    根据频率和为1,可知,计算得.
    由图可知,最高矩形的数据组为,所以众数为度.
    (2)
    由频率分布直方图知:用电量落在区间内的频率为

    所以用电量落在区间内的总户数为万户.
    7816
    6572
    0802
    6314
    0702
    4369
    1128
    0598
    3204
    9234
    4935
    8200
    3623
    4869
    6938
    7481
    旧设备
    9.8
    10.3
    10.0
    10.2
    9.9
    9.8
    10.0
    10.1
    10.2
    9.7
    新设备
    10.1
    10.4
    10.1
    10.0
    10.1
    10.3
    10.6
    10.5
    10.4
    10.5
    认可度等级
    频数
    频率

    18
    0.3

    24
    0.4


    相关试卷

    (苏教版2019必修第二册)高一数学寒假精品课第04讲三角函数(原卷版+解析):

    这是一份(苏教版2019必修第二册)高一数学寒假精品课第04讲三角函数(原卷版+解析),共33页。

    (苏教版2019必修第二册)高一数学寒假精品课第02讲函数概念与性质(原卷版+解析):

    这是一份(苏教版2019必修第二册)高一数学寒假精品课第02讲函数概念与性质(原卷版+解析),共22页。

    (苏教版2019必修第二册)高一数学寒假精品课第13讲概率(原卷版+解析):

    这是一份(苏教版2019必修第二册)高一数学寒假精品课第13讲概率(原卷版+解析),共39页。

    文档详情页底部广告位
    欢迎来到教习网
    • 900万优选资源,让备课更轻松
    • 600万优选试题,支持自由组卷
    • 高质量可编辑,日均更新2000+
    • 百万教师选择,专业更值得信赖
    微信扫码注册
    qrcode
    二维码已过期
    刷新

    微信扫码,快速注册

    手机号注册
    手机号码

    手机号格式错误

    手机验证码 获取验证码

    手机验证码已经成功发送,5分钟内有效

    设置密码

    6-20个字符,数字、字母或符号

    注册即视为同意教习网「注册协议」「隐私条款」
    QQ注册
    手机号注册
    微信注册

    注册成功

    返回
    顶部
    Baidu
    map