高考数学一轮复习【考点题型归纳讲练】导学案(新高考专用)第01课时随机抽样、用样本估计总体(原卷版+解析)
展开编写:廖云波
【回归教材】
1.简单随机抽样
(1)定义:一般地,设一个总体含有N个个体,从中 抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都 ,就把这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样方法有两种—— 和 .
(3)应用范围:总体个体数较少.
2.分层抽样
(1)定义:一般地,在抽样时,将总体分成 的层,然后按照 ,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)分层抽样的应用范围:
当总体是由 组成时,往往选用分层抽样的方法.
(3)分层随机抽样的方差
设样本容量为n,平均数为,其中两层的个体数量分别为,两层的平均数分别为,方差分别为,,则这个样本的方差为 .
3.作频率分布直方图的步骤
(1)求极差(即一组数据中 与 的差).
(2)决定 与 . (3)将数据 . (4)列 . (5)画 .
4.百分位数
(1)如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的 .
一般地,一组数据的 是这样一个值,
它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算第p百分位数的步骤.
第1步:以 顺序排列原始数据(即从小到大排列).
第2步:计算 i=np%.
第3步:①若 i 不是整数,将 i 向上取整.大于i的比邻整数即为第p百分位数的位置;
②若i是整数,则第p百分位数是第i项与第(i+1)项数据的平均值.
5.总体集中趋势与离散程度的估计
(1)众数:一组数据中重复出现 的数.
(2)中位数:把一组数据按 的顺序排列,处在 位置(或中间两个数的 )的数叫做这组数据的中位数.
(3)平均数:如果n个数x1,x2,…,xn,那么= 叫做这n个数的平均数.
(4)一组数据x1,x2,…,xn,用表示这组数据的平均数,
则这组数据的方差为=(-),标准差为.
(5)频率分布直方图中的众数、中位数、平均数
①在频率分布直方图中,众数是 矩形中点的 ;
②中位数左边和右边的直方图的 应该相等;
③平均数的估计值等于频率分布直方图中每个 乘以小矩形底边中点的 之和.
【典例讲练】
题型一 抽样方法
【例1-1】下列抽取样本的方式是简单随机抽样的是( )
A.从无限多个个体中抽取100个个体作为样本
B.盒子里共有80个零件,采用抽签法从中选出5个零件作为样本
C.从20件玩具中一次性抽取4件形成样本
D.从10个球(2个红球、8个白球)中依次取出2个红球
【例1-2】我国古代数学名著《九章算术》有一抽样问题:“今有北乡若干人,西乡三百人,南乡两百人,凡三乡,发役六十人,而北乡需遗十,问北乡人数几何?“其意思为:“今有某地北面若干人,西面有300人,南面有200人,这三面要征调60人,而北面共征调10人(用分层抽样的方法),则北面共有( )人.”
A.200B.100C.400D.300
【例1-3】嫦娥五号的成功发射,实现了中国航天史上的五个“首次”,某中学为此举行了“讲好航天故事”演讲比赛.若将报名的30位同学编号为01,02,…,30,利用下面的随机数表来决定他们的出场顺序,选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两个数字,重复的跳过,则选出来的第5个个体的编号为( )
45 67 32 12 12 31 02 01 04 52 15 20 01 12 51 29
32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
A.23B.20C.15D.12
【例1-4】从一群游戏的小孩中随机抽出k人,一人分一个苹果,让他们返回继续游戏,过了一会儿,再从中任取m人,发现其中有n个小孩曾分过苹果,估计参加游戏的小孩的人数为( )
A.B.C.D.
归纳总结:
【练习1-1】北京2022年冬奥会吉祥物“冰墩墩”和冬残奥会吉祥物“雪容融”一亮相,好评不断,这是中国文化与奥林匹克精神的一次完美结合.现工厂决定从20只相同的“冰墩墩”,15只相同的“雪容融”和10个相同的北京2022年冬奥会会徽中,采用分层随机抽样的方法,抽取一个容量为n的样本进行质量检测,若“冰墩墩”抽取了4只,则n=______.
【练习1-2】为了估计湖里有多少条鱼,先捕捉80条做上标记,然后放回到湖里,等标记的鱼完全混于鱼群后,在捕捉160条鱼,发现带有标记的鱼有16条,湖里大约有鱼________条
【练习1-3】一单位有职工160人,其中业务人员96人,管理人员40人,后勤服务人员24人,为了了解职工的收入情况,从中抽取一个容量为20的样本.按下述方法抽取:
①将160人从1至160编上号,再用白纸做成1~160号的签160个放入箱内拌匀,然后从中抽20个签与签号相同的20个人被选出.
②按的比例,从业务人员中抽取12人,从管理人员中抽取5人,从后勤人员中抽取3人.
(1)上述两种方法中,总体、个体、样本分别是什么?
(2)上述两种方法中各自采取何种抽取样本的方法?
(3)你认为哪种抽样方法较为合理?并说明理由.
题型二 总体取值规律、百分位数的估计
【例2-1】【多选题】某公司为了解用户对其产品的满意度,随机调查了10个用户,得到用户对产品的满意度评分如下表所示,评分用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高,则下列说法正确的是( )
A.这组数据的平均数为6B.这组数据的众数为7
C.这组数据的极差为6D.这组数据的75%分位数为9
【例2-2】【多选题】如图是某班50名学生期中考试数学成绩的频率分布直方图,其中成绩分组区间是[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则下列说法正确的是( )
A.图中的的值为
B.该班名学生期中考试数学成绩的众数是
C.该班名学生期中考试数学成绩的中位数是
D.该班名学生期中考试数学的平均分是75
归纳总结:
【练习2-1】某校为了解高一学生在五一假期中参加社会实践活动的情况,抽样调查了其中的100名学生,统计他们参加社会实践活动的时间(单位:小时),并将统计数据绘制成如图的频率分布直方图.
(1)估计这100名学生在这个五一假期中参加社会实践活动的时间的众数,中位数,平均数;
(2)估计这100名学生在这个五一假期中参加社会实践活动的时间的上四分位数(结果保留两位小数).
【练习2-2】【多选题】新冠肺炎疫情防控期间,进出小区、超市、学校等场所,我们都需要先进行体温检测.某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列结论正确的是( )
A.甲同学体温的极差为0.4℃
B.乙同学体温的众数为36.4℃,中位数与平均数不相等
C.乙同学的体温比甲同学的体温稳定
D.甲同学体温的第80百分位数为36.5℃
题型三 数字特征
【例3-1】【多选题】若数据x1,x2,…,xm的平均数为,方差为,数据y1,y2,…,yn的平均数为,方差为,下列说法中一定正确的有( )
A.这m+n个数据的平均数为
B.若这m+n个数据的平均数为ω,则这m+n个数据的方差为:
C.若m=n,,则
D.若m=n,,则
【例3-2】为了解学生参加知识竞赛的情况,随机抽样了甲、乙两个小组各名同学的成绩,得到如图的两个频率分布直方图,记甲、乙的平均分分别为、,标准差分别为、,根据直方图估计甲、乙小组的平均分及标准差,下列描述正确的是( )
A.,
B.,
C.,
D.,
归纳总结:
【练习3-1】【多选题】某次辩论赛有7位评委进行评分,首先7位评委各给出某选手一个原始分数,评定该选手成绩时从7个原始分数中去掉一个最高分、去掉一个最低分,得到5个有效评分.则这5个有效评分与7个原始评分相比,数字特征可能不同的是( )
A.极差B.中位数C.平均数D.方差
【练习3-2】已知一组数据的平均数为,方差为.若的平均数与方差相等,则的最大值为___________.
【练习3-3】为了了解全校学生平均每年阅读多少本文学经典名著,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5,方差为2;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为1.已知甲、乙两同学抽取的样本合在一起组成一个容量为18的样本,则合在一起后的样本方差为___________.
题型四 几种常见的统计图
【例4-1】【多选题】某保险公司为客户定制了A,B,C,D,E共5个险种,并对5个险种参保客户进行抽样调查,得出如下的统计图:
用该样本估计总体,以下四个说法正确的有( )
A.57周岁以上参保人数最少B.18~30周岁人群参保总费用最少
C.C险种更受参保人青睐D.31周岁以上的人群约占参保人群80%
【例4-2】【多选题】学校为了解本校学生上学的交通方式,在全校范围内进行了随机调查,将学生上学的交通方式归为四类方式:A—结伴步行,B—自行乘车,C—家人接送,D—其他方式.并把收集的数据整理分别绘制成柱形图和扇形图,下面的柱形图和扇形图只给出了部分统计信息,则根据图中信息,下列说法正确的是( )
A.扇形图中B的占比最大
B.结伴步行上学的有30人
C.无法计算扇形图中A的占比
D.估计该校学生上学交通方式为A和C的人数占学生总人数的一半
归纳总结:
【练习4-1】【多选题】为比较甲,乙两名学生的数学学科素养的各项能力指标值(满分为5分).绘制了如图所示的六维能力雷达图.例如,图中甲的数学抽象指标值为4,乙的数学抽象指标值为5,则下列说法正确的是( )
A.甲的逻辑推理指标高于乙的逻辑推理指标值
B.甲的数学建模指标值高于乙的直观想象指标值
C.甲的数学运算指标值高于甲的直观想象指标值
D.甲的六维能力整体水平低于乙的六维能力整体水平
【完成课时作业(六十三)】
【课时作业(六十三)】
A组 础题巩固
1.现有以下两项调查:①从台刚出厂的电视机中抽取台进行质量检查;②某社区有户家庭,其中高收入家庭户,中等收入家庭户,低收入家庭户,为了调查家庭每年生活费的开支情况,计划抽取一个容量为的样本,则完成这两项调查最适宜采用的抽样方法分别是( )
A.①②都采用简单随机抽样 B.①②都采用分层随机抽样
C.①采用简单随机抽样,②采用分层随机抽样 D.①采用分层随机抽样,②采用简单随机抽样
2.某口罩生产工厂为了了解口罩的质量,现将生产的50个口罩编号为,利用如下随机数表从中抽取10个进行检测.若从下表中第2行第7列的数字开始向右依次读取2个数据作为1个编号,则被抽取的第5个个体的编号为( )
A.30B.31C.14D.43
3.为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:)的分组区间为,将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.8B.12C.16D.18
4.高中为了了解本校学生考入大学一年后的学习情况,对本校上一年考入大学的同学进行了调查,根据学生所属的专业类型,制成如图所示的饼图.现要从这些同学中抽出20人进行进一步调查,已知甲为理学专业,乙为工学专业,则下列说法不正确的是( )
A.分层抽样比简单随机抽样更合理
B.若按专业类型进行分层抽样,则理学专业和工学专业应抽取6人和4人
C.若按专业类型进行分层抽样,则甲被抽到的可能性比乙大
D.该问题中的样本容量为20
5.在北京冬奥会上,国家速滑馆“冰丝带”使用高效环保的二氧化碳跨临界直冷制冰技术,为实现绿色冬奥作出了贡献.如图描述了一定条件下二氧化碳所处的状态与T和的关系,其中T表示温度,单位是K;P表示压强,单位是.下列结论中正确的是( )
A.当,时,二氧化碳处于液态
B.当,时,二氧化碳处于气态
C.当,时,二氧化碳处于超临界状态
D.当,时,二氧化碳处于超临界状态
6.下表反应的是铜仁市2021年12月~2022年6月份全社会固定资产投资及增长率情况,根据图表,下列叙述正确的是( )
A.增长率最大的月份全社会固定资产投资必最大
B.增长率降低,说明全社会固定资产投资减少
C.增长率平均值低于
D.全社会固定资产投资的中位数低于其平均数
7.管理人员从一池塘内随机捞出40条鱼,做上标记后放回池塘.10天后,又从池塘内随机捞出70条鱼,其中有标记的有2条.根据以上数据可以估计该池塘内鱼的总条数是( )
A.2800B.1800C.1400D.1200
8.【多选题】港珠澳大桥是中国境内一座连接中国香港、广东珠海和中国澳门的桥隧工程,因其超大的建筑规模、空前的施工难度和顶尖的建造技术而闻名世界.港珠澳大桥为中国内地前往中国香港的游客提供了便捷的交通途径,某旅行社分年龄段统计了港珠澳大桥落地以后,由港珠澳大桥实现中国内地前往中国香港的老、中、青旅客的人数比为5:2:3,现使用分层随机抽样的方法从这些旅客中随机抽取n名,若青年旅客抽到60人,则下列说法正确的是( )
A.老年旅客抽到150人
B.中年旅客抽到40人
C.
D.被抽到的老年旅客和中年旅客人数之和超过200
9.【多选题】下列命题中是真命题的有( )
A.有三种个体按的比例分层抽样调查,如果抽取的个体数为,则样本容量为
B.一组数据的平均数、众数、中位数相同
C.若甲组数据的方差为,乙组数据为,则这两组数据中较稳定的是甲
D.一组数的分位数为
10.【多选题】新中国成立以来,我国一共进行了七次全国人口普查(以下简称“普查”),历次普查得到的全国人口总数如图1所示,城镇人口比重如图2所示.下列结论正确的是( )
A.第三次普查城镇人口数量低于2亿
B.对比这七次普查的结果,我国城镇人口数量逐次递增
C.第六次普查城镇人口数量超过第二次人口普查总人口数
D.与前一次普查对比,第五次普查的总人口增长量高于第四次普查的总人口增长量
11.已知样本数据1,2,3,4,的平均数是3,则数据2,4,6,8,的方差是______.
12.已知平均数为a,标准差是b,则的平均数是________,标准差是________.
13.某市政府为了节约生活用水,实施居民生活用水定额管理政策,即确定一个居民月用水量标准x(单位:吨),用水量不超过x的部分按平价收费,超出x的部分按议价收费,并随机抽取部分居民进行调查,抽取的居民月均用水量的频率分布直方图如图所示.(同一组中的数据以该组区间的中点值为代表)
(1)求频率分布直方图中a的值;
(2)试估计该市居民月均用水量的众数、平均数;
(3)如果希望85%的居民月均用水量不超过标准x,那么标准x定为多少比较合理?
B组 挑战自我
1.某班有50名学生,该班上学期期中考试的英语平均分为70分,标准差为s,后来发现两名学生的成绩记录有误:小明得了71分,却误记为46分;小刘得了70分,却误记为95分.更正后的标准差为,则s与之间的大小关系为( )
A.B.C.D.无法确定
2.一组数据共有7个数:,2,2,2,10,5,4,且,若这组数据的平均数、中位数、众数中最大与最小数之和是该三数中间数字的两倍,则第分位数是______.
3.一组实数,,……的平均数为3,方差为10;另一组实数,,……的平均数为8,方差为10.则这100个实数的平均数为______,方差为______.
4.已知样本的各个个体的值由小到大依次为2,3,3,7,a,b,12,13,19,20,且样本的中位数为10.5,则___________;若要使该样本的方差最小,则___________.
7
8
9
7
5
4
10
9
4
7
第九章 统计、排列组合与概率
第 1 课时 随机抽样、用样本估计总体
编写:廖云波
【回归教材】
1.简单随机抽样
(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样方法有两种——抽签法和随机数法.
(3)应用范围:总体个体数较少.
2.分层抽样
(1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)分层抽样的应用范围:
当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.
(3)分层随机抽样的方差
设样本容量为n,平均数为,其中两层的个体数量分别为,两层的平均数分别为,方差分别为,,则这个样本的方差为.
3.作频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差).
(2)决定组距与组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图.
4.百分位数
(1)如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数.
一般地,一组数据的第p百分位数是这样一个值,
它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算第p百分位数的步骤.
第1步:以递增顺序排列原始数据(即从小到大排列).
第2步:计算 i=np%.
第3步:①若 i 不是整数,将 i 向上取整.大于i的比邻整数即为第p百分位数的位置;
②若i是整数,则第p百分位数是第i项与第(i+1)项数据的平均值.
5.总体集中趋势与离散程度的估计
(1)众数:一组数据中重复出现次数最多的数.
(2)中位数:把一组数据按从小到大的顺序排列,处在中间位置(或中间两个数的平均数)的数叫做这组数据的中位数.
(3)平均数:如果n个数x1,x2,…,xn,那么=eq \f(1,n)(x1+x2+…+xn)叫做这n个数的平均数.
(4)一组数据x1,x2,…,xn,用表示这组数据的平均数,
则这组数据的方差为=(-),标准差为.
(5)频率分布直方图中的众数、中位数、平均数
①在频率分布直方图中,众数是最高矩形中点的横坐标;
②中位数左边和右边的直方图的面积应该相等;
③平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
【典例讲练】
题型一 抽样方法
【例1-1】下列抽取样本的方式是简单随机抽样的是( )
A.从无限多个个体中抽取100个个体作为样本
B.盒子里共有80个零件,采用抽签法从中选出5个零件作为样本
C.从20件玩具中一次性抽取4件形成样本
D.从10个球(2个红球、8个白球)中依次取出2个红球
【答案】B
【分析】根据简单随机抽样的概念直接判断即可.
【详解】简单随机抽样的总体个数是有限的,故A错误;
简单随机抽样是从总体中逐个抽取,故C错误;
简单随机抽样每次抽取时必须保证每个个体被抽到的概率相等,D选项中只抽取红球,个体被抽到的概率不相等,故D错误;
根据简单随机抽样的概念可知B正确.
故选:B
【例1-2】我国古代数学名著《九章算术》有一抽样问题:“今有北乡若干人,西乡三百人,南乡两百人,凡三乡,发役六十人,而北乡需遗十,问北乡人数几何?“其意思为:“今有某地北面若干人,西面有300人,南面有200人,这三面要征调60人,而北面共征调10人(用分层抽样的方法),则北面共有( )人.”
A.200B.100C.400D.300
【答案】B
【分析】根据分层抽样的定义结合题意列方程求解即可
【详解】设北面共有人,则由题意可得
,解得,
所以北面共有100人,
故选:B
【例1-3】嫦娥五号的成功发射,实现了中国航天史上的五个“首次”,某中学为此举行了“讲好航天故事”演讲比赛.若将报名的30位同学编号为01,02,…,30,利用下面的随机数表来决定他们的出场顺序,选取方法是从随机数表第1行的第3列和第4列数字开始由左到右依次选取两个数字,重复的跳过,则选出来的第5个个体的编号为( )
45 67 32 12 12 31 02 01 04 52 15 20 01 12 51 29
32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
A.23B.20C.15D.12
【答案】C
【分析】根据随机数表法的概念直接得解.
【详解】根据随机数表法可得选出的个体编号依次为:12,02,01,04,15,
第5个个体编号为15,
故选:C.
【例1-4】从一群游戏的小孩中随机抽出k人,一人分一个苹果,让他们返回继续游戏,过了一会儿,再从中任取m人,发现其中有n个小孩曾分过苹果,估计参加游戏的小孩的人数为( )
A.B.C.D.
【答案】C
【分析】用样本估计总体,计算即可得.
【详解】设总人数为,则,
故选:C.
归纳总结:
【练习1-1】北京2022年冬奥会吉祥物“冰墩墩”和冬残奥会吉祥物“雪容融”一亮相,好评不断,这是中国文化与奥林匹克精神的一次完美结合.现工厂决定从20只相同的“冰墩墩”,15只相同的“雪容融”和10个相同的北京2022年冬奥会会徽中,采用分层随机抽样的方法,抽取一个容量为n的样本进行质量检测,若“冰墩墩”抽取了4只,则n=______.
【答案】9
【分析】根据成分层抽样的比例可得答案.
【详解】20:15:10=4:3:2,由于“冰墩墩”抽取了4只,所以“雪容融”抽取了3只,
北京2022年冬奥会会徽抽取了2个,所以.
故答案为:9.
【练习1-2】为了估计湖里有多少条鱼,先捕捉80条做上标记,然后放回到湖里,等标记的鱼完全混于鱼群后,在捕捉160条鱼,发现带有标记的鱼有16条,湖里大约有鱼________条
【答案】800
【分析】由题意列出方程,解方程即可.
【详解】设湖里大约有鱼条,则,即,
故答案为:800.
【练习1-3】一单位有职工160人,其中业务人员96人,管理人员40人,后勤服务人员24人,为了了解职工的收入情况,从中抽取一个容量为20的样本.按下述方法抽取:
①将160人从1至160编上号,再用白纸做成1~160号的签160个放入箱内拌匀,然后从中抽20个签与签号相同的20个人被选出.
②按的比例,从业务人员中抽取12人,从管理人员中抽取5人,从后勤人员中抽取3人.
(1)上述两种方法中,总体、个体、样本分别是什么?
(2)上述两种方法中各自采取何种抽取样本的方法?
(3)你认为哪种抽样方法较为合理?并说明理由.
【答案】(1)答案见解析
(2)①采用的是抽签法,②采用的是分层抽样法
(3)分层抽样法较为合理,理由见解析
【分析】(1)根据总体、个体、样本的定义可得;
(2)根据抽样方法可直接判断;
(3)根据不同工种的员工的工资存在明显差异可判断.
(1)
总体是该单位160名职工的收入,个体是该单位每名职工的收入,样本是该单位抽取的20名职工的收入.
(2)
①采用的是抽签法,②采用的是分层抽样法.
(3)
分层抽样法较为合理,理由如下:由于要了解职工收入情况,不同工种的员工的工资存在明显差异,所以采用分层抽样较为合理.
题型二 总体取值规律、百分位数的估计
【例2-1】【多选题】某公司为了解用户对其产品的满意度,随机调查了10个用户,得到用户对产品的满意度评分如下表所示,评分用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高,则下列说法正确的是( )
A.这组数据的平均数为6B.这组数据的众数为7
C.这组数据的极差为6D.这组数据的75%分位数为9
【答案】BCD
【分析】由平均数、众数、极差、百分位数的定义即可得出答案.
【详解】这组数从小到大排列为:4,4,5,7,7,7,8,9,9,10,
计算这组数据的平均数为,选项A错误;
这组数据的众数是7,选项B正确;
这组数据的极差是,选项C正确;
因为10×75%=7.5,且第8个数是9,所以这组数据的75%分位数为9,选项D正确.
故选:BCD.
【例2-2】【多选题】如图是某班50名学生期中考试数学成绩的频率分布直方图,其中成绩分组区间是[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则下列说法正确的是( )
A.图中的的值为
B.该班名学生期中考试数学成绩的众数是
C.该班名学生期中考试数学成绩的中位数是
D.该班名学生期中考试数学的平均分是75
【答案】AB
【分析】根据频率值和为1,求得x,可判断A;根据频率分布直方图中众数、中位数、平均数的估计方法计算它们的值,可判断B,C,D.
【详解】由频率分布直方图可得: ,
解得 ,A正确;
由于[70,80)这一组的频率最大,故数学成绩的众数是,B正确;
前三组的相应矩形面积之和为 ,
故设中位数为x,则,解得,C错误;
该班名学生期中考试数学的平均分是,D错误,
故选:AB
归纳总结:
【练习2-1】某校为了解高一学生在五一假期中参加社会实践活动的情况,抽样调查了其中的100名学生,统计他们参加社会实践活动的时间(单位:小时),并将统计数据绘制成如图的频率分布直方图.
(1)估计这100名学生在这个五一假期中参加社会实践活动的时间的众数,中位数,平均数;
(2)估计这100名学生在这个五一假期中参加社会实践活动的时间的上四分位数(结果保留两位小数).
【答案】(1)众数是20,中位数是20.4,平均数为20.32
(2)
【分析】(1)利用直方图的性质求得a的值,然后分别根据众数、中位数、平均数的概念计算;
(2)根据上四分位数确定所在的区间,再计算即可.
(1)
由频率分布直方图可看出最高矩形底边上的中点值为20,故众数是20;
由得,
∵且,
∴中位数位于18~22之间,设中位数为x,
得,故中位数是;
平均数为;
(2)
上四分位数即为75百分位数,又∵,
,∴上四分位数位于22~26之间,设上四分位数为y,则
得.
【练习2-2】【多选题】新冠肺炎疫情防控期间,进出小区、超市、学校等场所,我们都需要先进行体温检测.某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列结论正确的是( )
A.甲同学体温的极差为0.4℃B.乙同学体温的众数为36.4℃,中位数与平均数不相等
C.乙同学的体温比甲同学的体温稳定D.甲同学体温的第80百分位数为36.5℃
【答案】ACD
【分析】根据图中数据,依次分析各选项即可得答案.
【详解】解:对于A选项,甲同学体温的极差为℃,故A选项正确;
对于B选项,乙同学体温为,其众数为36.4℃,中位数、平均数均为36.4℃,故B选项错误;
对于C选项,根据图中数据,甲同学的体温平均数为36.4℃,与乙同学的体温平均数相同,但甲同学的体温极差为℃,大于乙同学的体温极差℃,故乙同学的体温比甲同学的体温稳定,C选项正确;
对于D选项,甲同学的体温从小到大排序为,,故甲同学体温的第80百分位数为36.5℃,故D选项正确.
故选:ACD
题型三 数字特征
【例3-1】【多选题】若数据x1,x2,…,xm的平均数为,方差为,数据y1,y2,…,yn的平均数为,方差为,下列说法中一定正确的有( )
A.这m+n个数据的平均数为
B.若这m+n个数据的平均数为ω,则这m+n个数据的方差为:
C.若m=n,,则
D.若m=n,,则
【答案】ABC
【分析】直接利用均值和方差的关系,方差和均值的性质,应用判断A,B,C,D的结论.
【详解】解:对于A,若数据x1,x2,…,xm的平均数为,数据y1,y2,…,yn的平均数为,
则m+n个数据的平均数为,故选项A正确;
对于B,由于m+n个数据的平均数为,若数据x1,x2,…,xm的方差为,数据y1,y2,…,yn的方差为,由方差的计算式得,这m+n个数据的方差为:,
又,所以,则, 所以
同理可得:,,
,故选项B正确;
对于C,若m=n,,则,故选项C正确;
对于D,若m=n,,则.
故选项D错误.
故选:ABC.
【例3-2】为了解学生参加知识竞赛的情况,随机抽样了甲、乙两个小组各名同学的成绩,得到如图的两个频率分布直方图,记甲、乙的平均分分别为、,标准差分别为、,根据直方图估计甲、乙小组的平均分及标准差,下列描述正确的是( )
A.,B.,
C.,D.,
【答案】A
【分析】由频率分布直方图求平均数,再比较标准差的大小即可
【详解】,
,
故;
由频率分布直方图知甲小组数据更集中,乙小组的更分散,
故;
故选:A
归纳总结:
【练习3-1】某次辩论赛有7位评委进行评分,首先7位评委各给出某选手一个原始分数,评定该选手成绩时从7个原始分数中去掉一个最高分、去掉一个最低分,得到5个有效评分.则这5个有效评分与7个原始评分相比,数字特征可能不同的是( )
A.极差B.中位数C.平均数D.方差
【答案】ACD
【分析】利用平均数、中位数、平均数、方差的定义进行判断.
【详解】因为5个有效评分是7个原始评分中去掉一个最高分、去掉一个最低分,所以中位数不变,平均数、方差、极差可能发生变化.故B错误.
故选:ACD.
【练习3-2】已知一组数据的平均数为,方差为.若的平均数与方差相等,则的最大值为___________.
【答案】
【分析】根据平均数的性质,结合二次函数的最值求解即可
【详解】由题意可得,因为,所以,解得.
令,当时,取得最大值
故答案为:
【练习3-3】为了了解全校学生平均每年阅读多少本文学经典名著,甲同学抽取了一个容量为10的样本,并算得样本的平均数为5,方差为2;乙同学抽取了一个容量为8的样本,并算得样本的平均数为6,方差为1.已知甲、乙两同学抽取的样本合在一起组成一个容量为18的样本,则合在一起后的样本方差为___________.
【答案】
【分析】先计算两同学抽取的样本的数据平方和,再计算合在一起后的平均数,再根据方差的公式计算方差即可.
【详解】设甲同学抽取的样本分别为,乙同学抽取的样本分别为,则由题意
,,则,.
故合在一起后的样本平均数为,合在一起后的样本方差为.
故答案为:
题型四 几种常见的统计图
【例4-1】【多选题】某保险公司为客户定制了A,B,C,D,E共5个险种,并对5个险种参保客户进行抽样调查,得出如下的统计图:
用该样本估计总体,以下四个说法正确的有( )
A.57周岁以上参保人数最少B.18~30周岁人群参保总费用最少
C.C险种更受参保人青睐D.31周岁以上的人群约占参保人群80%
【答案】ACD
【分析】根据统计图一一分析即可.
【详解】解:由扇形图可知,57周岁以上参保人数最少,故A正确;
由折线图可知,18~30周岁人群人均参保费用最少,但是由扇形图知参保人数并不是最少的,所以参保总费用不是最少,故B错误;
由条形图可知,C险种参保比例最高,故C正确;
由扇形图可知,31周岁以上的人群约占参保人群80%,故D正确,
故选:ACD.
【例4-2】【多选题】学校为了解本校学生上学的交通方式,在全校范围内进行了随机调查,将学生上学的交通方式归为四类方式:A—结伴步行,B—自行乘车,C—家人接送,D—其他方式.并把收集的数据整理分别绘制成柱形图和扇形图,下面的柱形图和扇形图只给出了部分统计信息,则根据图中信息,下列说法正确的是( )
A.扇形图中B的占比最大
B.结伴步行上学的有30人
C.无法计算扇形图中A的占比
D.估计该校学生上学交通方式为A和C的人数占学生总人数的一半
【答案】ABD
【分析】根据柱形图和扇形图,可求得总人数,逐一分析各个选项,即可得答案.
【详解】因为D的人数为18,且D占比为,
所以总人数为人,
所以A组人数为,故B正确;
对于A:由于B组人数最多,故在扇形图中B的占比最大,故A正确;
对于C: A组30人,占比为,故C错误;
对于D:A和C的人数和为60人,总人数为120,占学生总人数的一半,故D正确,
故选:ABD
归纳总结:
【练习4-1】【多选题】为比较甲,乙两名学生的数学学科素养的各项能力指标值(满分为5分).绘制了如图所示的六维能力雷达图.例如,图中甲的数学抽象指标值为4,乙的数学抽象指标值为5,则下列说法正确的是( )
A.甲的逻辑推理指标高于乙的逻辑推理指标值B.甲的数学建模指标值高于乙的直观想象指标值
C.甲的数学运算指标值高于甲的直观想象指标值D.甲的六维能力整体水平低于乙的六维能力整体水平
【答案】AD
【分析】直接由六维能力雷达图读取数据辨别即可.
【详解】对于A选项,甲的逻辑推理能力指标值为4,乙的逻辑推理能力指标值为3,所以甲的逻辑推理能力指标值高于乙的逻辑推理能力指标值,故选项A正确;
对于B选项,甲的数学建模能力指标值为3,乙的直观想象能力指标值为5,所以乙的数学建模能力指标值高于甲的直观想象能力指标值,故选项B错误;
对于C选项,甲的数学运算能力指标值为4,甲的直观想象能力指标值为5,所以甲的数学运算能力指标值不高于甲的直观想象能力指标值,所以选项C错误.
对于D选项,甲的六维能力指标值的平均值为,
乙的六维能力指标值的平均值为,所以乙的六维能力指标值整体水平高于甲的六维能力指标值整体水平,所以选项D正确;
故选:AD.
【完成课时作业(六十三)】
【课时作业(六十三)】
A组 础题巩固
1.现有以下两项调查:①从台刚出厂的电视机中抽取台进行质量检查;②某社区有户家庭,其中高收入家庭户,中等收入家庭户,低收入家庭户,为了调查家庭每年生活费的开支情况,计划抽取一个容量为的样本,则完成这两项调查最适宜采用的抽样方法分别是( )
A.①②都采用简单随机抽样
B.①②都采用分层随机抽样
C.①采用简单随机抽样,②采用分层随机抽样
D.①采用分层随机抽样,②采用简单随机抽样
【答案】C
【分析】根据简单随机抽样和分层抽样的特点,判断选项.
【详解】①的总体中的个体数较少,宜采用简单随机抽样,
②中1000户家庭中收入存在较大差异,层次比较明显,宜采用分层抽样.
故选:C
2.某口罩生产工厂为了了解口罩的质量,现将生产的50个口罩编号为,利用如下随机数表从中抽取10个进行检测.若从下表中第2行第7列的数字开始向右依次读取2个数据作为1个编号,则被抽取的第5个个体的编号为( )
A.30B.31C.14D.43
【答案】B
【分析】根据随机数表法抽样的规则即可求解.
【详解】解:根据题意被抽取的前5个个体编号依次为:16,13,45,30,31,
被抽取的第5个个体的编号为31.
故选:B.
3.为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:)的分组区间为,将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.8B.12C.16D.18
【答案】B
【分析】结合已知条件和频率分布直方图求出志愿者的总人数,进而求出第三组的总人数,从而可以求得结果.
【详解】志愿者的总人数为=50,
所以第三组人数为50×0.36=18,
有疗效的人数为18-6=12.
故选:B.
4.高中为了了解本校学生考入大学一年后的学习情况,对本校上一年考入大学的同学进行了调查,根据学生所属的专业类型,制成如图所示的饼图.现要从这些同学中抽出20人进行进一步调查,已知甲为理学专业,乙为工学专业,则下列说法不正确的是( )
A.分层抽样比简单随机抽样更合理
B.若按专业类型进行分层抽样,则理学专业和工学专业应抽取6人和4人
C.若按专业类型进行分层抽样,则甲被抽到的可能性比乙大
D.该问题中的样本容量为20
【答案】C
【分析】根据分层抽样的定义、分层抽样的特点以及样本容量的定义进行判断.
【详解】对于A选项,分层抽样比简单随机抽样更合理,故A正确;
对于B选项,理学专业应抽取的人数为,工学专业应抽取,
故B正确;
对于C选项,甲、乙被抽到的可能性一样大,故C错误;
对于D选项,该问题中的样本容量为20,故D正确.
故选:C.
5.在北京冬奥会上,国家速滑馆“冰丝带”使用高效环保的二氧化碳跨临界直冷制冰技术,为实现绿色冬奥作出了贡献.如图描述了一定条件下二氧化碳所处的状态与T和的关系,其中T表示温度,单位是K;P表示压强,单位是.下列结论中正确的是( )
A.当,时,二氧化碳处于液态
B.当,时,二氧化碳处于气态
C.当,时,二氧化碳处于超临界状态
D.当,时,二氧化碳处于超临界状态
【答案】D
【分析】根据与的关系图可得正确的选项.
【详解】当,时,,此时二氧化碳处于固态,故A错误.
当,时,,此时二氧化碳处于液态,故B错误.
当,时,与4非常接近,故此时二氧化碳处于固态,
另一方面,时对应的是非超临界状态,故C错误.
当,时,因, 故此时二氧化碳处于超临界状态,故D正确.
故选:D
6.下表反应的是铜仁市2021年12月~2022年6月份全社会固定资产投资及增长率情况,根据图表,下列叙述正确的是( )
A.增长率最大的月份全社会固定资产投资必最大
B.增长率降低,说明全社会围定资产投资减少
C.增长率平均值低于
D.全社会固定资产投资的中位数低于其平均数
【答案】D
【分析】拆线图表示增长率,条形图表示全社会固定资产投资,分别对各选项一一对比,判断每一选项的对错,最终得出答案.
【详解】选项A:增长率最大的月份是1月,而全社会固定资产投资最大的月份是6月,故A错;
选项B:由图知增长率从5月到6月是降低的,而全社会固定资产投资在5月到6月却是增长的,故B错;
选项C:增长率的平均值为 (%),
故C错;
选项D:全社会固定资产投资的中位数是687.7,而全社会固定资产投资的
平均数为 ,故D正确.
故选:D.
7.管理人员从一池塘内随机捞出40条鱼,做上标记后放回池塘.10天后,又从池塘内随机捞出70条鱼,其中有标记的有2条.根据以上数据可以估计该池塘内鱼的总条数是( )
A.2800B.1800C.1400D.1200
【答案】C
【分析】由从池塘内捞出70条鱼,其中有标记的有2条,可得所有池塘中有标记的鱼的概率,结合池塘内具有标记的鱼一共有40条鱼,按照比例即得解.
【详解】设估计该池塘内鱼的总条数为,
由题意,得从池塘内捞出70条鱼,其中有标记的有2条,
所有池塘中有标记的鱼的概率为:,
又因为池塘内具有标记的鱼一共有40条鱼,
所以,解得,
即估计该池塘内共有条鱼.
故选:C.
8.【多选题】港珠澳大桥是中国境内一座连接中国香港、广东珠海和中国澳门的桥隧工程,因其超大的建筑规模、空前的施工难度和顶尖的建造技术而闻名世界.港珠澳大桥为中国内地前往中国香港的游客提供了便捷的交通途径,某旅行社分年龄段统计了港珠澳大桥落地以后,由港珠澳大桥实现中国内地前往中国香港的老、中、青旅客的人数比为5:2:3,现使用分层随机抽样的方法从这些旅客中随机抽取n名,若青年旅客抽到60人,则下列说法正确的是( )
A.老年旅客抽到150人B.中年旅客抽到40人
C.D.被抽到的老年旅客和中年旅客人数之和超过200
【答案】BC
【分析】根据分层抽样的定义分别求出的值,老年旅客抽到的人数和中年旅客抽到的人数,然后判断即可
【详解】因为老、中、青旅客的人数比为5:2:3,青年旅客抽到60人,
所以,解得,
所以老年旅客抽到(人),
中年旅客抽到(人),100+40=140<200.
故选:BC.
9.【多选题】下列命题中是真命题的有( )
A.有三种个体按的比例分层抽样调查,如果抽取的个体数为,则样本容量为
B.一组数据的平均数、众数、中位数相同
C.若甲组数据的方差为,乙组数据为,则这两组数据中较稳定的是甲
D.一组数的分位数为
【答案】ABD
【分析】根据分层抽样原则直接计算即可得到样本容量,知A正确;根据平均数、众数和中位数定义直接判断可知B正确;根据方差的计算方法可知乙组方差更小,则其数据更稳定,知C错误;由百分位数的计算可知D正确.
【详解】对于A,根据分层抽样原则可知:样本容量为,A正确;
对于B,由平均数、众数和中位数定义可知:该组数据平均数为;众数为;中位数为;B正确;
对于C,乙组数据的平均数为,
则其方差,
乙组数据更稳定,C错误;
对于D,,将该组数按照从小到大顺序排列,第个数为,
该组数据的分位数为,D正确.
故选:ABD.
10.【多选题】新中国成立以来,我国一共进行了七次全国人口普查(以下简称“普查”),历次普查得到的全国人口总数如图1所示,城镇人口比重如图2所示.下列结论正确的是( )
A.第三次普查城镇人口数量低于2亿
B.对比这七次普查的结果,我国城镇人口数量逐次递增
C.第六次普查城镇人口数量超过第二次人口普查总人口数
D.与前一次普查对比,第五次普查的总人口增长量高于第四次普查的总人口增长量
【答案】BD
【分析】根据直方图和折线图分析各项描述的正误即可.
【详解】A:第三次普查城镇人口数量万人,即大于2亿,错误;
B:各次普查总人口数逐年递增,同时城镇人口比重也逐年递增,故我国城镇人口数量逐次递增,正确;
C:第六次普查城镇人口数量万人,而第二次人口普查总人口数为万人,第六次普查城镇人口数量未超过第二次人口普查总人口数,错误;
D:第五次普查的总人口增长量万人,第四次普查的总人口增长量万人,正确.
故选:BD
11.已知样本数据1,2,3,4,的平均数是3,则数据2,4,6,8,的方差是______.
【答案】8
【分析】先由平均数公式列方程求出,再求新数据的方差
【详解】因为样本数据1,2,3,4,的平均数是3,
所以,解得,
所以数据2,4,6,8,10的平均数为
,
所以方差为,
故答案为:8
12.已知平均数为a,标准差是b,则的平均数是________,标准差是________.
【答案】 ## 3b
【分析】列出平均数与标准差公式化简即可.
【详解】解:由题得,
则的平均数是,
的标准差是.
故答案为:;.
13.某市政府为了节约生活用水,实施居民生活用水定额管理政策,即确定一个居民月用水量标准x(单位:吨),用水量不超过x的部分按平价收费,超出x的部分按议价收费,并随机抽取部分居民进行调查,抽取的居民月均用水量的频率分布直方图如图所示.(同一组中的数据以该组区间的中点值为代表)
(1)求频率分布直方图中a的值;
(2)试估计该市居民月均用水量的众数、平均数;
(3)如果希望85%的居民月均用水量不超过标准x,那么标准x定为多少比较合理?
【答案】(1)
(2)吨,吨
(3)
【分析】(1)利用频率分布直方图中所有矩形的面积之和为1进行求解.
(2)利用频率分布直方图中的最高矩形求众数,利用每个矩形的底端中点和其面积的乘积之和来求平均数.
(3)利用频率分布直方图求85%分位数即可.
(1)由频率分布直方图中所有矩形的面积之和为1,可得,解得.
(2)由频率分布直方图可知,该市居民月均用水量的众数约为(吨),由频率分布直方图可知,平均数约为(吨).
(3)由频率分布直方图可知,月均用水量低于2.5吨的居民人数所占的百分比为,月均用水量低于3吨的居民人数所占的百分比为,所以,由题意可得,解得.所以如果希望85%的居民月均用水量不超过标准x,那么x定为2.9吨比较合理.
【点睛】利用频率分布直方图求解样本数据的众数、平均数、中位数,原则如下:
(1)在样本数据的频率分布直方图中,最高矩形的中点的横坐标即为该组数据的众数;
(2)在频率分布直方图中,中位数左边和右边的矩形面积相等,由此可以估计中位数的值;
(3)在频率分布直方图中,平均数等于每个小矩形的面积乘以对应小矩形底边中点的横坐标之和.
B组 挑战自我
1.某班有50名学生,该班上学期期中考试的英语平均分为70分,标准差为s,后来发现两名学生的成绩记录有误:小明得了71分,却误记为46分;小刘得了70分,却误记为95分.更正后的标准差为,则s与之间的大小关系为( )
A.B.C.D.无法确定
【答案】C
【分析】依题意,知虽然两名学生的成绩记录出错,但50名学生成绩的平均分没变化,再结合方差公式,即可求解.
【详解】依题意,知虽然两名学生的成绩记录出错,但50名学生成绩的平均分没变化.
由于,根据方差的公式,
可得.
故选:C.
2.一组数据共有7个数:,2,2,2,10,5,4,且,若这组数据的平均数、中位数、众数中最大与最小数之和是该三数中间数字的两倍,则第分位数是______.
【答案】5
【分析】先将数据按照从小到大重新排列,再求出平均数、中位数、众数,由题设建立关系解出,再求第分位数即可.
【详解】将数据按照从小到大重新排列为2,2,2,,4,5,10,则平均数为,中位数为,众数为2,
又,则,解得,又,所以第分位数是5.
故答案为:5.
3.一组实数,,……的平均数为3,方差为10;另一组实数,,……的平均数为8,方差为10.则这100个实数的平均数为______,方差为______.
【答案】
【分析】根据题意结合平均数的计算公式可得结果;根据题意结合方差的计算公式可得结果.
【详解】由题意,,,
则,
这100个实数的平均数为;
由题意,,,
则,
这100个实数的方差为;
故答案为:.
4.已知样本的各个个体的值由小到大依次为2,3,3,7,a,b,12,13,19,20,且样本的中位数为10.5,则___________;若要使该样本的方差最小,则___________.
【答案】 21 110
【分析】根据中位数的定义可得与的关系,要使样本的方差最小, 即最小,利用与的关系消去,得关于的一元二次式,利用配方法可求出函数的最小值,进而可得和的值,从而即可得的值.
【详解】解:因为样本的各个个体的值由小到大依次为2,3,3,7,a,b,12,13,19,20,且样本的中位数为10.5,
所以,即;
所以样本平均数为,
要使样本方差最小,即最小,
又因为,
因为,
所以当或时,取得最小值,
又,
所以或,
所以.
故答案为:21;110.
7
8
9
7
5
4
10
9
4
7
高考数学一轮复习【考点题型归纳讲练】导学案(新高考专用)专题研究概率与统计的综合问题(原卷版+解析): 这是一份高考数学一轮复习【考点题型归纳讲练】导学案(新高考专用)专题研究概率与统计的综合问题(原卷版+解析),共22页。
高考数学一轮复习【考点题型归纳讲练】导学案(新高考专用)专题研究函数的值域(原卷版+解析): 这是一份高考数学一轮复习【考点题型归纳讲练】导学案(新高考专用)专题研究函数的值域(原卷版+解析),共31页。
高考数学一轮复习【考点题型归纳讲练】导学案(新高考专用)专题研究五导数与不等式综合问题(原卷版+解析): 这是一份高考数学一轮复习【考点题型归纳讲练】导学案(新高考专用)专题研究五导数与不等式综合问题(原卷版+解析),共16页。