还剩36页未读,
继续阅读
2019届二轮复习用样本估计总体学案(全国通用)
展开
用样本估计总体
(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.
(2)理解样本数据标准差的意义和作用,会计算数据标准差.
(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.
(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.
(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
一、数字特征
1.众数、中位数、平均数
数字特征
样本数据
频率分布直方图
众数
出现次数最多的数据
取最高的小长方形底边中点的横坐标
中位数
将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)
把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标
平均数
样本数据的算术平均数
每个小矩形的面积乘以小矩形底边中点的横坐标之和
2.极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
方差:.
标准差:.
注:平均数反映了数据取值的平均水平,方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.
3.性质
(1)若的平均数为,那么的平均数为.
(2)数据与数据的方差相等,即数据经过平移后方差不变.
(3)若的方差为s2,那么的方差为.
二、茎叶图
1.定义
茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
2.表示方法
(1)对于样本数据较少,且分布较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时做类似处理.
(2)对于样本数据较少,且分布较为集中的两组数据,关键是找到两组数据共有的茎.
三、统计表
1.频率分布直方图
(1)画频率分布直方图的步骤
①求极差(即一组数据中最大值与最小值的差);
②决定组距与组数;
③将数据分组;
④列频率分布表;
⑤画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).
(2)频率分布直方图的性质
①落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1.
②频率分布直方图与众数、中位数与平均数的关系
a.最高的小长方形底边中点的横坐标即是众数;
b.中位数左边和右边的小长方形的面积和是相等的;
c.平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
3.各种统计表的优点与不足
优点
不足
频率分布表
表示数据较确切
分析数据分布的总体态势不方便
频率分布直方图
表示数据分布情况非常直观
原有的具体数据信息被抹掉了
频率分布折线图
能反映数据的变化趋势
不能显示原有数据
茎叶图
一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况
样本数据较多或数据位数较多时,不方便表示数据
考向一 数字特征的应用
明确数字特征的意义:
平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
典例1 某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数、众数、中位数分别为
A.85,85,85 B.87,85,86
C.87,85,85 D.87,85,90
【答案】C
1.若一组数据的方差为1,则的方差为
A.1 B.2
C.4 D.8
2.已知一组数据3,5,7,x,10的平均数为6,则这组数据的方差为
A. B.6
C. D.5
考向二 茎叶图的应用
茎叶图的优、缺点:
由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示,其缺点是当样本容量较大时,作图较繁琐.
典例2 为了了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如图所示.
据此可估计上学期该校400名教师中,使用多媒体进行教学次数在[16,30)内的人数为
A.100 B.160
C.200 D.280
【答案】B
3.一次数学考试后,某老师从自己所带的两个班级中各抽取6人,记录他们的考试成绩,得到如图所示的茎叶图.已知甲班6名同学成绩的平均数为82,乙班6名同学成绩的中位数为77,则
A.3 B.
C.4 D.
考向三 频率分布直方图的应用
频率分布直方图是用样本估计总体的一种重要方法,是高考命题的一个热点,多以选择题或填空题的形式呈现,试题难度不大,多为容易题或中档题,且主要有以下几个命题角度:
(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.
(2)已知频率分布直方图,求某种范围内的数据.可利用图形及某范围结合求解.
(3)与概率有关的综合问题,可先求出频率,再利用古典概型等知识求解.
典例3 某商店为调查进店顾客的消费水平,调整营销思路,统计了一个月来进店的2000名顾客的消费金额(单位:元),并从中随机抽取了100名顾客的消费金额按[0,50],(50,100],(100,150],(150,200],(200,250]进行统计,得到如图所示的频率分布直方图.已知a,b,c成等差数列,则该商店这一个月来消费金额超过150元的顾客数量约为
A.600 B.30
C.60 D.300
【答案】A
4.200辆载着某炮兵团士兵的汽车急赴某地抗洪抢险,如图是汽车途经某大桥时的速度的频率分布直方图,则这200辆汽车的速度的中位数的估计值为
A.64 B.63
C.63.5 D.65
典例4 为了增强学生的环保意识,某中学随机抽取了50名学生举行了一次环保知识竞赛,并将本次竞赛的成绩(得分均为整数,满分100分)进行整理,制成下表:
成绩
[40,50)
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
2
3
14
15
12
4
(1)作出被抽查学生成绩的频率分布直方图;
(2)若从成绩在[40,50)中选1名学生,从成绩在[90,100]中选2名学生,共3名学生召开座谈会,求[40,50)组中学生A1和[90,100]组中学生B1同时被选中的概率.
(2)记[40,50)组中的学生为A1,A2,[90,100]组中的学生为B1,B2,B3,B4,A1和B1同时被选中记为事件M.
由题意可得,全部的基本事件为:
A1B1B2,A1B1B3,A1B1B4,A1B2B3,A1B2B4,A1B3B4,A2B1B2,A2B1B3,A2B1B4,A2B2B3,A2B2B4,A2B3B4,共12个,
事件M包含的基本事件为:A1B1B2,A1B1B3,A1B1B4,共3个,
所以学生A1和B1同时被选中的概率为P(M)==.
5.已知经销某种商品的电商在任何一个销售季度内,每售出吨该商品可获利润万元,未售出的商品,每吨亏损万元.根据往年的销售经验,得到一个销售季度内市场需求量的频率分布直方图如图所示.已知电商为下一个销售季度筹备了吨该商品.现以(单位:吨,)表示下一个销售季度的市场需求量,(单位:万元)表示该电商下一个销售季度内经销该商品获得的利润.
(1)根据频率分布直方图,估计一个销售季度内市场需求量的平均数与中位数的大小;
(2)根据频率分布直方图估计利润不少于57万元的概率.
1.有下列说法:①一组数据不可能有两个众数;②一组数据的方差必须是正数;③将一组数据中的每一个数据都加上或减去同一常数后,方差不变;④在频率分布直方图中,每个小长方形的面积等于相应小组的频率.其中错误的有
A.0个 B.1个
C.2个 D.3个
2.某商场对一个月内每天的顾客人数进行统计,得到如图所示的样本茎叶图,则该样本的中位数和众数分别是
A.46,45 B.45,46
C.45,45 D.47,45
3.某仪器厂从新生产的一批零件中随机抽取40个检测.如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为、,、、、、、,则样本的中位数在
A.第3组 B.第4组
C.第5组 D.第6组
4.在如图所示的茎叶图中,有一个数字模糊不清,但某同学曾经计算得到该组数据的极差与中位数之和为61,则模糊不清的数字为
A.1 B.2
C.3 D.4
5.在某次高中数学竞赛中,随机抽取90名考生,其分数如图所示,若所得分数的平均数,众数,中位数分别为, 则,,的大小关系为
A. B.
C. D.
6.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为
A.2 B.3
C.4 D.5
7.已知甲、乙两组数据的茎叶图如图所示,若它们的中位数相同,平均数也相同,则图中的m,n的比值=
A.1 B.
C. D.
8.为普及校园安全知识,某校举行了由全部学生参加的校园安全知识考试,从中抽出60名学生,将其成绩分成六段[40,50),[50,60),…,[90,100]后画出如图所示的频率分布直方图.观察图形的信息,估计这次考试的及格率(60分及以上为及格)、平均分分别为
A.75 ,71 B.80 ,85
C.85 ,90 D.70 ,65
9.一个样本,3,5,7的平均数是,且,分别是数列的第2项和第4项,则这个样本的方差是
A.3 B.4
C.5 D.6
10.已知甲、乙两名篮球运动员进行罚球训练,每人练习10组,每组罚球40个,甲、乙两人每组命中个数的茎叶图如图所示,则下列结论中错误的是
A.甲命中个数的极差是29 B.乙命中个数的众数是21
C.甲的命中率比乙高 D.甲命中个数的中位数是25
11.某 店在2018年1月的促销活动中,随机抽查了100名消费者的消费情况,并记录了他们的消费金额(单位:千元),将数据分成6组:(0,1],(1,2],(2,3],(3,4],(4,5],(5,6],整理得到频率分布直方图如图所示.若消费金额不超过3千元的人数占总人数的,则消费金额超过4千元的人数为
A.12 B.15
C.16 D.18
12.某市安踏专卖店为了了解某日旅游鞋的销售情况,抽取了部分顾客所购旅游鞋的尺寸,将所得数据整理后,画出频率分布直方图.已知从左到右前3个小组的频率之比为1∶2∶3,第4小组与第5小组的频率分布直方图如图所示,第2小组的频数为10,则第5小组的频数是
A.4 B.5
C.8 D.10
13.某次知识竞赛中,五个参赛小队的初始积分都是50,在答题过程中,各小队每答对一题可使本队积分增加5,每答错一题本队积分不变,若答题过程中五个小队答对的题数分别是4,7,6,2,5,则这五个小队积分的方差为 .
14.随着智能手机的普及, 络购物越来越受到人们的青睐,某研究性学习小组对使用智能手机的利与弊随机调查了10位同学,得到的满意度打分如茎叶图所示.
若这组数据的中位数、平均数分别为,则的大小关系是 .
15.某市为了增加2018届高三毕业生对各著名高校的了解,从而调动他们的学习动力,利用2017年暑假组织部分有意愿的学生赴部分大学参加夏令营,各大学夏令营的天数都在[2,12]内,现从中抽出100名学生,统计他们参加夏令营的天数,绘制成如图所示的频率分布直方图,则这100名学生中参加夏令营的天数在[6,10)的人数为 .
16.为组织好“市九运会”,组委会征集了800名志愿者,现对他们的年龄抽样统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得:
(1)年龄在[25,30)内对应小长方形的高度为 ;
(2)这800名志愿者中年龄在[25,35)内的人数为 .
17.某届马拉松招聘志愿者,报名者首先进入笔试,按笔试成绩选出参加面试的人员,最后确定入选名单.现从报名的所有人中按男女比例采用分层抽样的方式抽取了100名,统计了他们的笔试成绩(满分100分),统计结果见如下所示的频率分布表,其中分数在区间[90,100]内的人员直接进入面试阶段,若分数在区间[80,90)内,则需要进行短期的培训后,再参加第二次笔试,从而确定能否参加面试.
分数区间
频数
频率
[50,60)
8
0.08
[60,70)
b
[70,80)
42
0.42
[80,90)
a
0.26
[90,100]
8
合计
100
1.00
(1)求a与b的值,并作出频率分布直方图;
(2)(i)根据表中数据,估计这100名人员笔试成绩的中位数 (精确到小数点后1位);
(ii)分析知,这100名人员在各分数段内的男女比例如下表所示,那么若以频率分布表中的频率近似作为概率,在总共2000名参考人员中,求经过第一次考试就可直接进入面试的男女人数的估计值.
分数段
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
男女比例
1∶1
3∶1
3∶4
7∶6
3∶5
18.随着 技发展,手机成了人们日常生活中必不可少的通信工具,现在的中学生几乎都拥有了属于自己的手机了.为了调查某地区高中生一周使用手机的频率,某机构随机调查了该地区100名高中生某一周使用手机的时间(单位:小时),所取样本数据分组区间为,由此得到如图所示的频率分布直方图.
(1)求的值并估计该地区高中生一周使用手机时间的平均值;
(2)从使用手机时间在的四组学生中,用分层抽样方法抽取13人,则每层各应抽取多少人?
19.某市为了制定合理的节电方案,对居民用电情况进行了调查,通过抽样,获得了某年200户居民每户的月均用电量(单位:百千瓦时),将数据按,,,,,分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中的值;
(2)设该市有100万户居民,估计全市每户居民中月均用电量不低于6百千瓦时的人数及每户居民月均用电量的中位数;
(3)政府计划对月均用电量在4百千瓦时以下的用户进行奖励,月均用电量在内的用户奖励20元/月,月均用电量在内的用户奖励10元/月,月均用电量在内的用户奖励2元/月.若该市共有400万户居民,试估计政府执行此计划的年度预算.
20.某研究小组为了研究某品牌智能手机在正常使用情况下的电池供电时间,分别从该品牌手机的甲、乙两种型号中各选取部进行测试,其结果如下:
甲种手机供电时间(小时)
乙种手机供电时间(小时)
(1)求甲、乙两种手机供电时间的平均值与方差,并判断哪种手机电池质量好;
(2)为了进一步研究乙种手机的电池性能,从上述部乙种手机中随机抽取部,求这两部手机中恰有一部手机的供电时间大于该种手机供电时间平均值的概率.
21.某城市为了满足市民出行的需要和节能环保的要求,在公共场所提供单车共享服务,某部门为了对该城市共享单车进行监管,随机选取了位市民对共享单车的情况进行问卷调査,并根据其满意度评分值(满分分)制作的茎叶图如图所示:
(1)分别计算男性打分的平均数和女性打分的中位数;
(2)从打分在分以下(不含分)的市民中抽取人,求有女性被抽中的概率.
1.(2017新课标全国Ⅰ文 )为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
2.(2017山东文 )如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为
A.3,5 B.5,5
C.3,7 D.5,7
3.(2017新课标全国Ⅲ文 )某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
4.(2016新课标全国Ⅲ文 )某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15C,B点表示四月的平均最低气温约为5C.下面叙述不正确的是
A.各月的平均最低气温都在0C以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温高于20C的月份有5个
5.(2016山东文 )某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是,样本数据分组为 .根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是
A.56 B.60
C.120 D.140
6.(2018江苏)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为 ▲ .
7.(2016上海文 )某次体检,6位同学的身高(单位:米)分别为1.72,1.78,1.75,1.80,1.69,1.77,则这组数据的中位数是 (米).
8.(2018新课标全国Ⅰ文 )某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用水量
频数
1
3
2
4
9
26
5
使用了节水龙头50天的日用水量频数分布表
日用水量
频数
1
5
13
10
16
5
(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)
9.(2018新课标全国Ⅲ文 节选)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表:
超过
不超过
第一种生产方式
第二种生产方式
10.(2017新课标全国Ⅱ文 )海水养殖场进行某水产品的新、旧 箱养殖方法的产量对比,收获时各随机抽取了100个 箱,测量各箱水产品的产量(单位:kg), 其频率分布直方图如下:
(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99 的把握认为箱产量与养殖方法有关;
箱产量<50 kg
箱产量≥50 kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.
附:
P()
0.050 0.010 0.001
k
3.841 6.635 10.828
.
11.(2017北京文 )某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30],[30,40],,[80,90],并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
12.(2016新课标全国Ⅱ文 )某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数
0
1
2
3
4
≥5
保费
0.85a
a
1.25a
1.5a
1.75a
2a
随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:
出险次数
0
1
2
3
4
≥5
频数
60
50
30
30
20
10
(1)记A为事件:“一续保人本年度的保费不高于基本保费”,求P(A)的估计值;
(2)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160 ”,求P(B)的估计值;
(3)求续保人本年度的平均保费估计值.
13.(2016北京文 )某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
(1)如果w为整数,那么根据此次调查,为使80 以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.
14.(2016四川文 )我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5), [0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;
(3)估计居民月均用水量的中位数.
变式拓展
1.【答案】C
【解析】若的方差为,则,,,的方差为,故可得当的方差为1时,的方差为,故选C.
2.【答案】C
【解析】先根据平均数公式求出x,再利用方差公式求解.
由题意,得3+5+7+x+10=6×5,得x=5,
所以这组数据的方差s2=(9+1+1+1+16)=.
3.【答案】C
4.【答案】D
【解析】由频率分布直方图知,前两个小矩形的面积之和为(0.01+0.02)×10=0.3,
由于0.5-0.3=0.2,则×10=5,
所以中位数为60+5=65.故选D.
5.【解析】(1)估计一个销售季度内市场需求量的平均数为(吨).
由频率分布直方图易知,由于时,对应的频率为,而时,对应的频率为,
因此一个销售季度内市场需求量的中位数应属于区间,
于是估计中位数应为(吨).
(2)当时,;
当时,,
所以,.
当时,由,得;
当时,,
所以,利润不少于万元当且仅当,
于是由频率分布直方图可知,市场需求量的频率为,所以下一个销售季度内的利润不少于57万元的概率的估计值为.
考点冲关
1.【答案】C
2.【答案】A
【解析】由茎叶图可知所给数据,其中出现最多的是,共三次,所以为众数,将所有数据从小到大排列后,中间两数为,故中位数为.故本题答案为.
3.【答案】B
【解析】由图计算可得前四组的频数是22,其中第4组的频数为8,故本题正确答案是
4.【答案】B
【解析】设模糊不清的数字为x,由题意知该组数据的极差为48-20=28,所以中位数为61-28=33,
所以+32=33,解得x=2,
即模糊不清的数字为2.
5.【答案】D
【解析】经计算得平均值,众数为,中位数为,故,选D.
6.【答案】B
【解析】依题意可得10×(0.005+0.01+0.02+a+0.035)=1,则a=0.03,
从而身高在[120,130),[130,140),[140,150]三组内的学生比例为3∶2∶1,所以从身高在[140,150]内的学生中选取的人数应为×18=3,故选B.
7.【答案】C
8.【答案】A
【解析】及格的各组的频率和是(0.015+0.030+0.025+0.005)×10=0.75,即及格率为75 ;
样本的均值为45×0.10+55×0.15+65×0.15+75×0.30+85×0.25+95×0.05=71,
用这个分数估计总体的分数即得总体的平均分数为71.故选A.
【名师点睛】利用频率分布直方图求众数、中位数和平均数时,应注意三点:
①最高的小长方形底边中点的横坐标即是众数;
②中位数左边和右边的小长方形的面积和是相等的;
③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
9.【答案】C
【解析】∵样本,3,5,7的平均数是,且,分别是数列的第2项和第4项,
∴,,故选C.
10.【答案】D
【解析】由茎叶图可知甲命中个数的极差为37-8=29,故A正确;
易知乙命中个数的众数是21,故B正确;
甲的命中率为=0.535,乙的命中率为=0.4225,所以甲的命中率比乙高,C正确;
甲命中个数的中位数为=23,所以D不正确.故选D.
11.【答案】B
【解析】∵消费金额不超过3千元的人数占总人数的,∴第4,5,6组的频率之和为1-0.6=0.4,从图中可知第4组的频率为0.25,∴第5,6组的频率之和为0.4-0.25=0.15,∴消费金额超过4千元的人数为15.
12.【答案】B
13.【答案】74
【解析】由题意知,五个小队的积分分别是70,85,80,60,75,
所以五个小队的积分的平均值为=74,
所以五个小队的积分的方差为=74.
14.【答案】
【解析】从图中可知中位数为,
平均数为,所以.
15.【答案】58
【解析】由频率分布直方图可得参加夏令营的天数在[6,10)的频率为1-(0.04+0.12+0.05)×2=0.58,则参加夏令营的天数在[6,10)的人数为100×0.58=58.
16.【答案】(1)0.04;(2)440
【解析】(1)因为所有小长方形的面积之和为1,所以年龄在[25,30)内对应小长方形的高度为[1-(5×0.01+5×0.07+5×0.06+5×0.02)]=0.04.
(2)年龄在[25,35)内的频率为0.04×5+0.07×5=0.55,人数为0.55×800=440.
17.【解析】(1)由已知得a=0.26×100=26,分数区间[60,70)对应的频数为100-8-42-26-8=16,
因而b==0.16.
频率分布直方图如图.
18.【解析】(1)由于小矩形的面积之和为1,
则,由此可得.
该地区高中生一周使用手机时间的平均值为.
(2)使用手机时间在的学生有人,使用手机时间在的学生有人,使用手机时间在的学生有人,使用手机时间在的学生有人,
故用分层抽样法从使用手机时间在的四组学生中抽样,抽取人数分别为.
19.【解析】(1)由题得=,
所以.
(3)该市月均用电量在内的用户数分别为,所以每月预算为(元),
故估计政府执行此计划的年度预算为(万元)(亿元).
20.【解析】(1)甲的平均值,
乙的平均值,
甲的方差为
,
乙的方差
,
因为甲、乙两种手机的平均数相同,甲的方差比乙的方差小,所以认为甲种手机电池质量更好.
(2)由题意得上述部乙种手机中有部手机的供电时间大于该种手机供电时间平均值,记它们分别是,其余的为,
从上述部乙种手机中随机抽取部的所有结果为: ,共有种,
其中恰有一部手机的供电时间大于该种手机供电时间平均值的结果为: ,共有种,
所以所求概率为.
21.【解析】(1)男性打分的平均数为(分),
女性打分的中位数为(分).
直通高考
1.【答案】B
【解析】评估这种农作物亩产量稳定程度的指标是标准差或方差,故选B.
【名师点睛】众数:一组数据出现次数最多的数叫众数,众数反映一组数据的多数水平;
中位数:一组数据中间的数(起到分水岭的作用),中位数反映一组数据的中间水平;
平均数:反映一组数据的平均水平;
方差:反映一组数据偏离平均数的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小).在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.
标准差是方差的算术平方根,意义在于反映一组数据的离散程度.
2.【答案】A
【解析】由题意,甲组数据为56,62,65,,74,乙组数据为59,61,67,,78.要使两组数据的中位数相等,则,所以,又平均数相同,则,解得.故选A.
【名师点睛】由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示.缺点是当样本容量较大时,作图较烦琐. 利用茎叶图对样本进行估计时,要注意区分茎与叶,茎是指中间的一列数,叶是从茎的旁边生长出来的数.
3.【答案】A
【名师点睛】用样本估计总体时统计图表主要有:
(1)频率分布直方图,特点:频率分布直方图中各小长方形的面积等于对应区间的频率,所有小长方形的面积之和为1;
(2)频率分布折线图,连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(3)茎叶图,对于统计图表类题目,最重要的是认真观察图表,从中提炼出有用的信息和数据.
4.【答案】D
【解析】由题图可知各月的平均最低气温都在0C以上,A正确;
由题图可知七月的平均温差大于7.5C,而一月的平均温差小于7.5C,所以七月的平均温差比一月的平均温差大,B正确;
由题图可知三月和十一月的平均最高气温都大约在10C,基本相同,C正确;
由题图可知平均最高气温高于20℃的月份有3个,所以不正确.
故选D.
5.【答案】D
【解析】自习时间不少于22.5小时为后三组,其频率和为,故人数为人,选D.
【名师点睛】本题主要考查频率分布直方图,是一道基础题目.从历年高考题目看,图表题已是屡见不鲜,作为一道应用题,考查考生的识图、用图能力,以及应用数学知识解决实际问题的能力.
6.【答案】90
【解析】由茎叶图可知,5位裁判打出的分数分别为,故平均数为.
7.【答案】1.76
【解析】将这6位同学的身高按照从低到高排列为:1.69,1.72,1.75,1.77,1.78,1.80,这六个数的中位数是1.75与1.77的平均数,显然为1.76.
【名师点睛】本题主要考查中位数的概念,是一道基础题目.从历年高考题目看,涉及统计的题目,往往不难,主要考查考生的视图、用图能力,以及应用数学解决实际问题的能力.
8.【解析】(1)
【名师点睛】该题考查的是有关统计的问题,涉及到的知识点有频率分布直方图的绘制、利用频率分布直方图计算变量落在相应区间上的概率、利用频率分布直方图求平均数,在解题的过程中,需要认真审题,细心运算,仔细求解,就可以得出正确结果.
9.【解析】(1)第二种生产方式的效率更高.
理由如下:
(i)由茎叶图可知:用第一种生产方式的工人中,有75 的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75 的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.
(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.
(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.
(2)由茎叶图知.
列联表如下:
超过
不超过
第一种生产方式
15
5
第二种生产方式
5
15
10.【解析】(1)旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.
因此,事件A的概率估计值为0.62.
(2)根据箱产量的频率分布直方图得列联表
箱产量<50 kg
箱产量≥50 kg
旧养殖法
62
38
新养殖法
34
66
K2=.
由于15.705>6.635,故有99 的把握认为箱产量与养殖方法有关.
(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.
【名师点睛】(1)频率分布直方图中小长方形面积等于对应概率,所有小长方形面积之和为1.
(2)频率分布直方图中均值等于组中值与对应概率乘积的和.
(3)均值大小代表水平高低,方差大小代表稳定性.
11.【解析】(1)根据频率分布直方图可知,样本中分数不小于70的频率为,所以样本中分数小于70的频率为.
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.
【名师点睛】(1)用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,而频率分布直方图比较直观.
(2)频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.
12.【解析】(1)事件A发生当且仅当一年内出险次数小于2.由所给数据知,一年内出险次数小于2的频率为,
故P(A)的估计值为0.55.
(2)事件B发生当且仅当一年内出险次数大于1且小于4.由所给数据知,一年内出险次数大于1且小于4的频率为,
故P(B)的估计值为0.3.
(3)由所给数据得
保费
0.85a
a
1.25a
1.5a
1.75a
2a
频率
0.30
0.25
0.15
0.15
0.10
0.05
调查的200名续保人的平均保费为
,
因此,续保人本年度平均保费的估计值为1.192 5a.
【名师点睛】样本的数字特征常见的命题角度有:(1)样本的数字特征与频率分布直方图交汇;(2)样本的数字特征与茎叶图交汇;(3)样本的数字特征与优化决策问题交汇.
(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:
组号
1
2
3
4
5
6
7
8
分组
频率
根据题意,该市居民该月的人均水费估计为:
(元).
【名师点睛】(1)用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法. 频率分布表在数量表示上比较准确,频率分布直方图比较直观.
(2)频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.
14.【解析】(1)由频率分布直方图,可知:月均用水量在[0,0.5)的频率为0.08×0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.
由1–(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,
解得a=0.30.
(2)由(1),100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.
由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.
【名师点睛】本题主要考查频率分布直方图、频率、频数的计算公式等基础知识,考查学生的分析问题、解决问题的能力.在频率分布直方图中,第n个小矩形的面积就是相应组的频率,所有小矩形的面积之和为1,这是解题的关键,也是识图的基础.
用样本估计总体
(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.
(2)理解样本数据标准差的意义和作用,会计算数据标准差.
(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.
(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.
(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
一、数字特征
1.众数、中位数、平均数
数字特征
样本数据
频率分布直方图
众数
出现次数最多的数据
取最高的小长方形底边中点的横坐标
中位数
将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)
把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标
平均数
样本数据的算术平均数
每个小矩形的面积乘以小矩形底边中点的横坐标之和
2.极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
方差:.
标准差:.
注:平均数反映了数据取值的平均水平,方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.
3.性质
(1)若的平均数为,那么的平均数为.
(2)数据与数据的方差相等,即数据经过平移后方差不变.
(3)若的方差为s2,那么的方差为.
二、茎叶图
1.定义
茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
2.表示方法
(1)对于样本数据较少,且分布较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时做类似处理.
(2)对于样本数据较少,且分布较为集中的两组数据,关键是找到两组数据共有的茎.
三、统计表
1.频率分布直方图
(1)画频率分布直方图的步骤
①求极差(即一组数据中最大值与最小值的差);
②决定组距与组数;
③将数据分组;
④列频率分布表;
⑤画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).
(2)频率分布直方图的性质
①落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1.
②频率分布直方图与众数、中位数与平均数的关系
a.最高的小长方形底边中点的横坐标即是众数;
b.中位数左边和右边的小长方形的面积和是相等的;
c.平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
3.各种统计表的优点与不足
优点
不足
频率分布表
表示数据较确切
分析数据分布的总体态势不方便
频率分布直方图
表示数据分布情况非常直观
原有的具体数据信息被抹掉了
频率分布折线图
能反映数据的变化趋势
不能显示原有数据
茎叶图
一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况
样本数据较多或数据位数较多时,不方便表示数据
考向一 数字特征的应用
明确数字特征的意义:
平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
典例1 某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数、众数、中位数分别为
A.85,85,85 B.87,85,86
C.87,85,85 D.87,85,90
【答案】C
1.若一组数据的方差为1,则的方差为
A.1 B.2
C.4 D.8
2.已知一组数据3,5,7,x,10的平均数为6,则这组数据的方差为
A. B.6
C. D.5
考向二 茎叶图的应用
茎叶图的优、缺点:
由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示,其缺点是当样本容量较大时,作图较繁琐.
典例2 为了了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如图所示.
据此可估计上学期该校400名教师中,使用多媒体进行教学次数在[16,30)内的人数为
A.100 B.160
C.200 D.280
【答案】B
3.一次数学考试后,某老师从自己所带的两个班级中各抽取6人,记录他们的考试成绩,得到如图所示的茎叶图.已知甲班6名同学成绩的平均数为82,乙班6名同学成绩的中位数为77,则
A.3 B.
C.4 D.
考向三 频率分布直方图的应用
频率分布直方图是用样本估计总体的一种重要方法,是高考命题的一个热点,多以选择题或填空题的形式呈现,试题难度不大,多为容易题或中档题,且主要有以下几个命题角度:
(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.
(2)已知频率分布直方图,求某种范围内的数据.可利用图形及某范围结合求解.
(3)与概率有关的综合问题,可先求出频率,再利用古典概型等知识求解.
典例3 某商店为调查进店顾客的消费水平,调整营销思路,统计了一个月来进店的2000名顾客的消费金额(单位:元),并从中随机抽取了100名顾客的消费金额按[0,50],(50,100],(100,150],(150,200],(200,250]进行统计,得到如图所示的频率分布直方图.已知a,b,c成等差数列,则该商店这一个月来消费金额超过150元的顾客数量约为
A.600 B.30
C.60 D.300
【答案】A
4.200辆载着某炮兵团士兵的汽车急赴某地抗洪抢险,如图是汽车途经某大桥时的速度的频率分布直方图,则这200辆汽车的速度的中位数的估计值为
A.64 B.63
C.63.5 D.65
典例4 为了增强学生的环保意识,某中学随机抽取了50名学生举行了一次环保知识竞赛,并将本次竞赛的成绩(得分均为整数,满分100分)进行整理,制成下表:
成绩
[40,50)
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
2
3
14
15
12
4
(1)作出被抽查学生成绩的频率分布直方图;
(2)若从成绩在[40,50)中选1名学生,从成绩在[90,100]中选2名学生,共3名学生召开座谈会,求[40,50)组中学生A1和[90,100]组中学生B1同时被选中的概率.
(2)记[40,50)组中的学生为A1,A2,[90,100]组中的学生为B1,B2,B3,B4,A1和B1同时被选中记为事件M.
由题意可得,全部的基本事件为:
A1B1B2,A1B1B3,A1B1B4,A1B2B3,A1B2B4,A1B3B4,A2B1B2,A2B1B3,A2B1B4,A2B2B3,A2B2B4,A2B3B4,共12个,
事件M包含的基本事件为:A1B1B2,A1B1B3,A1B1B4,共3个,
所以学生A1和B1同时被选中的概率为P(M)==.
5.已知经销某种商品的电商在任何一个销售季度内,每售出吨该商品可获利润万元,未售出的商品,每吨亏损万元.根据往年的销售经验,得到一个销售季度内市场需求量的频率分布直方图如图所示.已知电商为下一个销售季度筹备了吨该商品.现以(单位:吨,)表示下一个销售季度的市场需求量,(单位:万元)表示该电商下一个销售季度内经销该商品获得的利润.
(1)根据频率分布直方图,估计一个销售季度内市场需求量的平均数与中位数的大小;
(2)根据频率分布直方图估计利润不少于57万元的概率.
1.有下列说法:①一组数据不可能有两个众数;②一组数据的方差必须是正数;③将一组数据中的每一个数据都加上或减去同一常数后,方差不变;④在频率分布直方图中,每个小长方形的面积等于相应小组的频率.其中错误的有
A.0个 B.1个
C.2个 D.3个
2.某商场对一个月内每天的顾客人数进行统计,得到如图所示的样本茎叶图,则该样本的中位数和众数分别是
A.46,45 B.45,46
C.45,45 D.47,45
3.某仪器厂从新生产的一批零件中随机抽取40个检测.如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为、,、、、、、,则样本的中位数在
A.第3组 B.第4组
C.第5组 D.第6组
4.在如图所示的茎叶图中,有一个数字模糊不清,但某同学曾经计算得到该组数据的极差与中位数之和为61,则模糊不清的数字为
A.1 B.2
C.3 D.4
5.在某次高中数学竞赛中,随机抽取90名考生,其分数如图所示,若所得分数的平均数,众数,中位数分别为, 则,,的大小关系为
A. B.
C. D.
6.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为
A.2 B.3
C.4 D.5
7.已知甲、乙两组数据的茎叶图如图所示,若它们的中位数相同,平均数也相同,则图中的m,n的比值=
A.1 B.
C. D.
8.为普及校园安全知识,某校举行了由全部学生参加的校园安全知识考试,从中抽出60名学生,将其成绩分成六段[40,50),[50,60),…,[90,100]后画出如图所示的频率分布直方图.观察图形的信息,估计这次考试的及格率(60分及以上为及格)、平均分分别为
A.75 ,71 B.80 ,85
C.85 ,90 D.70 ,65
9.一个样本,3,5,7的平均数是,且,分别是数列的第2项和第4项,则这个样本的方差是
A.3 B.4
C.5 D.6
10.已知甲、乙两名篮球运动员进行罚球训练,每人练习10组,每组罚球40个,甲、乙两人每组命中个数的茎叶图如图所示,则下列结论中错误的是
A.甲命中个数的极差是29 B.乙命中个数的众数是21
C.甲的命中率比乙高 D.甲命中个数的中位数是25
11.某 店在2018年1月的促销活动中,随机抽查了100名消费者的消费情况,并记录了他们的消费金额(单位:千元),将数据分成6组:(0,1],(1,2],(2,3],(3,4],(4,5],(5,6],整理得到频率分布直方图如图所示.若消费金额不超过3千元的人数占总人数的,则消费金额超过4千元的人数为
A.12 B.15
C.16 D.18
12.某市安踏专卖店为了了解某日旅游鞋的销售情况,抽取了部分顾客所购旅游鞋的尺寸,将所得数据整理后,画出频率分布直方图.已知从左到右前3个小组的频率之比为1∶2∶3,第4小组与第5小组的频率分布直方图如图所示,第2小组的频数为10,则第5小组的频数是
A.4 B.5
C.8 D.10
13.某次知识竞赛中,五个参赛小队的初始积分都是50,在答题过程中,各小队每答对一题可使本队积分增加5,每答错一题本队积分不变,若答题过程中五个小队答对的题数分别是4,7,6,2,5,则这五个小队积分的方差为 .
14.随着智能手机的普及, 络购物越来越受到人们的青睐,某研究性学习小组对使用智能手机的利与弊随机调查了10位同学,得到的满意度打分如茎叶图所示.
若这组数据的中位数、平均数分别为,则的大小关系是 .
15.某市为了增加2018届高三毕业生对各著名高校的了解,从而调动他们的学习动力,利用2017年暑假组织部分有意愿的学生赴部分大学参加夏令营,各大学夏令营的天数都在[2,12]内,现从中抽出100名学生,统计他们参加夏令营的天数,绘制成如图所示的频率分布直方图,则这100名学生中参加夏令营的天数在[6,10)的人数为 .
16.为组织好“市九运会”,组委会征集了800名志愿者,现对他们的年龄抽样统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得:
(1)年龄在[25,30)内对应小长方形的高度为 ;
(2)这800名志愿者中年龄在[25,35)内的人数为 .
17.某届马拉松招聘志愿者,报名者首先进入笔试,按笔试成绩选出参加面试的人员,最后确定入选名单.现从报名的所有人中按男女比例采用分层抽样的方式抽取了100名,统计了他们的笔试成绩(满分100分),统计结果见如下所示的频率分布表,其中分数在区间[90,100]内的人员直接进入面试阶段,若分数在区间[80,90)内,则需要进行短期的培训后,再参加第二次笔试,从而确定能否参加面试.
分数区间
频数
频率
[50,60)
8
0.08
[60,70)
b
[70,80)
42
0.42
[80,90)
a
0.26
[90,100]
8
合计
100
1.00
(1)求a与b的值,并作出频率分布直方图;
(2)(i)根据表中数据,估计这100名人员笔试成绩的中位数 (精确到小数点后1位);
(ii)分析知,这100名人员在各分数段内的男女比例如下表所示,那么若以频率分布表中的频率近似作为概率,在总共2000名参考人员中,求经过第一次考试就可直接进入面试的男女人数的估计值.
分数段
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
男女比例
1∶1
3∶1
3∶4
7∶6
3∶5
18.随着 技发展,手机成了人们日常生活中必不可少的通信工具,现在的中学生几乎都拥有了属于自己的手机了.为了调查某地区高中生一周使用手机的频率,某机构随机调查了该地区100名高中生某一周使用手机的时间(单位:小时),所取样本数据分组区间为,由此得到如图所示的频率分布直方图.
(1)求的值并估计该地区高中生一周使用手机时间的平均值;
(2)从使用手机时间在的四组学生中,用分层抽样方法抽取13人,则每层各应抽取多少人?
19.某市为了制定合理的节电方案,对居民用电情况进行了调查,通过抽样,获得了某年200户居民每户的月均用电量(单位:百千瓦时),将数据按,,,,,分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中的值;
(2)设该市有100万户居民,估计全市每户居民中月均用电量不低于6百千瓦时的人数及每户居民月均用电量的中位数;
(3)政府计划对月均用电量在4百千瓦时以下的用户进行奖励,月均用电量在内的用户奖励20元/月,月均用电量在内的用户奖励10元/月,月均用电量在内的用户奖励2元/月.若该市共有400万户居民,试估计政府执行此计划的年度预算.
20.某研究小组为了研究某品牌智能手机在正常使用情况下的电池供电时间,分别从该品牌手机的甲、乙两种型号中各选取部进行测试,其结果如下:
甲种手机供电时间(小时)
乙种手机供电时间(小时)
(1)求甲、乙两种手机供电时间的平均值与方差,并判断哪种手机电池质量好;
(2)为了进一步研究乙种手机的电池性能,从上述部乙种手机中随机抽取部,求这两部手机中恰有一部手机的供电时间大于该种手机供电时间平均值的概率.
21.某城市为了满足市民出行的需要和节能环保的要求,在公共场所提供单车共享服务,某部门为了对该城市共享单车进行监管,随机选取了位市民对共享单车的情况进行问卷调査,并根据其满意度评分值(满分分)制作的茎叶图如图所示:
(1)分别计算男性打分的平均数和女性打分的中位数;
(2)从打分在分以下(不含分)的市民中抽取人,求有女性被抽中的概率.
1.(2017新课标全国Ⅰ文 )为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
2.(2017山东文 )如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为
A.3,5 B.5,5
C.3,7 D.5,7
3.(2017新课标全国Ⅲ文 )某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
4.(2016新课标全国Ⅲ文 )某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15C,B点表示四月的平均最低气温约为5C.下面叙述不正确的是
A.各月的平均最低气温都在0C以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温高于20C的月份有5个
5.(2016山东文 )某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是,样本数据分组为 .根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是
A.56 B.60
C.120 D.140
6.(2018江苏)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为 ▲ .
7.(2016上海文 )某次体检,6位同学的身高(单位:米)分别为1.72,1.78,1.75,1.80,1.69,1.77,则这组数据的中位数是 (米).
8.(2018新课标全国Ⅰ文 )某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用水量
频数
1
3
2
4
9
26
5
使用了节水龙头50天的日用水量频数分布表
日用水量
频数
1
5
13
10
16
5
(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)
9.(2018新课标全国Ⅲ文 节选)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表:
超过
不超过
第一种生产方式
第二种生产方式
10.(2017新课标全国Ⅱ文 )海水养殖场进行某水产品的新、旧 箱养殖方法的产量对比,收获时各随机抽取了100个 箱,测量各箱水产品的产量(单位:kg), 其频率分布直方图如下:
(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99 的把握认为箱产量与养殖方法有关;
箱产量<50 kg
箱产量≥50 kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.
附:
P()
0.050 0.010 0.001
k
3.841 6.635 10.828
.
11.(2017北京文 )某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30],[30,40],,[80,90],并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
12.(2016新课标全国Ⅱ文 )某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数
0
1
2
3
4
≥5
保费
0.85a
a
1.25a
1.5a
1.75a
2a
随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:
出险次数
0
1
2
3
4
≥5
频数
60
50
30
30
20
10
(1)记A为事件:“一续保人本年度的保费不高于基本保费”,求P(A)的估计值;
(2)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160 ”,求P(B)的估计值;
(3)求续保人本年度的平均保费估计值.
13.(2016北京文 )某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
(1)如果w为整数,那么根据此次调查,为使80 以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.
14.(2016四川文 )我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5), [0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;
(3)估计居民月均用水量的中位数.
变式拓展
1.【答案】C
【解析】若的方差为,则,,,的方差为,故可得当的方差为1时,的方差为,故选C.
2.【答案】C
【解析】先根据平均数公式求出x,再利用方差公式求解.
由题意,得3+5+7+x+10=6×5,得x=5,
所以这组数据的方差s2=(9+1+1+1+16)=.
3.【答案】C
4.【答案】D
【解析】由频率分布直方图知,前两个小矩形的面积之和为(0.01+0.02)×10=0.3,
由于0.5-0.3=0.2,则×10=5,
所以中位数为60+5=65.故选D.
5.【解析】(1)估计一个销售季度内市场需求量的平均数为(吨).
由频率分布直方图易知,由于时,对应的频率为,而时,对应的频率为,
因此一个销售季度内市场需求量的中位数应属于区间,
于是估计中位数应为(吨).
(2)当时,;
当时,,
所以,.
当时,由,得;
当时,,
所以,利润不少于万元当且仅当,
于是由频率分布直方图可知,市场需求量的频率为,所以下一个销售季度内的利润不少于57万元的概率的估计值为.
考点冲关
1.【答案】C
2.【答案】A
【解析】由茎叶图可知所给数据,其中出现最多的是,共三次,所以为众数,将所有数据从小到大排列后,中间两数为,故中位数为.故本题答案为.
3.【答案】B
【解析】由图计算可得前四组的频数是22,其中第4组的频数为8,故本题正确答案是
4.【答案】B
【解析】设模糊不清的数字为x,由题意知该组数据的极差为48-20=28,所以中位数为61-28=33,
所以+32=33,解得x=2,
即模糊不清的数字为2.
5.【答案】D
【解析】经计算得平均值,众数为,中位数为,故,选D.
6.【答案】B
【解析】依题意可得10×(0.005+0.01+0.02+a+0.035)=1,则a=0.03,
从而身高在[120,130),[130,140),[140,150]三组内的学生比例为3∶2∶1,所以从身高在[140,150]内的学生中选取的人数应为×18=3,故选B.
7.【答案】C
8.【答案】A
【解析】及格的各组的频率和是(0.015+0.030+0.025+0.005)×10=0.75,即及格率为75 ;
样本的均值为45×0.10+55×0.15+65×0.15+75×0.30+85×0.25+95×0.05=71,
用这个分数估计总体的分数即得总体的平均分数为71.故选A.
【名师点睛】利用频率分布直方图求众数、中位数和平均数时,应注意三点:
①最高的小长方形底边中点的横坐标即是众数;
②中位数左边和右边的小长方形的面积和是相等的;
③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
9.【答案】C
【解析】∵样本,3,5,7的平均数是,且,分别是数列的第2项和第4项,
∴,,故选C.
10.【答案】D
【解析】由茎叶图可知甲命中个数的极差为37-8=29,故A正确;
易知乙命中个数的众数是21,故B正确;
甲的命中率为=0.535,乙的命中率为=0.4225,所以甲的命中率比乙高,C正确;
甲命中个数的中位数为=23,所以D不正确.故选D.
11.【答案】B
【解析】∵消费金额不超过3千元的人数占总人数的,∴第4,5,6组的频率之和为1-0.6=0.4,从图中可知第4组的频率为0.25,∴第5,6组的频率之和为0.4-0.25=0.15,∴消费金额超过4千元的人数为15.
12.【答案】B
13.【答案】74
【解析】由题意知,五个小队的积分分别是70,85,80,60,75,
所以五个小队的积分的平均值为=74,
所以五个小队的积分的方差为=74.
14.【答案】
【解析】从图中可知中位数为,
平均数为,所以.
15.【答案】58
【解析】由频率分布直方图可得参加夏令营的天数在[6,10)的频率为1-(0.04+0.12+0.05)×2=0.58,则参加夏令营的天数在[6,10)的人数为100×0.58=58.
16.【答案】(1)0.04;(2)440
【解析】(1)因为所有小长方形的面积之和为1,所以年龄在[25,30)内对应小长方形的高度为[1-(5×0.01+5×0.07+5×0.06+5×0.02)]=0.04.
(2)年龄在[25,35)内的频率为0.04×5+0.07×5=0.55,人数为0.55×800=440.
17.【解析】(1)由已知得a=0.26×100=26,分数区间[60,70)对应的频数为100-8-42-26-8=16,
因而b==0.16.
频率分布直方图如图.
18.【解析】(1)由于小矩形的面积之和为1,
则,由此可得.
该地区高中生一周使用手机时间的平均值为.
(2)使用手机时间在的学生有人,使用手机时间在的学生有人,使用手机时间在的学生有人,使用手机时间在的学生有人,
故用分层抽样法从使用手机时间在的四组学生中抽样,抽取人数分别为.
19.【解析】(1)由题得=,
所以.
(3)该市月均用电量在内的用户数分别为,所以每月预算为(元),
故估计政府执行此计划的年度预算为(万元)(亿元).
20.【解析】(1)甲的平均值,
乙的平均值,
甲的方差为
,
乙的方差
,
因为甲、乙两种手机的平均数相同,甲的方差比乙的方差小,所以认为甲种手机电池质量更好.
(2)由题意得上述部乙种手机中有部手机的供电时间大于该种手机供电时间平均值,记它们分别是,其余的为,
从上述部乙种手机中随机抽取部的所有结果为: ,共有种,
其中恰有一部手机的供电时间大于该种手机供电时间平均值的结果为: ,共有种,
所以所求概率为.
21.【解析】(1)男性打分的平均数为(分),
女性打分的中位数为(分).
直通高考
1.【答案】B
【解析】评估这种农作物亩产量稳定程度的指标是标准差或方差,故选B.
【名师点睛】众数:一组数据出现次数最多的数叫众数,众数反映一组数据的多数水平;
中位数:一组数据中间的数(起到分水岭的作用),中位数反映一组数据的中间水平;
平均数:反映一组数据的平均水平;
方差:反映一组数据偏离平均数的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小).在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.
标准差是方差的算术平方根,意义在于反映一组数据的离散程度.
2.【答案】A
【解析】由题意,甲组数据为56,62,65,,74,乙组数据为59,61,67,,78.要使两组数据的中位数相等,则,所以,又平均数相同,则,解得.故选A.
【名师点睛】由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示.缺点是当样本容量较大时,作图较烦琐. 利用茎叶图对样本进行估计时,要注意区分茎与叶,茎是指中间的一列数,叶是从茎的旁边生长出来的数.
3.【答案】A
【名师点睛】用样本估计总体时统计图表主要有:
(1)频率分布直方图,特点:频率分布直方图中各小长方形的面积等于对应区间的频率,所有小长方形的面积之和为1;
(2)频率分布折线图,连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(3)茎叶图,对于统计图表类题目,最重要的是认真观察图表,从中提炼出有用的信息和数据.
4.【答案】D
【解析】由题图可知各月的平均最低气温都在0C以上,A正确;
由题图可知七月的平均温差大于7.5C,而一月的平均温差小于7.5C,所以七月的平均温差比一月的平均温差大,B正确;
由题图可知三月和十一月的平均最高气温都大约在10C,基本相同,C正确;
由题图可知平均最高气温高于20℃的月份有3个,所以不正确.
故选D.
5.【答案】D
【解析】自习时间不少于22.5小时为后三组,其频率和为,故人数为人,选D.
【名师点睛】本题主要考查频率分布直方图,是一道基础题目.从历年高考题目看,图表题已是屡见不鲜,作为一道应用题,考查考生的识图、用图能力,以及应用数学知识解决实际问题的能力.
6.【答案】90
【解析】由茎叶图可知,5位裁判打出的分数分别为,故平均数为.
7.【答案】1.76
【解析】将这6位同学的身高按照从低到高排列为:1.69,1.72,1.75,1.77,1.78,1.80,这六个数的中位数是1.75与1.77的平均数,显然为1.76.
【名师点睛】本题主要考查中位数的概念,是一道基础题目.从历年高考题目看,涉及统计的题目,往往不难,主要考查考生的视图、用图能力,以及应用数学解决实际问题的能力.
8.【解析】(1)
【名师点睛】该题考查的是有关统计的问题,涉及到的知识点有频率分布直方图的绘制、利用频率分布直方图计算变量落在相应区间上的概率、利用频率分布直方图求平均数,在解题的过程中,需要认真审题,细心运算,仔细求解,就可以得出正确结果.
9.【解析】(1)第二种生产方式的效率更高.
理由如下:
(i)由茎叶图可知:用第一种生产方式的工人中,有75 的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75 的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.
(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.
(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.
(2)由茎叶图知.
列联表如下:
超过
不超过
第一种生产方式
15
5
第二种生产方式
5
15
10.【解析】(1)旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.
因此,事件A的概率估计值为0.62.
(2)根据箱产量的频率分布直方图得列联表
箱产量<50 kg
箱产量≥50 kg
旧养殖法
62
38
新养殖法
34
66
K2=.
由于15.705>6.635,故有99 的把握认为箱产量与养殖方法有关.
(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.
【名师点睛】(1)频率分布直方图中小长方形面积等于对应概率,所有小长方形面积之和为1.
(2)频率分布直方图中均值等于组中值与对应概率乘积的和.
(3)均值大小代表水平高低,方差大小代表稳定性.
11.【解析】(1)根据频率分布直方图可知,样本中分数不小于70的频率为,所以样本中分数小于70的频率为.
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.
【名师点睛】(1)用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,而频率分布直方图比较直观.
(2)频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.
12.【解析】(1)事件A发生当且仅当一年内出险次数小于2.由所给数据知,一年内出险次数小于2的频率为,
故P(A)的估计值为0.55.
(2)事件B发生当且仅当一年内出险次数大于1且小于4.由所给数据知,一年内出险次数大于1且小于4的频率为,
故P(B)的估计值为0.3.
(3)由所给数据得
保费
0.85a
a
1.25a
1.5a
1.75a
2a
频率
0.30
0.25
0.15
0.15
0.10
0.05
调查的200名续保人的平均保费为
,
因此,续保人本年度平均保费的估计值为1.192 5a.
【名师点睛】样本的数字特征常见的命题角度有:(1)样本的数字特征与频率分布直方图交汇;(2)样本的数字特征与茎叶图交汇;(3)样本的数字特征与优化决策问题交汇.
(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:
组号
1
2
3
4
5
6
7
8
分组
频率
根据题意,该市居民该月的人均水费估计为:
(元).
【名师点睛】(1)用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法. 频率分布表在数量表示上比较准确,频率分布直方图比较直观.
(2)频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.
14.【解析】(1)由频率分布直方图,可知:月均用水量在[0,0.5)的频率为0.08×0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.
由1–(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,
解得a=0.30.
(2)由(1),100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.
由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.
【名师点睛】本题主要考查频率分布直方图、频率、频数的计算公式等基础知识,考查学生的分析问题、解决问题的能力.在频率分布直方图中,第n个小矩形的面积就是相应组的频率,所有小矩形的面积之和为1,这是解题的关键,也是识图的基础.
相关资料
更多