所属成套资源:高考数学一轮总复习课件 (含解析)
高考数学一轮总复习课件第8章统计与统计分析第2讲用样本估计总体(含解析)
展开
这是一份高考数学一轮总复习课件第8章统计与统计分析第2讲用样本估计总体(含解析),共58页。PPT课件主要包含了频率该组的组距,3四分位数,2中位数,3平均数,相等的,题组一,走出误区,题组二,走进教材,B8D16等内容,欢迎下载使用。
1.总体取值规律的估计(1)绘制频率分布直方图的步骤①求极差:即一组数据中最大值与最小值的差.②决定组距和组数:当样本容量不超过 100 时,常分
成 5~12 组,组距=
③将数据分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间,也可以将样本数据多取一位小数分组.
④列频率分布表:登记频数,计算频率,列出频率分
将样本数据分成若干个小组,每个小组内的样本个数称作频数,频数与样本容量的比值叫做这一小组的频率.频率反映各个数据在每组所占比例的大小.
⑤画频率分布直方图:把横轴分成若干段,每一段对应一个组距,然后以线段为底作一小长方形,它的高等于
,这样得到一系列的长方形,每个长方形的面
积恰好是该组的频率.这些矩形就构成了频率分布直方图,各个长方形的面积总和等于 1.
(2)不同统计图的特点
扇形图主要用于直观描述各类数据占总数的比例;条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率;折线图主要用于描述数据随时间的变化趋势.条形图适用于描述离散型数据,直方图适用于描述连续性数据.
2.总体百分位数的估计(1)第 p 百分位数的定义
一般地,一组数据的第 p 百分位数是这样一个值,它使得这组数据中至少有 p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)计算一组 n 个数据的第 p 百分位数的步骤第 1 步,按从小到大排列原始数据.第 2 步,计算 i=n×p%.
第 3 步,若 i 不是整数,而大于 i 的比邻整数为 j,则第 p 百分位数为第 j 项数据;若 i 是整数,则第 p 百分位数为第 i 项与第(i+1)项数据的平均数.
25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第 25 百分位数也称为第一四分位数或下四分位数,第 75 百分位数也称为第三四分位数或上四分位数.
3.总体集中趋势的估计(1)众数
在一组数据中,出现次数最多的数据叫做这组数据的
将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
4.总体离散程度的估计
(3)标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.
【名师点睛】(1)频率分布直方图中的常见结论①众数的估计值为最高矩形的中点对应的横坐标.②平均数的估计值等于频率分布直方图中每个小矩形
的面积乘以小矩形底边中点的横坐标之和.
③中位数的估计值的左边和右边的小矩形的面积和是
1.(多选题)乐乐家共有七人,已知今年这七人年龄的众数为 35,平均数为 44,中位数为 55,标准差为 19,则 5
年后,下列说法中正确的是(
A.这七人岁数的众数变为 40B.这七人岁数的平均数变为 49C.这七人岁数的中位数变为 60D.这七人岁数的标准差变为 24答案:ABC
2.某厂 10 名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为 a,
第 50 百分位数为 b,则有(A.a=13.7,b=15.5B.a=14,b=15C.a=12,b=15.5D.a=14.7,b=15答案:D
3.(教材改编题)一个容量为 32 的样本,已知某组样本
的频率为 0.25,则该组样本的频数为(
4.(教材改编题)已知样本容量为 200,在样本的频率分布直方图中,共有 n 个小矩形,若中间一个小矩形的面积
5.(2021 年天津)从某网络平台推荐的影视作品中抽取400 部,统计其评分数据,将所得 400 个评分数据分为 8组:[66,70),[70,74),…,[94,98],并整理得到如下的频率分布直方图 8-2-1,则评分在区间[82,86)内的影视作品数
6.(多选题)(2021 年新高考Ⅱ)下列统计量中,能度量样
本x1,x2,…,xn的离散程度的有( )A.样本x1,x2,…,xn的标准差B.样本x1,x2,…,xn的中位数C.样本x1,x2,…,xn的极差D.样本x1,x2,…,xn的平均数
[例 1](1)为了了解某校九年级 1 600 名学生的体能情况,随机抽查了部分学生,测试 1 分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图 8-2-2 所示的频率分布直方
图,根据统计图的数据,下列结论错误的是(
A.该校九年级学生 1 分钟仰卧起坐的次数的中位数为
B. 该校九年级学生 1 分钟仰卧起坐的次数的众数为
C.该校九年级学生 1 分钟仰卧起坐的次数超过 30 的人
D.该校九年级学生 1 分钟仰卧起坐的次数少于 20 的人
解析:由频率分布直方图可知,中位数是频率分布直方图面积等分线对应的数值,是 26.25;众数是最高矩形的中间值 27.5;1 分钟仰卧起坐的次数超过 30 的频率为 0.2,所以估计 1 分钟仰卧起坐的次数超过 30 的人数为 320;1分钟仰卧起坐的次数少于 20 的频率为 0.1,所以估计 1 分钟仰卧起坐的次数少于 20 的人数为 160.故选 D.
(2)(2019 年全国Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将 200 只小鼠随机分成 A,B 两组,每组 100 只,其中 A 组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比,根据试验数据分别得到如下直方图(如图 8-2-3):
甲离子残留百分比直方图
乙离子残留百分比直方图
记 C 为事件:“乙离子残留在体内的百分比不低于
5.5”,根据直方图得到 P(C)的估计值为 0.70.①求乙离子残留百分比直方图中 a,b 的值;
②分别估计甲、乙离子残留百分比的平均值(同一组中
的数据用该组区间的中点值为代表).
解:①由已知得 0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.②甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+
7×0.05=4.05.
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+
8×0.15=6.00.
【题后反思】频率、频数、样本容量的计算方法
【变式训练】1.为了了解某校高三学生的视力情况,随机地抽查了该校 100 名高三学生的视力情况,得到频率分布直方图(如图 8-2-4),由于不慎将部分数据丢失,但知道后 5 组频数和为 62,设视力在 4.6 到 4.8 之间的学生数为 a,最大频率
为 0.32,则 a 的值为(
解析:前两组中的频数为 100×(0.05+0.11)=16.因为后五组频数和为 62,所以前三组频数和为 38.所以第三组频数为 38-16=22.又最大频率为 0.32,对应的最大频数为0.32×100=32.所以 a=22+32=54.故选 B.
2.(2021 年石家庄模拟)“一带一路”是“丝绸之路经济带”和“21 世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为 100 分(90分及以上为认知程度高).现从参赛者中抽取了 x 人,按年龄分成 5 组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图8-2-5 所示的频率分布直方图,已知第一组有 6 人.
(2)求抽取的 x 人的年龄的中位数(结果保留整数);
(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层随机抽样的方法依次抽取 6 人,42 人,36人,24 人,12 人,分别记为 1~5 组,从这 5 个按年龄分的组和 5 个按职业分的组中每组各选派 1 人参加知识竞赛,分别代表相应组的成绩,年龄组中 1~5 组的成绩分别为93,96,97,94,90,职业组中 1~5 组的成绩分别为 93,98,94,
(ⅰ)分别求 5 个年龄组和 5 个职业组成绩的平均数和
(ⅱ)以上述数据为依据,评价 5 个年龄组和 5 个职业组对“一带一路”的认知程度,并谈谈你的感想.
(ⅱ)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定.(感想合理即可)
[例2](1)(2021 年天河一模)高铁、扫码支付、共享单车、网购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了 n 座城市作实验基地,这 n 座城市共享单车的使用量(单位:人次/天)分别为x1,x2,…,xn,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是
A.x1,x2,…xn的平均数 B.x1,x2,…xn的标准差C.x1,x2,…xn的最大值 D.x1,x2,…xn的中位数
解析:表示一组数据 x1,x2,…xn的稳定程度是方差
A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同
(2)(多选题)(2021年新高考Ⅰ)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则( )
解析:对于 A,两组样本数据的平均数的差为 c,故 A错误;对于 B,两组样本数据的样本中位数的差是 c,故 B
错误;对于C,∵标准差D(yi)=D(xi+c)=D(xi),∴两组样本数据的样本标准差相同,故C正确;对于D,∵yi=xi+c(i=1,2,…,n),c为非零常数,x的极差为xmax-xmin,y的极差为(xmax+c)-(xmin+c)=xmax-xmin,∴两组样本数据的样本极差相同,故D正确.故选CD.
【变式训练】1.(多选题)已知某样本的容量为 50,平均数为 70,方差为 75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将 80 记录为 60,另一个错将 70 记录为 90.在对错误的数据进行更正后,重新求得样本的平均数为 x,
2.抽样统计甲、乙两位射击运动员的 5 次训练成绩(单
位:环),结果如下表:
则成绩较为稳定的那位运动员成绩的方差为______.
[例 3]某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图(如图 8-2-6):
则下面结论中错误的是(
A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
解析:设新农村建设前农村的经济收入为 a,则新农村建设后,农村的经济收入为 2a.新农村建设前后各项收入的对比如下表:
[例 4]某企业 2020 年 12 个月的收入与支出数据的折线
已知利润=收入-支出,根据该折线图,下列说法正
A.该企业 2020 年 1 月至 6 月的总利润低于 2020 年 7月至 12 月的总利润B.该企业 2020 年 1 月至 6 月的平均收入低于 2020 年7 月至 12 月的平均收入C.该企业 2020 年 8 月至 12 月的支出持续增长D.该企业 2020 年 11 月份的月利润最大
解析:对于 A,由收入曲线与支出曲线差的幅度可得,企业 2020 年 1 月至 6 月的总利润低于 2020 年 7 月至 12月的总利润,故 A 正确;对于 B,2020 年下半年的收入曲线的点明显高于 2020 年上半年的收入曲线的点,故该企业2020 年 1 月至 6 月的平均收入低于 2020 年 7 月至 12 月的平均收入,故 B 正确;对于 C,企业 2020 年 8 月至 12 月的支出曲线逐月上升,故 C 正确;对于 D,7 月,8 月利润都大于 11 月,故 D 错误.故选 ABC.
【反思感悟】(1)通过扇形统计图可以很清楚地表示出
各部分数量同总数之间的关系.
(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的变化趋势.
【高分训练】1.已知某地区中小学生人数和近视情况分别如图 8-2-8①和图 8-2-8②所示.为了了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取 2%的学生进行调查,
则样本容量和抽取的高中生近视人数分别为(图 8-2-8
解析:由题意得样本容量为(3 500+2 000+4 500)×
2%=10 000×2%=200,
抽取的高中生人数为 2 000×2%=40,则近视人数为 40×50%=20.故选 A.
2.“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.搜索指数越大,表示网民搜索该关键词的次数越多,对该关键词相关的信息关注度也越高.如图 8-2-9 是 2020 年 9 月到 2021 年 2 月这半年来,某个关键词的搜索指数变化的统计图.
根据该统计图判断,下列结论正确的是(
A.这半年来,网民对该关键词相关的信息关注度呈周期性变化B.这半年来,网民对该关键词相关的信息关注度不断减弱C.从该关键词的搜索指数来看,2020 年 10 月的方差小于 11 月的方差D.从该关键词的搜索指数来看,2020 年 12 月的平均值大于 2021 年 1 月的平均值
相关课件
这是一份第10章 统计与成对数据的统计分析 第2节 用样本估计总体 2025届高考数学一轮总复习(适用于新高考新教材)ppt,共45页。PPT课件主要包含了目录索引,至少有p%,100-p%,ABD,甲班物理成绩,乙班物理成绩,ABC等内容,欢迎下载使用。
这是一份适用于新高考新教材备战2025届高考数学一轮总复习第10章统计与成对数据的统计分析第2节用样本估计总体课件新人教A版,共49页。PPT课件主要包含了强基础固本增分,研考点精准突破,目录索引,至少有p%,100-p%,ABC等内容,欢迎下载使用。
这是一份高考数学一轮总复习课件第8章统计与统计分析第3讲成对数据的统计分析(含解析),共60页。PPT课件主要包含了回归分析,独立性检验,12×2列联表,2独立性检验,名师点睛,题组一,走出误区,答案1√,2√3×,题组二等内容,欢迎下载使用。