新高考数学一轮复习知识点总结与题型精练专题24 统计与统计案例(2份打包,原卷版+解析版)
展开1、了解随机抽样
2、掌握用样本估计总体
3、理解统计是实际应用
一、随机抽样
【思维导图】
【考点总结】
一、 随机抽样
像人口普查那样,对每一个调查对象都惊醒调查的方法,称为全面调查,又称普查.在一个调查中,我们把调查对象的全体成为总体,组成总体的每一个调查对象成为个体.
像这样,根据一定目的,从总体中抽取-一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.我们把从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本量.调查样本获得的变量值称为样本的观测数据,简称样本数据.
1.简单的随机抽样
一般地,设一个总体含有N (N为正整数)个个体,从中逐个抽取n(1≤n
2.分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
二、用样本估计总体
1.总体取值规律的估计
为了探索-组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.
在这个实际问题中,因为我们更关心月均用水量在不同范围内的居民用户占全市居民用户的比例,所以选择频率分布表和频率分布直方图来整理和表示数据.与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.
1.求极差
极差式一组数据中最大值与最小值的差
2.决定组距与组数
合适的组距与组数对发现数据分布规律有重要意义.组数太多或太少,都会影响我们了解数据的分布情况组距与组数的确定没有固定的标准,常常需要-一个尝试和选择的过程。数据分组的组数与数据的个数有关,一般数据的个数越多,所分组数也越多.
3.将数据分组
4.列频率分布表
5.画频率分布直方图
小长方形的面积=组距× SKIPIF 1 < 0
总体百分位数的估计
把100个样本数据按从小到大排序,得到第80个和第81个数据分别为13.6和13.8.可以发现,区间(13.6, 13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数 SKIPIF 1 < 0 =13.7,并称此数为这组数据的第80百分位数,或80%分位数.
一般地,一组数据的第p百分位数是这样-一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且少有(100-p)%的数据大于或等于这个值.
三、统计案例 公司员工的肥胖情况调查分析
背景与数据
近年来,我国肥胖人群的规模急速增长,肥胖人群有很大的心血管安全隐患.目前,国际上常用身体质量指数来衡量人体胖瘦程度以及是否健康,其计算公式是
BMI= SKIPIF 1 < 0
中国成人的BMI数值标准为:BM1<18.5为偏瘦;18.5≤BMI<23.9为正常;24≤ BMI<27.9为偏胖;BMI≥28为肥胖.
【题型汇编】
题型一:随机抽样
题型二:用样本估计总体
题型三:统计案例
【题型讲解】
题型一:随机抽样
一、单选题
1.(2022·上海静安·二模)2022年2月4日至2月20日春节期间,第24届冬奥会在北京市和张家口市联合举行.共有 SKIPIF 1 < 0 个冬奥村供运动员和代表队官员入住,其中北京冬奥村的容量约为 SKIPIF 1 < 0 人,延庆冬奥村的容量约 SKIPIF 1 < 0 人,张家口冬奥村的容量约 SKIPIF 1 < 0 人.为了解各冬奥村服务质量,现共准备了 SKIPIF 1 < 0 份调查问卷,采用分层抽样的方法,则需在延庆冬奥村投放的问卷数量是( )
A.58份B.50份C.32份D.19份
2.(2022·青海·大通回族土族自治县教学研究室三模(文))2021年东京奥运会某国家游泳队有男运动员48人,女运动员36人,世界反兴奋剂机构采用分层抽样的方法,从该国游泳运动员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中女运动员应抽的人数为( )
A.12B.14C.16D.18
3.(2022·陕西宝鸡·二模(文))北京2022年冬奥会吉祥物“冰墩墩”和冬残奥会吉祥物“雪容融”很受欢迎,现工厂决定从20只“冰墩墩”,15只“雪容融”和10个北京2022年冬奥会会徽中,采用比例分配分层随机抽样的方法,抽取一个容量为n的样本进行质量检测,若“冰墩墩”抽取了4只,则n为( )
A.3B.2C.5D.9
4.(2022·江西·二模(理))某工厂利用随机数表对生产的300个零件进行抽样测试,先将300个零件进行编号001,002,…,299,300.从中抽取30个样本,根据提供随机数表的第5行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第3个样本编号是( )
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68 96 08 04
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77 89 23 45
A.072B.134C.007D.253
5.(2022·新疆乌鲁木齐·二模(理))从某中学随机抽取100名学生,将他们的身高数据(单位cm)绘制成频率分布直方图,若要从身高在 SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 三组内的学生中,用分层抽样的方法选取16人参加一次活动.则从身高在 SKIPIF 1 < 0 内的学生中选取的人数应为( )
A.3B.4C.5D.7
二、多选题
1.(2022·湖南·雅礼中学二模)下列说法正确的有( )
A.一组数据按大小顺序排列,位于最中间的一个数据就是中位数
B.分层抽样为保证每个个体等可能入样,需在各层中进行简单随机抽样
C.若A∩B为不可能事件,A∪B为必然事件,则事件A与事件B互为对立事件
D.线性回归分析中, SKIPIF 1 < 0 的值越小,说明残差平方和越小,则模型拟合效果越好
三、解答题
1.(2022·四川成都·三模(理))某中学为增强学生的环保意识,举办了“爱成都,护环境”的知识竞赛活动,为了解本次知识竞赛活动参赛学生的成绩,从中抽取了n名学生的分数(得分取正整数,满分为100分,所有学生的得分都在区间 SKIPIF 1 < 0 中)作为样本进行统计.按照 SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 的分组作出如下的频率分布直方图,并作出下面的样本分数茎叶图(图中仅列出了得分在 SKIPIF 1 < 0 , SKIPIF 1 < 0 的数据).
(1)求样本容量n和频率分布直方图中x,y的值;
(2)在选取的样本中,从竞赛成绩不低于70分的三组学生中按分层抽样抽取了9名学生,再从抽取的这9名学生中随机抽取2名学生到天府广场参加环保知识宣传活动,求这2名学生中恰好有1名学生的分数在 SKIPIF 1 < 0 中的概率.
2.(2022·江西师大附中三模(文))随着经济的高速发展,南昌市居住环境及人文环境进一步得到改善.目前已基本依水建成赣江西岸绿道、赣江东岸绿道、乌沙河绿道、玉带河桃花河绿道、抚河故道绿道、幸福渠绿道、艾溪湖瑶湖绿道等城市主干绿道.新建提升20个公园,精心打造100条景观路,织起一张“四横七纵六环”的“绿道网”.另外,位于凤凰洲赣江边的省文化中心的建成已成为展示江西历史文化的地标建筑.省文化中心由省博物馆、省图书馆、省科技馆三馆组成,三个主体建筑由北向南排列,分别隐喻历史、现在与未来,反映出文化发展的路径,描述了探索知识的故事与旅程.作为江西省文化的新地标,城市的新客厅,成为加快推动江西文化强省建设的一个亮丽缩影,成为丰富江西省人民群众精神文化需求的重要阵地.
(1)相比老年人而言,青年人更喜欢在闲暇时间选择去省文化中心参观、学习.已知某区青年人的男女比例为3:2,现采用分层抽样的方法从中抽取100名作为样本,对这100位青年是否在闲暇时间去省文化中心进行统计,得条形图如下所示.
完成下列2×2列联表,并判断是否有90%的把握认为青年人选择去省文化中心与性别有关?
(2)现有甲、乙、丙、丁四位青年人,他们每个周末都选择去省文化中心,将他们想去的场馆情况汇总如下:
若每人只能从已登记的选择意向中随机选取一个场馆,且每个场馆至多有两人选择,求甲、乙两人选择去同一个场馆的概率.
附:
题型二:用样本估计总体
一、单选题
1.(2022·辽宁·抚顺市第二中学三模)下列一组数据 SKIPIF 1 < 0 、 SKIPIF 1 < 0 、 SKIPIF 1 < 0 、 SKIPIF 1 < 0 、 SKIPIF 1 < 0 、 SKIPIF 1 < 0 、 SKIPIF 1 < 0 、 SKIPIF 1 < 0 、 SKIPIF 1 < 0 、 SKIPIF 1 < 0 的 SKIPIF 1 < 0 分位数为( )
A. SKIPIF 1 < 0 B. SKIPIF 1 < 0 C. SKIPIF 1 < 0 D. SKIPIF 1 < 0
2.(2022·全国·二模(理))以下三组数据的标准差分别为 SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 .
5,5,5,5,5,5,5,5,5
3,3,4,4,5,6,6,7,7
2,2,2,2,5,8,8,8,8
则有( )
A. SKIPIF 1 < 0 B. SKIPIF 1 < 0
C. SKIPIF 1 < 0 D. SKIPIF 1 < 0
3.(2022·新疆·三模(文))塔里木河为中国第一大内流河,全长2179千米,由发源于天山的阿克苏河,发源于昆仑山的叶尔羌河,和田河汇流而成,塔里木河自西向东蜿蜓于塔里木盆地北部,上游地区大多流经起伏不平的戈壁荒漠,所以河水的含沙量大,很不稳定,被称为“无缰的野马”,已知阿克苏河,和田河和叶尔羌河的含沙量和流量比(见表),则塔里木河河水的含沙量约为( )
三河河水的含沙量和流量比
A.3.333 SKIPIF 1 < 0 B.4.060 SKIPIF 1 < 0
C.4.992 SKIPIF 1 < 0 D.5.637 SKIPIF 1 < 0
4.(2022·江西赣州·二模(理))一组数据按从小到大排列为2,3,3,x,7,10,若这组数据的平均数是中位数的 SKIPIF 1 < 0 倍,则下列说法错误的是( )
A. SKIPIF 1 < 0 B.众数为3C.中位数为4D.方差为 SKIPIF 1 < 0
5.(2022·陕西商洛·二模(文))数据 SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 ,…, SKIPIF 1 < 0 的平均数为 SKIPIF 1 < 0 ,数据 SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 ,…, SKIPIF 1 < 0 的平均数为 SKIPIF 1 < 0 ,则数据 SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 ,…, SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 ,…, SKIPIF 1 < 0 的平均数为( )
A. SKIPIF 1 < 0 B. SKIPIF 1 < 0
C. SKIPIF 1 < 0 D. SKIPIF 1 < 0
6.(2022·河南河南·三模(理))一支田径队有男运动员48人,女运动员36人,用分层抽样的方法从全体运动员中抽取一个容量为7的样本,抽出的男运动员平均身高为 SKIPIF 1 < 0 ,抽出的女运动员平均身高为 SKIPIF 1 < 0 ,估计该田径队运动员的平均身高是( )
A. SKIPIF 1 < 0 B. SKIPIF 1 < 0 C. SKIPIF 1 < 0 D. SKIPIF 1 < 0
7.(2022·辽宁葫芦岛·一模)有一组样本数据 SKIPIF 1 < 0 , SKIPIF 1 < 0 ,…, SKIPIF 1 < 0 ,由这组数据得到新样本数据, SKIPIF 1 < 0 , SKIPIF 1 < 0 ,…, SKIPIF 1 < 0 ,其中 SKIPIF 1 < 0 ,c为非零常数,则( )
A.两组样本数据的样本方差相同B.两组样本数据的样本众数相同
C.两组样本数据的样本平均数相同D.两组样本数据的样本中位数相同
8.(2022·天津·二模)为了检查“双减”政策落实效果,某校邀请学生家长对该校落实效果进行评分.现随机抽取100名家长进行评分调查,发现他们的评分都在40—100之间,将数据按 SKIPIF 1 < 0 SKIPIF 1 < 0 分成6组,整理得到如图所示的频率分布直方图,则在抽取的家长中,评分落在区间 SKIPIF 1 < 0 内的人数是( )
A.55B.75C.80D.85
二、多选题
1.(2022·辽宁大连·二模)为评估一种农作物的种植效果,选了10块地作试验田.这10块地的亩产量(单位:kg)互不相等,且从小到大分别为 SKIPIF 1 < 0 ,则下列说法正确的有( )
A. SKIPIF 1 < 0 的平均数可以用来评估这种农作物亩产量稳定程度
B. SKIPIF 1 < 0 的标准差可以用来评估这种农作物亩产量稳定程度
C. SKIPIF 1 < 0 可以用来评估这种农作物亩产量稳定程度
D. SKIPIF 1 < 0 的中位数为 SKIPIF 1 < 0
2.(2022·重庆·三模)已知一组样本数据:4,4,5,7,7,7,8,9,9,10.关于这组样本数据,结论正确的是( )
A.平均数为8B.众数为7C.极差为6D.中位数为8
三、解答题
1.(2022·黑龙江·哈九中三模(文))某经销商采购了一批水果,根据某些评价指标进行打分,现从中随机抽取20筐(每筐1kg),得分数据如下:17,23,29,31,34,40,46,50,51,51,58,62,62,68,71,78,79,80,85,95.根据以往的大数据认定:得分在区间 SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 内的分别对应四级、三级、二级、一级.
(1)试求这20筐水果得分的平均数.
(2)用样本估计总体,经销商参考以下两种销售方案进行销售;
方案1:将得分的平均数换算为等级,按换算后的等级出售;
方案2:分等级出售.
不同等级水果的售价如下表所示:
请从经销商的角度,根据售价分析采用哪种销售方案较好,并说明理由.
2.(2022·贵州遵义·三模(文))某中学在2021年高考分数公布后对高三年级各班的成绩进行分析.经统计,某班有50名同学,总分都在区间 SKIPIF 1 < 0 内,将得分区间平均分成5组,统计频数、频率后,得到了如图所示的“频率分布”折线图.
(1)请根据频率分布折线图,画出频率分布直方图;
(2)根据频率分布直方图估计该班级的平均分.
题型三:统计案例
一、单选题
1.(2022·全国·高三专题练习(理))为保障食品安全,某监管部门对辖区内一家食品企业进行检查,现从其生产的某种产品中随机抽取100件作为样本,并以产品的一项关键质量指标值为检测依据,整理得到如下的样本频率分布直方图.若质量指标值在 SKIPIF 1 < 0 内的产品为一等品,则该企业生产的产品为一等品的概率约为( )
A.0.38B.0.61
C.0.122D.0.75
2.(2022·全国·高三专题练习(理))某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论错误的是( )
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
3.(2022·全国·高三专题练习)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:
则下面结论中不正确的是
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
4.(2022·天津·高三专题练习)某学校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是17.5,30],样本数据分组为17.5,20),20,22.5),22.5,25),25,27.5),27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是
A.56B.60C.140D.120
二、多选题
5.(2022·湖南娄底·高三期末)2017年3月,由国家信息中心“一带一路”大数据中心等编写的《“一带一路”贸易合作大数据报告(2017)》发布,呈现了我国与“一带一路”沿线国家的贸易成果现状报告.贸易顺差额=贸易出口额-贸易进口额.由数据分析可知,在2011年到2016年这六年中( ).
中国与“一带一路”沿线国家出口额和进口额(亿美元)
A.2016年中国与沿线国家贸易进口额最小
B.中国与沿线国家贸易进口额的中位数为4492亿美元
C.中国与沿线国家贸易出口额逐年递增
D.中国与沿线国家贸易顺差额逐年递增
6.(2022·江苏·高三专题练习)江西省重点中学协作体于2020年进行了一次校际数学竞赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在 SKIPIF 1 < 0 之间,其得分的频率分布直方图如图,则下列结论正确的是( )
A.得分在 SKIPIF 1 < 0 之间的共有40人
B.从这100名参赛者中随机选取1人,其得分在 SKIPIF 1 < 0 的概率为0.5
C.这100名参赛者得分的中位数为65
D.可求得 SKIPIF 1 < 0
7.(2022·全国·高三专题练习)如图是某公司2018年1月至12月空调销售任务及完成情况的统计图,如10月份销售任务是400台,完成率为90%,下列叙述正确的是
A.2018年3月的销售任务是400台
B.2018年月销售任务的平均值不超过600台
C.2018年总销售量为4870台
D.2018年月销售量最大的是6月份
三、解答题
1.(2022·全国·高三专题练习(文))某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附: SKIPIF 1 < 0 .
2.(2022·全国·高三专题练习(文))为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成 SKIPIF 1 < 0 两组,每组100只,其中 SKIPIF 1 < 0 组小鼠给服甲离子溶液, SKIPIF 1 < 0 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记 SKIPIF 1 < 0 为事件:“乙离子残留在体内的百分比不低于 SKIPIF 1 < 0 ”,根据直方图得到 SKIPIF 1 < 0 的估计值为 SKIPIF 1 < 0 .
(1)求乙离子残留百分比直方图中 SKIPIF 1 < 0 的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
男
女
合计
去省文化中心
不去省文化中心
合计
场馆
图书馆
科技馆
博物馆
意向
甲、乙、丙
甲、乙、丁
乙、丙、丁
SKIPIF 1 < 0
0.100
0.050
0.025
0.010
SKIPIF 1 < 0 ,
其中 SKIPIF 1 < 0 .
SKIPIF 1 < 0
2.706
3.841
5.024
6.635
河的名称
含沙量
流量比
阿克苏河和田河
叶尔羌河
3.86 SKIPIF 1 < 0 9.85 SKIPIF 1 < 0
3.2 SKIPIF 1 < 0
72
1
等级
一级
二级
三级
四级
售价(万元/吨)
2
1.8
1.4
1.2
SKIPIF 1 < 0 的分组
SKIPIF 1 < 0
SKIPIF 1 < 0
SKIPIF 1 < 0
SKIPIF 1 < 0
SKIPIF 1 < 0
企业数
2
24
53
14
7
新高考数学一轮复习知识点总结与题型精练专题22 直线与圆(2份打包,原卷版+解析版): 这是一份新高考数学一轮复习知识点总结与题型精练专题22 直线与圆(2份打包,原卷版+解析版),文件包含新高考数学一轮复习知识点总结与题型精练专题22直线与圆原卷版doc、新高考数学一轮复习知识点总结与题型精练专题22直线与圆解析版doc等2份试卷配套教学资源,其中试卷共36页, 欢迎下载使用。
新高考数学一轮复习知识点总结与题型精练专题19 空间几何体(2份打包,原卷版+解析版): 这是一份新高考数学一轮复习知识点总结与题型精练专题19 空间几何体(2份打包,原卷版+解析版),文件包含新高考数学一轮复习知识点总结与题型精练专题19空间几何体原卷版doc、新高考数学一轮复习知识点总结与题型精练专题19空间几何体解析版doc等2份试卷配套教学资源,其中试卷共28页, 欢迎下载使用。
新高考数学一轮复习知识点总结与题型精练专题15 数列的概念与表示(2份打包,原卷版+解析版): 这是一份新高考数学一轮复习知识点总结与题型精练专题15 数列的概念与表示(2份打包,原卷版+解析版),文件包含新高考数学一轮复习知识点总结与题型精练专题15数列的概念与表示原卷版doc、新高考数学一轮复习知识点总结与题型精练专题15数列的概念与表示解析版doc等2份试卷配套教学资源,其中试卷共33页, 欢迎下载使用。