- 新教材适用2024版高考数学二轮总复习第1篇专题6概率与统计第3讲统计与成对数据的分析核心考点1抽样方法教师用书 试卷 0 次下载
- 新教材适用2024版高考数学二轮总复习第3篇方法技巧引领必考小题练透第5讲复数平面向量教师用书 试卷 0 次下载
- 新教材适用2024版高考数学二轮总复习第3篇方法技巧引领必考小题练透第7讲计数原理二项式定理教师用书 试卷 0 次下载
- 新教材适用2024版高考数学二轮总复习第1篇专题6概率与统计第3讲统计与成对数据的分析核心考点4独立性检验教师用书 试卷 0 次下载
- 新教材适用2024版高考数学二轮总复习第3篇方法技巧引领必考小题练透第6讲不等式教师用书 试卷 0 次下载
新教材适用2024版高考数学二轮总复习第1篇专题6概率与统计第3讲统计与成对数据的分析核心考点2用样本估计总体教师用书
展开1.频率分布直方图的相关结论
(1)直方图中各小长方形的面积之和为1.
(2)直方图中纵轴表示eq \f(频率,组距),故每组样本的频率为组距×eq \f(频率,组距),即矩形的面积.
(3)直方图中每组样本的频数为频率×总数.
2.中位数、众数、平均数、百分位数
(1)中位数
将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的_中位数__.
(2)众数
一组数据中出现次数_最多__的数据称为这组数据的众数.
(3)平均数
一组数据的_算术平均数__即为这组数据的平均数,n个数据x1,x2,…,xn的平均数eq \x\t(x)= eq \f(1,n)(x1+x2+…+xn) .
(4)百分位数
①第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据_小于或等于__这个值,且至少有 (100-p)% 的数据大于或等于这个值.
②计算一组n个数据的第p百分位数的步骤:
第1步,按_从小到大__排列原始数据.
第2步,计算i=_n×p%__.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第_(i+1)__项数据的平均数.
3.样本的数字特征
如果有n个数据x1,x2,…,xn,那么:
平均数为eq \x\t(x)= eq \f(1,n)(x1+x2+…+xn) ,
标准差为
s=eq \r(\f(1,n)[x1-\x\t(x)2+x2-\x\t(x)2+…+xn-\x\t(x)2]),
方差为s2= eq \f(1,n)[(x1-eq \x\t(x))2+(x2-eq \x\t(x))2+…+(xn-eq \x\t(x))2] .
多维题组· 明技法
角度1:统计图表
1. (2023·郑州三模)为了树立和践行绿水青山就是金山银山的理念,A市某高中全体教师于2023年3月12日开展植树活动,购买柳树、银杏、梧桐、樟树四种树苗共计600棵,比例如图所示.青年教师、中年教师、老年教师报名参加植树活动的人数之比为5∶3∶2,若每种树苗均按各年龄段报名人数的比例进行分配,则中年教师应分得梧桐的数量为( C )
A.30棵B.50棵
C.72棵D.80棵
【解析】 由题意可知,梧桐树苗有40%×600=240颗,根据人数占比可得中年教师应分得梧桐的数量为240×eq \f(3,5+3+2)=72颗.故选C.
2. (2023·市中区校级二模)某调查机构抽取了部分关注济南地铁建设的市民作为样本,分析其年龄和性别结构,并制作出如下等高条形图.根据图中(35岁以上含35岁)的信息,关于该样本的结论不一定正确的是( C )
A.男性比女性更关注地铁建设
B.关注地铁建设的女性多数是35岁以上
C.35岁以下的男性人数比35岁以上的女性人数多
D.35岁以上的人对地铁建设关注度更高
【解析】 由等高条形图可得:由左图知,样本中男性数量多于女性数量,所以男性比女性更关注地铁建设,故A正确;由右图知女性中35岁以上的占多数,从而样本中多数女性是35岁以上,从而得到关注地铁建设的女性多数是35岁以上,故B正确;由左图知男性人数大于女性人数,由右图知35岁以下的男性占男性人数比35岁以上的女性占女性人数的比例少,所以无法判断35岁以下的男性人数与35岁以上的女性人数的多少,故C不一定正确;由右图知样本中35岁以上的人对地铁建设关注度更高,故D正确.故选C.
3. (2023·雁塔区校级模拟)某滑冰馆统计了某小区居民在该滑冰馆一个月的锻炼天数,得到如图所示的频率分布直方图(将频率视为概率),则下列说法正确的是( B )
A.该小区居民在该滑冰馆的锻炼天数在区间(25,30]内的最少
B.估计该小区居民在该滑冰馆的锻炼天数超过15天的概率为0.465
C.估计该小区居民在该滑冰馆的锻炼天数的中位数为16
D.估计小区居民在该滑冰馆的锻炼天数的平均值为15
【解析】 该小区居民在该滑冰馆的锻炼天数在区间(20,25]内的最少,A错误;估计该小区居民在该滑冰馆的锻炼天数超过15天的概率为(0.06+0.013+0.02)×5=0.465,B正确;(0.02+0.04)×5=0.3,(0.02+0.04+0.047)×5=0.535,∴中位数落在区间[10,15),设中位数为x,则:0.3+(x-10)×0.047=0.5,解得x≈14,C错误;0.013×5×eq \f(5,2)+0.04×5×eq \f(5+10,2)+0.047×5×eq \f(10+15,2)+0.06×5×eq \f(15+20,2)+0.013×5×eq \f(20+25,2)+0.02×5×eq \f(25+30,2)≈14,D错误.故选B.
角度2:样本与总体数据的估计
4. (2023·长沙模拟)某校1 000名学生参加环保知识竞赛,随机抽取了20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( D )
A.频率分布直方图中a的值为0.004
B.估计这20名学生考试成绩的第60百分位数为75
C.估计这20名学生数学考试成绩的众数为80
D.估计总体中成绩落在[60,70)内的学生人数为150
【解析】 由频率分布直方图,得:10(2a+3a+7a+6a+2a)=1,解得a=0.005,故A错误;前三个矩形的面积和为10(2a+3a+7a)=0.6,∴这20名学生数学考试成绩的第60百分数为80,故B错误;这20名学生数学考试成绩的众数为75,故C错误;总体中成绩落在[60,70)内的学生人数为3a×10×1 000=150,故D正确.故选D.
5. (多选)(2023·台江区校级模拟)在某市高三年级举行的一次调研考试中,共有30 000人参加考试.为了解考生的某科成绩情况,抽取了样本容量为n的部分考生成绩,已知所有考生成绩均在[50,100],按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出如图所示的频率分布直方图.若在样本中,成绩落在区间[50,60)的人数为16,则由样本估计总体可知下列结论正确的为( AC )
A.x=0.016
B.n=1 000
C.考生成绩的第70百分位数为76
D.估计该市全体考生成绩的平均分为71
【解析】 因为(x+0.030+0.040+0.010+0.004)×10=1,解得x=0.016,故A正确;因为成绩落在区间[50,60)内的人数为16,所以样本容量n=eq \f(16,0.016×10)=100,故B错误;因为(0.016+0.030)×10=0.46<0.7,(0.016+0.030+0.040)×10=0.86>0.7,所以考生成绩的第70百分位数落在区间[70,80),设考生成绩的第70百分位数为x,则0.46+(x-70)×0.04=0.7,解得x=76,即考生成绩的第70百分位数为76,故C正确;学生成绩平均分为0.016×10×55+0.030×10×65+0.040×10×75+0.010×10×85+0.004×10×95=70.6,故D错误.故选AC.
角度3:样本数据的数字特征
6. (2023·河南三模)某学校对班级管理实行量化打分,每周一总结,若一个班连续5周的量化打分不低于80分,则为优秀班级.下列能断定该班为优秀班级的是( D )
A.某班连续5周量化打分的平均数为83,中位数为81
B.某班连续5周量化打分的平均数为83,方差大于0
C.某班连续5周量化打分的中位数为81,众数为83
D.某班连续5周量化打分的平均数为83,方差为1
【解析】 根据题意,依次分析选项:对于A,若数据为88,87,81,80,79,满足平均数为83,中位数为81,但不能断定该班为优秀班级;对于B,若数据为88,87,81,80,79,满足平均数为83,其方差一定大于0,但不能断定该班为优秀班级;对于C,若数据为83,83,81,80,79,满足中位数为81,众数为83,但不能断定该班为优秀班级;对于D,设数据的最低分为x,若数据平均数为83,方差为1,则有(83-x)2<5,必有x>80,可以断定该班为优秀班级.故选D.
7. (2023·雁峰区校级模拟)若数据x1+m、x2+m、…、xn+m的平均数是5,方差是4,数据3x1+1、3x2+1、…、3xn+1的平均数是10,标准差是s,则下列结论正确的是( A )
A.m=2,s=6B.m=2,s=36
C.m=4,s=6D.m=4,s=36
【解析】 根据题意,设数据x1、x2、…、xn的平均数为eq \(x,\s\up6(-)),标准差为σ,数据3x1+1、3x2+1、…、3xn+1的平均数是10,则eq \f(3x1+1+3x2+1+…+3xn+1,n)=eq \f(3x1+x2+…+xn,n)+1=3eq \(x,\s\up6(-))+1=10,可得eq \(x,\s\up6(-))=3,而数据x1+m、x2+m、…、xn+m的平均数是5,则有eq \f(x1+m+x2+m+…+xn+m,n)=eq \f(x1+x2+…+xn,n)+m=eq \(x,\s\up6(-))+m=5,可得m=2,由方差公式可得eq \f([x1+m-\(x,\s\up6(-))+m]2+[x2+m-\(x,\s\up6(-))+m]2+…+[xn+m-\(x,\s\up6(-))+m]2,n)=eq \f(x1-\(x,\s\up6(-))2+x2-\(x,\s\up6(-))2+…+xn-\(x,\s\up6(-))2,n)=σ2=4,s2=eq \f([3x1+1-3\(x,\s\up6(-))+1]2+[3x2+1-3\(x,\s\up6(-))+1]2+…+[3xn+1-3\(x,\s\up6(-))+1]2,n)=eq \f(9x1-\(x,\s\up6(-))2+9x2-\(x,\s\up6(-))2+…+9xn-\(x,\s\up6(-))2,n)=9σ2=36,解得s=6.故选A.
方法技巧· 精提炼
1.关于平均数、方差的计算
(1)利用平均数、方差的性质可简化运算,要熟记.
(2)方差描述一组数据围绕平均数波动的幅度.
2.频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
加固训练· 促提高
1. (2023·湖北模拟)云南某镇因地制宜,在政府的带领下,数字力量赋能乡村振兴,利用“农抬头”智慧农业平台,通过大数据精准分析柑橘等特色产业的生产数量、价格走势、市场供求等数据,帮助小农户找到大市场,开启“直播+电商”销售新模式,推进当地特色农产品“走出去”;通过“互联网+旅游”聚焦特色农产品、绿色食品、生态景区资源.下面是2022年7月到12月份该镇甲、乙两村销售收入统计数据(单位:百万):
甲:5,6,6,7,8,16;
乙:4,6,8,9,10,17.
根据上述数据,则( B )
A.甲村销售收入的第50百分位数为7百万
B.甲村销售收入的平均数小于乙村销售收入的平均数
C.甲村销售收入的中位数大于乙村销售收入的中位数
D.甲村销售收入的方差大于乙村销售收入的方差
【解析】 因为6×0.5=3,所以这组数据的第50百分位数为eq \f(6+7,2)=6.5,故A错误;eq \x\t(x)甲=eq \f(1,6)×(5+6+6+7+8+16)=8,eq \x\t(x)乙=eq \f(1,6)×(4+6+8+9+10+17)=9,故甲村销售收入的平均数小于乙村销售收入的平均数,故B正确;甲村销售收入的中位数为eq \f(6+7,2)=6.5,乙村销售收入的中位数为eq \f(8+9,2)=8.5,则甲村销售收入的中位数小于乙村销售收入的中位数,故C错误;甲村销售收入的方差seq \\al(2,1)=eq \f(1,6)×[(5-8)2+(6-8)2+(6-8)2+(7-8)2+(8-8)2+(16-8)2]=eq \f(41,3),乙村销售收入的方差seq \\al(2,2)=eq \f(1,6)×[(4-9)2+(6-9)2+(8-9)2+(9-9)2+(10-9)2+(17-9)2]=eq \f(50,3),所以甲村销售收入的方差小于乙村销售收入的方差,故D错误.故选B.
2. (2023·碑林区校级模拟)如图,一组数据x1,x2,x3,…,x9,x10的平均数为5,方差为seq \\al(2,1),去除x9,x10这两个数据后,平均数为eq \(x,\s\up6(-)),方差为seq \\al(2,2),则( D )
A.eq \(x,\s\up6(-))>5,seq \\al(2,1)>seq \\al(2,2)B.eq \(x,\s\up6(-))<5,seq \\al(2,1)<seq \\al(2,2)
C.eq \(x,\s\up6(-))=5,seq \\al(2,1)<seq \\al(2,2)D.eq \(x,\s\up6(-))=5,seq \\al(2,1)>seq \\al(2,2)
【解析】 由题意可得:eq \f(1,10)eq \i\su(i=1,10,x)i=5,x9=1,x10=9,则eq \i\su(i=1,10,x)i=50,故eq \x\t(x)=eq \f(1,8)eq \i\su(i=1,8,x)i=eq \f(1,8)(eq \i\su(i=1,10,x)i-x9-x10)=eq \f(1,8)(50-1-9)=5,∵x9,x10是波幅最大的两个点的值,则去除x9,x10这两个数据后,整体波动性减小,故seq \\al(2,1)>seq \\al(2,2).故选D.
新教材适用2024版高考数学二轮总复习第1篇专题6概率与统计第2讲随机变量及其分布列核心考点2超几何分布教师用书: 这是一份新教材适用2024版高考数学二轮总复习第1篇专题6概率与统计第2讲随机变量及其分布列核心考点2超几何分布教师用书,共3页。
新教材适用2024版高考数学二轮总复习第1篇专题6概率与统计第3讲统计与成对数据的分析核心考点3经验回归方程教师用书: 这是一份新教材适用2024版高考数学二轮总复习第1篇专题6概率与统计第3讲统计与成对数据的分析核心考点3经验回归方程教师用书,共3页。试卷主要包含了相关系数,经验回归方程等内容,欢迎下载使用。
新教材适用2024版高考数学二轮总复习第1篇专题6概率与统计第3讲统计与成对数据的分析核心考点4独立性检验教师用书: 这是一份新教材适用2024版高考数学二轮总复习第1篇专题6概率与统计第3讲统计与成对数据的分析核心考点4独立性检验教师用书,共3页。