所属成套资源:2025年高考数学一轮复习讲义(知识梳理+真题自测+考点突破+分层检测)(新高考专用)
- 专题50 抛物线-2025年高考数学一轮复习讲义(知识梳理+真题自测+考点突破+分层检测)(新高考专用) 试卷 0 次下载
- 专题55 随机抽样、统计图表-2025年高考数学一轮复习讲义(知识梳理+真题自测+考点突破+分层检测)(新高考专用) 试卷 0 次下载
- 专题57 成对数据的统计分析-2025年高考数学一轮复习讲义(知识梳理+真题自测+考点突破+分层检测)(新高考专用) 试卷 0 次下载
- 专题59 排列与组合-2025年高考数学一轮复习讲义(知识梳理+真题自测+考点突破+分层检测)(新高考专用) 试卷 0 次下载
- 专题60 二项式定理-2025年高考数学一轮复习讲义(知识梳理+真题自测+考点突破+分层检测)(新高考专用) 试卷 0 次下载
专题56 用样本估计总体-2025年高考数学一轮复习讲义(知识梳理+真题自测+考点突破+分层检测)(新高考专用)
展开这是一份专题56 用样本估计总体-2025年高考数学一轮复习讲义(知识梳理+真题自测+考点突破+分层检测)(新高考专用),文件包含专题56用样本估计总体-2025年高考数学一轮复习讲义知识梳理+真题自测+考点突破+分层检测新高考专用原卷版docx、专题56用样本估计总体-2025年高考数学一轮复习讲义知识梳理+真题自测+考点突破+分层检测新高考专用解析版docx等2份试卷配套教学资源,其中试卷共51页, 欢迎下载使用。
【知识梳理】2
【真题自测】3
【考点突破】8
【考点1】百分位数的估计8
【考点2】总体集中趋势的估计12
【考点3】总体离散程度的估计17
【分层检测】21
【基础篇】21
【能力篇】30
考试要求:
1.会用统计图表对总体进行估计,会求n个数据的第p百分位数.
2.会用数字特征估计总体集中趋势和总体离散程度.
知识梳理
1.总体百分位数的估计
(1)第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
2.样本的数字特征
(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:把eq \f(a1+a2+…+an,n)称为a1,a2,…,an这n个数的平均数.
(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为eq \(x,\s\up6(-)),则这组数据的标准差和方差分别是s=
eq \r(\f(1,n)[(x1-\(x,\s\up6(-)))2+(x2-\(x,\s\up6(-)))2+…+(xn-\(x,\s\up6(-)))2]),
s2=eq \f(1,n)[(x1-eq \(x,\s\up6(-)))2+(x2-eq \(x,\s\up6(-)))2+…+(xn-eq \(x,\s\up6(-)))2].
1.频率分布直方图与众数、中位数、平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
2.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为eq \(x,\s\up6(-)),那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是meq \(x,\s\up6(-))+a.
(2)若数据x1,x2,…,xn的方差为s2,那么
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2.
真题自测
一、单选题
1.(2024·全国·高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理如下表
根据表中数据,下列结论中正确的是( )
A.100块稻田亩产量的中位数小于1050kg
B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200kg至300kg之间
D.100块稻田亩产量的平均值介于900kg至1000kg之间
2.(2022·全国·高考真题)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:
则( )
A.讲座前问卷答题的正确率的中位数小于
B.讲座后问卷答题的正确率的平均数大于
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
二、多选题
3.(2023·全国·高考真题)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数
B.的中位数等于的中位数
C.的标准差不小于的标准差
D.的极差不大于的极差
三、解答题
4.(2024·上海·高考真题)水果分为一级果和二级果,共136箱,其中一级果102箱,二级果34箱.
(1)随机挑选两箱水果,求恰好一级果和二级果各一箱的概率;
(2)进行分层抽样,共抽8箱水果,求一级果和二级果各几箱;
(3)抽取若干箱水果,其中一级果共120个,单果质量平均数为303.45克,方差为603.46;二级果48个,单果质量平均数为240.41克,方差为648.21;求168个水果的方差和平均数,并预估果园中单果的质量.
5.(2022·全国·高考真题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间的概率;
(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
参考答案:
1.C
【分析】计算出前三段频数即可判断A;计算出低于1100kg的频数,再计算比例即可判断B;根据极差计算方法即可判断C;根据平均值计算公式即可判断D.
【详解】对于 A, 根据频数分布表可知, ,
所以亩产量的中位数不小于 , 故 A 错误;
对于B,亩产量不低于的频数为,
所以低于的稻田占比为,故B错误;
对于C,稻田亩产量的极差最大为,最小为,故C正确;
对于D,由频数分布表可得,平均值为,故D错误.
故选;C.
2.B
【分析】由图表信息,结合中位数、平均数、标准差、极差的概念,逐项判断即可得解.
【详解】讲座前中位数为,所以错;
讲座后问卷答题的正确率只有一个是个,剩下全部大于等于,所以讲座后问卷答题的正确率的平均数大于,所以B对;
讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错;
讲座后问卷答题的正确率的极差为,
讲座前问卷答题的正确率的极差为,所以错.
故选:B.
3.BD
【分析】根据题意结合平均数、中位数、标准差以及极差的概念逐项分析判断.
【详解】对于选项A:设的平均数为,的平均数为,
则,
因为没有确定的大小关系,所以无法判断的大小,
例如:,可得;
例如,可得;
例如,可得;故A错误;
对于选项B:不妨设,
可知的中位数等于的中位数均为,故B正确;
对于选项C:因为是最小值,是最大值,
则的波动性不大于的波动性,即的标准差不大于的标准差,
例如:,则平均数,
标准差,
,则平均数,
标准差,
显然,即;故C错误;
对于选项D:不妨设,
则,当且仅当时,等号成立,故D正确;
故选:BD.
4.(1)
(2)一级果抽取6箱,二级果抽取2箱
(3)方差克,平均数克,预估平均质量为克
【分析】(1)利用组合知识和超几何分布求概率公式求出答案;
(2)利用分层抽样的定义进行求解;
(3)根据公式计算出总体样本平均质量和方差,并预估平均质量.
【详解】(1)设A事件为恰好选到一级果和二级果各一箱,
样本空间的样本点的个数,
A事件的样本点的公式,
所以;
(2)因为一级果箱数:二级果箱数,
所以8箱水果中有一级果抽取箱,二级果抽取箱;
(3)设一级果平均质量为,方差为,二级果质量为,方差为,
总体样本平均质量为,方差为,
因为,,,,
所以克,
克.
预估平均质量为克.
5.(1)岁;
(2);
(3).
【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;
(2)设{一人患这种疾病的年龄在区间},根据对立事件的概率公式即可解出;
(3)根据条件概率公式即可求出.
【详解】(1)平均年龄
(岁).
(2)设{一人患这种疾病的年龄在区间},所以
.
(3)设“任选一人年龄位于区间[40,50)”,“从该地区中任选一人患这种疾病”,
则由已知得:
,
则由条件概率公式可得
从该地区中任选一人,若此人的年龄位于区间,此人患这种疾病的概率为.
考点突破
【考点1】百分位数的估计
一、单选题
1.(2025·黑龙江大庆·一模)法国当地时间2024年7月26日晚,第三十三届夏季奥林匹克运动会在巴黎举行开幕式.“奥林匹克之父”顾拜旦曾经说过,奥运会最重要的不是胜利,而是参与;对人生而言,重要的不是凯旋,而是拼搏.为弘扬奥运精神,某学校组织高一年级学生进行奥运专题的答题活动.为了调查男生和女生对奥运会的关注程度,在高一年级随机抽取10名男生和10名女生的竞赛成绩(满分100分),按从低到高的顺序排列,得到下表中的样本数据:
则下列说法错误的是( )
A.男生样本数据的分位数是86
B.男生样本数据的中位数小于男生样本数据的众数
C.女生样本数据中去掉一个最高分和一个最低分后所得数据的平均数不变
D.女生样本数据中去掉一个最高分和一个最低分后所得数据的方差不变
2.(2024·河南郑州·模拟预测)已知某学校参加学科节数学竞赛决赛的8人的成绩(单位:分)为:72,78,80,81,83,86,88,90,则这组数据的第75百分位数是( )
A.86B.87C.88D.90
二、多选题
3.(2023·江苏连云港·模拟预测)某学校共有2000名男生,为了解这部分学生的身体发育情况,学校抽查了100名男生体重情况.根据所得数据绘制样本的频率分布直方图如图所示,则( )
A.样本的众数为67.5B.样本的分位数为72.5
C.样本的平均值为66D.该校男生中体重低于的学生大约为150人
4.(2024·广东佛山·模拟预测)某企业是一所大学的社会实践基地,实践结束后学校对学生进行考核评分,其得分的频率分布直方图如图所示,该学校规定,把成绩位于后的学生划定为不及格,把成绩位于前的学生划定为优秀,则下列结论正确的是( )
A.本次测试及格分数线的估计值为60分B.本次测试优秀分数线的估计值为75分
C.本次测试分数中位数的估计值为70分D.本次测试分数的平均数小于中位数
三、填空题
5.(2024·上海·模拟预测)某同学高三以来成绩依次为110,93,92,93,88,86,则这组数据的第40百分位数为 .
6.(2024·云南曲靖·二模)抽样统计得到某班8名女生的身高分别为,则这8名女生身高的第75百分位数是 .
参考答案:
1.D
【分析】根据百分位数、中位数、众数、平均数、方差的定义一一判断即可.
【详解】对于A:,所以男生样本数据的分位数是,故A正确;
对于B:男生样本数据的中位数为,男生样本数据的众数为,故B正确;
对于C:女生样本数据的平均数为,
女生样本数据中去掉一个最高分和一个最低分后所得数据的平均数为,故C正确;
对于D:女生样本数据中去掉一个最高分和一个最低分后所得数据的平均数不变,
但是极差变小,所以方差变小,故D错误.
故选:D
2.B
【分析】根据样本数据百分位数的定义求解即可.
【详解】将数据从小到大排序得,
因为,
所以第75百分位数是.
故选:B.
3.AB
【分析】由频率分布直方图的众数、百分位数、平均数以及频数的计算公式对选项一一判断即可得出答案.
【详解】对于A:样本的众数为67.5,故A正确;
对于B:设样本的分位数为,
因为,
则,解得:,故B正确;
对于C:设样本的平均值为,
则,故C不正确;
对于D:该校男生中低于的学生所占的频率为:,
该校男生中低于的学生大约为人,故D不正确.
故选:AB.
4.CD
【分析】根据百分位数的定义可判断AB,根据中位数的定义可判断,根据频率分布直方图左拖尾可判断D.
【详解】A.由频率分布直方图可知,分数小于60分的概率为,分数小于50分的概率为,
所以分数的分位数在区间内,故A错误;
B.由频率分布直方图可知,分数大于80分的概率为0.2,分数大于70分的概率为0.5,
所以优秀分数线的估计值在区间内,设其为,
则,
解得,故B错误;
C.因为分数大于70分的概率为0.5,所以本次测试分数中位数的估计值为70分,故C正确;
D.因为频率分布直方图左拖尾,所以平均数小于中位数,故D正确.
故选:CD.
5.
【分析】将数据从小到大排列,根据百分数的定义进行求解.
【详解】将数据从小到大排列,,
,故从小到大,选择第3个数作为这组数据的第40百分位数,即.
故答案为:92
6.159
【分析】利用百分位数的估计公式计算可得.
【详解】将数据由小到大排列为:,
由,得第75百分位数是.
故答案为:159
反思提升:
计算一组数据的第p百分位数的步骤
【考点2】总体集中趋势的估计
一、单选题
1.(2024·广东惠州·模拟预测)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分如图所示,假设得分值的中位数为,众数为,平均值为,则( )
A.B.
C.D.
2.(2024·四川绵阳·模拟预测)某教育机构为调查中小学生每日完成作业的时间,收集了某位学生100天每天完成作业的时间,并绘制了如图所示的频率分布直方图(每个区间均为左闭右开),根据此直方图得出了下列结论,其中正确的是( )
A.估计该学生每日完成作业的时间在2小时至2.5小时的有50天
B.估计该学生每日完成作业时间超过3小时的概率为0.3
C.估计该学生每日完成作业时间的中位数为2.625小时
D.估计该学生每日完成作业时间的众数为2.3小时
二、多选题
3.(2025·广东·一模)现有十个点的坐标为 ,它们分别与 关于点对称.已知 的平均数为,中位数为 ,方差为,极差为,则 这组数满足( )
A.平均数为 B.中位数为
C.方差为D.极差为
4.(23-24高一下·全国·期末)如图所示,下列频率分布直方图显示了三种不同的分布形态.图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态,根据所给图作出以下判断,正确的是( )
A.图(1)的平均数中位数众数
B.图(2)的平均数<众数<中位数
C.图(2)的众数中位数<平均数
D.图(3)的平均数中位数众数
三、填空题
5.(2022·北京·模拟预测)某班在一次考试后分析学生在语文、数学、英语三个学科的表现,绘制了各科年级排名的散点图(如下图所示).
关于该班级学生这三个学科本次考试的情况,给出下列四个结论:
①三科中,数学年级排名的平均数及方差均最小;
②语文、数学、英语年级排名均在150名以外的学生为1人;
③本次考试该班语文第一名、数学第一名、英语第一名可能为三名不同的同学;
④从该班学生中随机抽取1人,若其语文排名大于200,则其英语和数学排名均在150以内的概率为.
其中所有正确结论的序号是 .
6.(2014高三·全国·专题练习)为了解本书居民的生活成本,甲、乙、丙三名同学利用假期分别对三个社区进行了“家庭每月日常消费额”的调查.他们将调查所得的数据分别绘制成频率分布直方图(如图所示),记甲、乙、丙所调查数据的标准差分别为,,,则它们的大小关系为 .(用“<”连接)
参考答案:
1.D
【分析】根据题意求中位数、众数和平均数,对比即可得结果.
【详解】30个数中第15个数是5,第16个数是6,所以中位数,
由题意可知:众数,
平均值=.
所以.
故选:D.
2.C
【分析】利用频率分别直方图、频数、频率、中位数、众数直接求解.
【详解】对于A,该学生每日完成作业的时间在2小时至2.5小时的天数为:天,故A错误;
对于B,估计该学生每日完成作业时间超过3小时的概率为,故B错误;
对于C,的频率为,的频率为,
则该学生每日完成作业时间的中位数为,故C正确;
对于D,估计该学生每日完成作业时间的众数为,故D错误;
故选:C
3.ABCD
【分析】根据对称知识可得,结合平均数、中位数、方差、极差的性质,即可判断出答案.
【详解】由于 ,它们分别与 关于点对称,
则有,即有 .
则由平均数的性质可得这组数的平均数为 ,
结合中位数性质可知中位数为 ,结合方差性质可得方差为,极差非负,所以极差为.
故选:ABCD
4.ACD
【详解】根据平均数,中位数,众数的概念结合图形分析判断.
【分析】图(1)的分布直方图是对称的,所以平均数=中位数=众数,故A正确;
图(2)众数最小,右拖尾平均数大于中位数,故B错误,C正确;
图(3)左拖尾众数最大,平均数小于中位数,故D正确.
故选:ACD.
5.①②④
【分析】依据平均数和方差的定义判断①;求得语文、数学、英语年级排名均在150名以外的学生人数判断②;求得语文第一名、数学第一名、英语第一名的同学判断③;求得从该班学生中随机抽取1人,若其语文排名大于200,则其英语和数学排名均在150以内的概率判断④.
【详解】①:三科中,数学对应的点比英语对应的点到横轴的距离近且较为密集,
数学对应的点到横轴的距离比语文对应的点到纵轴距离近且较为密集,
所以数学年级排名的平均数及方差均最小.判断正确;
②:语文、数学、英语年级排名均在150名以外的学生为1人.判断正确;
③:本次考试该班语文第一名、数学第一名、英语第一名为同一名同学.判断错误;
④:由图表可知语文排名大于200的有3位同学,
语文排名大于200且英语和数学排名均在150以内的同学仅有1位同学.
故从该班学生中随机抽取1人,若其语文排名大于200,
则其英语和数学排名均在150以内的概率为.判断正确.
故答案为①②④
6.
【分析】根据平均数公式及方差公式分别计算、、,即可判断;
【详解】由图甲:平均值为,
,
,
,
,
,
则标准差,
故答案为:.
反思提升:
(1)众数、中位数、平均数的应用要点
中位数、众数分别反映了一组数据的“中等水平”“多数水平”,平均数反映了数据的平均水平,我们需根据实际需要选择使用.
(2)频率分布直方图的数字特征
①众数:众数一般用频率分布表中频率最高的一组的组中值来表示,即在样本数据的频率分布直方图中,最高小长方形的底边中点的横坐标;
②中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;
③平均数:平均数在频率分布表中等于组中值与对应频率之积的和.
【考点3】总体离散程度的估计
一、单选题
1.(2024·黑龙江哈尔滨·模拟预测)已知有4个数据的平均值为5,方差为4,现加入数据6和10,则这6个数据的新方差为( )
A.B.C.6D.10
2.(2024·陕西西安·模拟预测)已知一组样本数据的方差为10,且,则样本数据的方差为( )
A.9.2B.10.8C.9.75D.10.25
二、多选题
3.(2024·山东泰安·模拟预测)下列结论正确的是( )
A.回归直线至少经过其样本数据中的一个点
B.已知命题,,则命题的否定为,
C.若为取有限个值的离散型随机变量,则
D.若一组样本数据、、、的平均数为10,另一组样本数据、、、的方差为8,则两组样本数据合并为一组样本数据后的平均数和方差分别为17和54
4.(2024·福建福州·模拟预测)下列说法中,正确的是( )
A.数据的第50百分位数为32
B.已知随机变量服从正态分布,;则
C.已知两个变量具有线性相关关系,其回归直线方程为;若,,,则
D.若样本数据的方差为2,则数据的方差为4
三、填空题
5.(2023·吉林·一模)吉林市一中学有男生900人,女生600人.在“书香校园”活动中,为了解全校学生的读书时间,按性别比例分层随机抽样的方法抽取100名学生,其中男生、女生每天读书时间的平均值分别为60分钟和80分钟,方差分别为10和15.结合上述数据估计该校学生每天读书时间的平均值为 分钟,方差为 .
6.(2022·北京·模拟预测)某班在一次考试后分析学生在语文、数学、英语三个学科的表现,绘制了各科年级排名的散点图(如下图所示).
关于该班级学生这三个学科本次考试的情况,给出下列四个结论:
①三科中,数学年级排名的平均数及方差均最小;
②语文、数学、英语年级排名均在150名以外的学生为1人;
③本次考试该班语文第一名、数学第一名、英语第一名可能为三名不同的同学;
④从该班学生中随机抽取1人,若其语文排名大于200,则其英语和数学排名均在150以内的概率为.
其中所有正确结论的序号是 .
参考答案:
1.C
【分析】设原来的 4 个数依次为 , , , , 再利用平均数和方差的计算公式结合整体法即可.
【详解】设原来的4个数依次为,,,,
原来4个数据的平均值为5,方差为4,
,
,
,
,
现加入数据6和10,则这6个数据的平均数为
,
则这6个数据的方差为:
.
故选:C.
2.B
【分析】根据条件中的方差和,代入新数据的方差公式,即可求解.
【详解】设样本数据的平均数为,则,
且样本数据的平均数也为,
故:
故选:B
3.BD
【分析】对于选项A,回归直线一定过样本中心点,回归直线可能不过任何一个点;对于选项B,全称量词命题的否定的方法是改量词,否结论;对于选项C,由即可判断正误;对于选项D,计算出、的值,再利用平均数和方差公式可求得合并后的新数据的平均数和方差.
【详解】对于选项A,回归直线一定经过样本中心点,但不一定经过其样本数据中的点,故A错误;
对于选项B,命题的否定为“”,故B正确;
对于选项C,为取有限个值的离散型随机变量,,则,故C错误;
对于选项D,由题意可知,数据、、、的平均数为,则,则,
所以,数据、、、,
平均数为,,
方差为,
即方差为,所以.
将两组数据合并后,新数据、、、、、、、,
平均数为,
方差为,
即方差为. 故D正确.
故选:BD.
4.BC
【分析】根据第50百分位数为中位数判断A,根据正态分布的性质判断B,根据回归直线方程的性质判断C,根据方差的性质判断D.
【详解】对数据排列:,因为第50百分位数为中位数,所以50百分位数为,故A错误;
因为随机变量服从正态分布,,所以,所以,所以,所以,故B正确;
因为,,,则,故C正确;
因为样本数据的方差为2,所以数据的方差为,故D错误.
故选:BC.
5. 68 108
【分析】利用分层抽样的平均值与方差公式计算即可.
【详解】由题意可知男生女生抽取比例分别为:,
故抽取样本的平均值为:,
方差为:.
以此估计该校学生每天读书时间的平均值为68;方差为108.
故答案为:68;108.
6.①②④
【分析】依据平均数和方差的定义判断①;求得语文、数学、英语年级排名均在150名以外的学生人数判断②;求得语文第一名、数学第一名、英语第一名的同学判断③;求得从该班学生中随机抽取1人,若其语文排名大于200,则其英语和数学排名均在150以内的概率判断④.
【详解】①:三科中,数学对应的点比英语对应的点到横轴的距离近且较为密集,
数学对应的点到横轴的距离比语文对应的点到纵轴距离近且较为密集,
所以数学年级排名的平均数及方差均最小.判断正确;
②:语文、数学、英语年级排名均在150名以外的学生为1人.判断正确;
③:本次考试该班语文第一名、数学第一名、英语第一名为同一名同学.判断错误;
④:由图表可知语文排名大于200的有3位同学,
语文排名大于200且英语和数学排名均在150以内的同学仅有1位同学.
故从该班学生中随机抽取1人,若其语文排名大于200,
则其英语和数学排名均在150以内的概率为.判断正确.
故答案为①②④
反思提升:
标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)较大,数据的离散程度越大;标准差(方差)较小,数据的离散程度越小.
分层检测
【基础篇】
一、单选题
1.(2024·陕西商洛·模拟预测)某高校为宣扬中华文化,举办了“论语吟唱”的比赛,在比赛中,由A,B两个评委小组(各9人)给参赛选手打分.根据两个评委小组对同一名选手的打分绘制成如图所示折线图,则下列说法正确的是( )
A.B组打分的方差小于A组打分的方差
B.B组打分的中位数为75
C.A组的意见相对一致
D.A组打分的众数为50
2.(2024·四川·一模)一家水果店为了解本店苹果的日销售情况,记录了过去天的日销售量(单位:kg),将全部数据按区间50,60,60,70,…,90,100分成5组,得到如图所示的频率分布直方图:
根据图中信息判断,下列说法中不恰当的一项是( )
A.图中的值为
B.这天中有天的日销售量不低于kg
C.这天销售量的中位数的估计值为kg
D.店长希望每天的苹果尽量新鲜,又能地满足顾客的需要(在天中,大约有天可以满足顾客的需求),则每天的苹果进货量应为kg
3.(2024·广东珠海·模拟预测)下列说法正确的是( )
A.一组数据的标准差为0,则这组数据中的数均相等
B.两组数据的标准差相等,则这两组数据的平均数相等
C.若两个变量的相关系数越接近于0,则这两个变量的相关性越强
D.已知变量,由它们的样本数据计算得到的观测值的部分临界值如下表:
则在犯错误的概率不超过0.025的前提下认为变量没有关系
4.(2024·四川资阳·二模)某产品的标准质量是50克/袋,抽取8袋该产品,称出各袋的质量(单位:克)如下:48,49,50,50,50,50,51,52.这8袋产品中,质量在以平均数为中心,1倍标准差范围内的有( )
A.4袋B.6袋C.7袋D.8袋
二、多选题
5.(2024·浙江嘉兴·模拟预测)下列说法正确的是( )
A.样本数据的下四分位数是17
B.在比例分配的分层随机抽样中,若第一层的样本量为10,平均值为9,第二层的样本量为20,平均值为12,则所抽样本的平均值为11
C.若随机变量,则
D.若随机变量,若,则
6.(2024·湖北·模拟预测)某公司为保证产品生产质量,连续10天监测某种新产品生产线的次品件数,得到关于每天出现的次品的件数的一组样本数据:3,4,3,1,5,3,2,5,1,3,则关于这组数据的结论正确的是( )
A.极差是4B.众数小于平均数
C.方差是1.8D.数据的80%分位数为4
7.(24-25高三上·内蒙古赤峰·阶段练习)某地农研所为研究新的大豆品种,在面积相等的80块豆田上种植一种新型的大豆,得到各块豆田的亩产量(单位:kg),将所得数据按,,,,,分成六组,得到如图所示的频率分布直方图:
则下列结论正确的是( )
A.这80块豆田的亩产量的中位数低于180kg
B.这80块豆田的亩产量的极差不高于60kg
C.在这80块豆田中,亩产量不低于190kg的豆田所占比例为
D.这80块豆田的亩产量的第75百分位数高于
三、填空题
8.(2024·广东珠海·一模)甲、乙两班参加了同一学科的考试,其中甲班50人,乙班40人.甲班的平均成绩为72分,方差为90分;乙班的平均成绩为90分,方差为60分.那么甲、乙两班全部90名学生的平均成绩是 分,方差是 分.
9.(2024·上海·模拟预测)已知样本的平均数为2,方差为2023,则的平均数为 .
10.(2024·江西·模拟预测)某新能源汽车店五月份的前8天汽车销量(单位:辆)分别为:,则这组数据的分位数为 .
四、解答题
11.(2024·四川绵阳·模拟预测)2024年,全国政协十四届二次会议于3月4日下午3时在人民大会堂开幕,3月10日上午闭幕;十四届全国人大二次会议于3月5日上午开幕,11日上午闭幕.为调查居民对两会相关知识的了解情况,某小区开展了两会知识问答活动,现将该小区参与该活动的240位居民的得分(满分100分)进行了统计,得到如下的频率分布直方图.
(1)根据频率分布直方图,估计全体居民得分的方差(各组以区间中点值作代表);
(2)为鼓励小区居民学习两会精神,移动公司计划为参与本次活动的居民进行奖励,奖励分为以下两种方案:
方案一:参与两会知识问答的所有居民每人奖励20元话费充值卡;
方案二:问答活动得分低于平均分的居民奖励15元话费充值卡,得分不低于平均分的居民奖励25元话费充值卡.
你认为哪种方案,小区居民所得的奖励更多,请说明理由.
12.(2024·四川成都·模拟预测)某机构为了解2023年当地居民网购消费情况,随机抽取了100人,对其2023年全年网购消费金额(单位:千元)进行了统计,所统计的金额均在区间内,并按,,分成6组,制成如图所示的频率分布直方图.
(1)求图中的值,并估计居民网购消费金额的中位数;
(2)若将全年网购消费金额在20千元及以上者称为网购迷,结合图表数据,补全列联表,并判断是否有的把握认为样本数据中网购迷与性别有关系?说明理由.
下面的临界值表仅供参考:
(参考公式:,其中
参考答案:
1.C
【分析】根据折线统计图一一分析即可.
【详解】对于A:观察折线图可知,B组的极差大于A组的极差,
且数据波动性较A组更大,所以B组打分的方差大于A组打分的方差,故A错误;
对于B:B组打分的分值按照从小到大排列为:36,55,58,62,66,68,68,70,75,
所以中间数为66,故中位数为66,故B错误;
对于C:A组的打分成绩比较均匀,波动更小,故A组意见相对一致,故C正确;
对于D:A组打分的分值为:42,47,45,46,50,47,55,50,47,
所以A组打分的分值的众数为47,故D错误.
故选:C.
2.D
【分析】选项A,利用频率分布直方图的性质,即可求解;选项B,利用频率分布直方图,得到不低于kg的频率为,即可求解;选项C,设中位数为,根据条件,建立方程,即可求解;选项D,将问题转化成求第分位数,即可判断出正误.
【详解】对于选项A,由图知,解得,所以选项A正确,
对于选项B,由图知日销售量不低于kg的频率为,由,所以选项B正确,
对于选项C,设中位数为,由,解得,所选项C正确,
对于选项D,设第分位数为,则有,得到,所以选项D错误,
故选:D.
3.A
【分析】应用标准差公式判断A,特殊值法判断B,根据相关系数性质判断C,应用独立性检验判断D.
【详解】A选项,根据标准差定义,一组数据的标准差
时,
显然A正确;
B选项,两组数据的标准差相等,这两组数据的平均数未必相等,
如均为1和均为2的两组数据,它们的标准差均为0,
但它们的平均数分别为1和,B错误;
C选项,两个变量的相关系数越接近于0,两个变量的相关性越弱,C错误;
D选项,,根据独立性检验原理,
在犯错误的概率不超过0.025的前提下认为变量有关系,D错误.
故选:A
4.B
【分析】根据方差的运算公式,结合标准差的定义进行求解即可.
【详解】这8袋产品的平均质量,
方差,
标准差.质量在以平均数为中心,1倍标准差范围内,即在内的产品有6袋.
故选:B
5.ABD
【分析】对于A由下四分位数的概念即可判断;对于B,由平均数的计算公式即可判断;对于C由二项分布即可判断;对于D由正态分布的对称性即可判断.
【详解】对于A.从小到大排序得:16,17,19,20,22,24,26,由,所以下四分位数是17正确;
对于B,正确;
对于C,由二项分布可得:,错误;
对于D,由正态分布的对称性可得:,正确
故选:ABD
6.AC
【分析】由极差的定义计算后判断选项A;由众数和平均数的定义计算后判断选项B;计算数据方差判断选项C;计算80%分位数判断选项D.
【详解】数据从小到大排列为1,1,2,3,3,3,3,4,5,5.
对于A,该组数据的极差为,故A正确;
对于B,众数为3,平均数为,两者相等,故B错误;
对于C,方差为,故C正确;
对于D,,这组数据的分位数为第8个数和第9个数的平均数4.5,故D错误.
故选:AC.
7.BC
【分析】对于A,根据中位数的定义即可求解;对于B,根据极差的定义即可求解;对于C,根据频率分布直方图纵坐标的意义即可求解;先根据百分位数的定义求出第75百分位数所在的区间,再根据分析即可求解.
【详解】对于A,前三组的频率为,
前四组的频率为:,
所以这80块豆田的亩产量的中位数在之间,故不低于180kg,则A错误;
对于B,,,
所以这80块豆田的亩产量的极差高于40kg,且不高于60kg,则B正确;
对于C,在这80块豆田中,亩产量不低于190kg的豆田所占比例为,则C正确.
对于D,,,
所以这80块豆田的亩产量的第75百分位数不低于180kg,
当亩产量在内的豆田的亩产量都是180kg时,这80块豆田的亩产量的第75百分位数为180kg,则D错误.
故选:BC.
8. 80
【分析】利用平均数的定义求出90名学生的平均成绩,根据局部方差和整体方差的公式进行求解.
【详解】甲、乙两班全部90名学生的平均成绩为分,
方差为
故答案为:80,
9.
【分析】根据题意,利用数据的平均数和方差的计算公式,准确运算,即可求解.
【详解】由题意,可得,所以,
又由,
即,
所以.
故答案为:.
10.13
【分析】将数据从小到大排列,然后算出分位数的位置,由百分位数的定义,即可得到答案.
【详解】将这8个数据从小到大排列得,
因为,所以这组数据的分位数为.
故答案为:13
11.(1)129;
(2)方案一小区居民所得的奖励更多,理由见解析.
【分析】(1)根据直方图先求平均数,然后再根据方差公式计算即可;
(2)先根据直方图求得分低于平均数的频率,然后根据频率计算方案二所需费用,再计算出方案一所需费用即可得结论.
【详解】(1)依题意,得分平均数为.
所以方差
(2)得分低于74的频率为,得分高于74分的频率为0.48.
因此,方案一所需充值费用为:元;
方案二所需充值费用为:元.
所以方案一小区居民所得的奖励更多.
12.(1),17.5(千元)
(2)表格见解析,有的把握认为样本数据中的网购迷与性别有关系
【分析】(1)根据频率之和为1即可求解,进而给根据百分位数的计算即可求解,
(2)完善二联表,即可计算卡方,进而与临界值比较即可求解.
【详解】(1)根据频率分布直方图得:,
解得,
直方图中从左到右6组的频率分别为:0.05,0.1,0.2,0.3,0.2,0.15,
可得网购金额的中位数位于区间内,设为,
故,解得:(千元);
(2)根据频率分布直方图得样本中网购迷的人数为,
列联表如下:
算得.
有的把握认为样本数据中的网购迷与性别有关系.
【能力篇】
一、单选题
1.(2024·陕西西安·二模)有一组样本数据:,,,其平均数为2,由这组样本数据得到新样本数据:,,,2,那么这两组样本数据一定有相同的( )
A.众数B.中位数
C.方差D.极差
二、多选题
2.(2024·山东济南·模拟预测)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了100名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这100名学生中,成绩位于内的学生成绩方差为12,成绩位于内的同学成绩方差为10.则( )
A.
B.估计该年级学生成绩的中位数约为77.14
C.估计该年级成绩在80分及以上的学生成绩的平均数为87.50
D.估计该年级成绩在80分及以上的学生成绩的方差为30.25
三、填空题
3.(2024·安徽·模拟预测)某小学对四年级的某个班进行数学测试,男生的平均分和方差分别为91和11,女生的平均分和方差分别为86和8,已知该班男生有30人,女生有20人,则该班本次数学测试的总体方差为 .
四、解答题
4.(2024·湖北武汉·模拟预测)四月的武汉被百万株蔷薇花覆盖,形成了全城的花海景观。蔷薇花一般扦插繁殖,园林局为了更好的了解扦插枝条的长度对繁殖状况的影响,选择甲乙两区按比例分层抽样来抽取样本.已知甲区的样本容量,样本平均数,样本方差;乙区的样本容量,样本平均数,样本方差.
(1)求由两区样本组成的总样本的平均数及其方差;(结果保留一位小数)
(2)为了营造“花在风中笑,人在画中游”的美景,甲乙两区决定在各自最大的蔷薇花海公园进行一次书画比赛,两区各派一支代表队参加,经抽签确定第一场在甲区举行.比赛规则如下:每场比赛分出胜负,没有平局,胜方得1分,负方得0分,下一场在负方举行,先得2分的代表队获胜,比赛结束.当比赛在甲区举行时,甲区代表队获胜的概率为,当比赛在乙区举行时,甲区代表队获胜的概率为.假设每场比赛结果相互独立.甲区代表队的最终得分记为X,求X的分布列及的值.
参考数据:.
参考答案:
1.D
【分析】根据众数、中位数、方差以及极差的定义,结合题意,即可判断和选择.
【详解】对A:假设,,中,有两个2,两个3,其它4个数据都不相同,且这8个数据平均数为,那么众数为和;
再添加一个2后,有三个2,故众数为2,众数发生改变,故A错误;
对B:假设,,分别为:,满足平均数为,其中位数为;
添加以后,其中位数为,中位数发生改变,故B错误;
对C:,,的平均数为,方差;
添加2以后,其平均数还是,方差,故方差发生改变;
对D:若是,,的最大值或最小值,因为其平均数为,故这组数据都是2,其极差为,添加2后,极差也是0;
若不是,,的最大值,也不是最小值,添加2后,最大值和最小值没有改变,极值也不发生变化,故D正确.
故选:D.
2.BCD
【分析】A项,由各组频率之和为求参数;B项可由频率分布直方图面积与比较,估计中位数所在区间,利用面积关系建方程求解可得;C项,两组求加权平均数可得;D项,由分别两组成绩的方差与两组总方差的关系求解即可.
【详解】A项,在频率分布直方图中,所有直方图的面积之和为1,
则,解得,故A错误;
项,前两个矩形的面积之和为
前三个矩形的面积之和为.
设该年级学生成绩的中位数为,则,
根据中位数的定义可得,解得,
所以,估计该年级学生成绩的中位数约为,故B正确;
C项,估计成绩在80分以上的同学的成绩的平均数为
分,故C正确;
D项,估计该年级成绩在80分及以上的学生成绩的方差为
,故D正确.
故选:BCD.
3.
【分析】先求出总体的平均数,在利用计算得解.
【详解】设全体同学数学成绩的平均分为,方差为,
记,,,,,,
依题意有,
则
.
故答案为:.
4.(1),
(2)分布列见解析,
【分析】(1)利用平均数的计算公式求得,再利用方差的计算公式进行转化求解即可得解;
(2)先根据题意得到的所有可能取值,再利用独立事件的概率公式分别求得各个取值的概率,从而利用数学期望的计算公式即可得解.
【详解】(1)根据题意,得,
因为
,
同理,
所以
所以总样本的平均数为,方差.
(2)依题意可知,的所有可能取值为,
设“第场比赛在甲镇举行,甲镇代表队获胜”为事件,
“第场比赛在乙镇举行,甲镇代表队获胜”为事件,
且,则,,
所以,
,
,
则的分布列为:
数学期望.
亩产量
[900,950)
[950,1000)
[1000,1050)
[1050,1100)
[1100,1150)
[1150,1200)
频数
6
12
18
30
24
10
题号
1
2
3
答案
C
B
BD
男生
82
85
86
87
88
90
90
92
94
96
女生
82
84
85
87
87
87
88
88
90
92
题号
1
2
3
4
答案
D
B
AB
CD
题号
1
2
3
4
答案
D
C
ABCD
ACD
题号
1
2
3
4
答案
C
B
BD
BC
0.1
0.05
0.025
0.01
2.706
3.841
5.024
6.635
男
女
合计
网购迷
20
非网购迷
47
合计
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
题号
1
2
3
4
5
6
7
答案
C
D
A
B
ABD
AC
BC
男
女
合计
网购迷
15
20
35
非网购迷
47
18
65
合计
62
38
100
题号
1
2
答案
D
BCD
X
0
1
2
P
相关试卷
这是一份专题47 椭圆-2025年高考数学一轮复习讲义(知识梳理+真题自测+考点突破+分层检测)(新高考专用),文件包含专题47椭圆-2025年高考数学一轮复习讲义知识梳理+真题自测+考点突破+分层检测新高考专用原卷版docx、专题47椭圆-2025年高考数学一轮复习讲义知识梳理+真题自测+考点突破+分层检测新高考专用解析版docx等2份试卷配套教学资源,其中试卷共56页, 欢迎下载使用。
这是一份专题35 数列求和-2025年高考数学一轮复习讲义(知识梳理+真题自测+考点突破+分层检测)(新高考专用),文件包含专题35数列求和-2025年高考数学一轮复习讲义知识梳理+真题自测+考点突破+分层检测新高考专用原卷版docx、专题35数列求和-2025年高考数学一轮复习讲义知识梳理+真题自测+考点突破+分层检测新高考专用解析版docx等2份试卷配套教学资源,其中试卷共52页, 欢迎下载使用。
这是一份专题31 复数-2025年高考数学一轮复习讲义(知识梳理+真题自测+考点突破+分层检测)(新高考专用),文件包含专题31复数-2025年高考数学一轮复习讲义知识梳理+真题自测+考点突破+分层检测新高考专用原卷版docx、专题31复数-2025年高考数学一轮复习讲义知识梳理+真题自测+考点突破+分层检测新高考专用解析版docx等2份试卷配套教学资源,其中试卷共40页, 欢迎下载使用。