2026年高考数学一轮复习第九章统计与成对数据的统计分析重难点培优01统计小题易考点全归纳(复习讲义)(学生版+解析)
展开
这是一份2026年高考数学一轮复习第九章统计与成对数据的统计分析重难点培优01统计小题易考点全归纳(复习讲义)(学生版+解析),共19页。
\l "_Tc28373" 02 题型精研・技巧通法提能力 PAGEREF _Tc28373 \h 7
\l "_Tc16555" 题型一 随机数法(★★★) PAGEREF _Tc16555 \h 7
\l "_Tc7141" 题型二 分层随机抽样(★★★★★) PAGEREF _Tc7141 \h 8
\l "_Tc26803" 题型三 频率分布直方图(★★★★★) PAGEREF _Tc26803 \h 9
\l "_Tc13512" 题型四 其他统计图表的实际应用(★★★★) PAGEREF _Tc13512 \h 11
\l "_Tc3897" 题型五 总体百分位数的估计(★★★★) PAGEREF _Tc3897 \h 13
\l "_Tc326" 题型六 平均数、方差等数据特征的计算(★★★★★) PAGEREF _Tc326 \h 14
\l "_Tc11957" 题型七 变量的相关关系、残差等分析(★★★★) PAGEREF _Tc11957 \h 16
\l "_Tc17557" 题型八 线性回归直线方程(★★★★★) PAGEREF _Tc17557 \h 17
\l "_Tc28054" 题型九 非线性回归直线方程(★★★★★) PAGEREF _Tc28054 \h 19
\l "_Tc8991" 题型十 独立性检验(★★★★★) PAGEREF _Tc8991 \h 20
\l "_Tc25070" 03 实战检测・分层突破验成效 PAGEREF _Tc25070 \h 23
\l "_Tc621" 检测Ⅰ组 重难知识巩固 PAGEREF _Tc621 \h 23
\l "_Tc1659" 检测Ⅱ组 创新能力提升 PAGEREF _Tc1659 \h 30
一、随机数法
1、随机数法
(1)定义:简单随机抽样中,另一个经常被采用的方法是随机数法,即利用随机试验或信息技术(即计算器、电子表格软件和R统计软件)生成的随机数进行抽样.
(2)随机数法步骤:
= 1 \* GB3 ①把总体中的每个个体编号。
= 2 \* GB3 ②用随机数工具产生编号范围内的整数随机数.
= 3 \* GB3 ③把产生的随机数作为抽中的编号,使与编号对应的个体进入样本。重复上述过程,知道抽足样本所需要的数量.
(3)优点和缺点
优点:操作简单易行,它很好地解决了用抽签法当总总体中的个数较多时制签难的问题,
在总体容量不大的情况下是行之有效的。
缺点:总体中的个数很多,对个体编号的工作量太大,即使用随机数表法操作也不方便快捷。
二、分层随机抽样
1、分层随机抽样的必要性
简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能出现比较“极端”的样本,从而使得估计出现较大的偏差,这时候我们可以考虑采用一种新的抽样方法——分层随机抽样。
2、分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
3、比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配,即:
(1)
(2)
4、分层随机抽样使用的原则
(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
(2)分层随机抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.
三、分层随机抽样的平均数计算
1、总体平均数和样本平均数的计算
在分层随机抽样中,如果层数为2层,第1层和第2层包含的个体数分别为和,抽样的样本容量分别为和,第1层、第2层的总体平均数分别为和,第1层、第2层的样本平均数分别为和,总体平均数为,样本平均数为,则
(1)
(2)
2、用样本平均数估计总体平均数
由于第1层的样本平均数可以估计第1层的总体平均数,用第2层的样本平均数可以估计第2层的总体平均数,因此可以用估计总体平均数.
在比例分配的分层随机抽样中,,
所以
因此,在比例分配的分层随机抽样中,我们可以直接用样本平均数估计总体平均数为.
四、频率分布直方图
1、频率分布直方图
(1)列出样本数据的频率分布表和频率分布直方图的步骤:
①计算极差:找出数据的最大值与最小值,计算它们的差;
②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且;
③将数据分组:通常对组内数值所在左闭右开区间,最后一组取闭区间;
也可以将样本数据多取一位小数分组.
④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.
⑤绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图。
(2)频率分布直方图的特点:
①,
②个小长方形的面积等于1,
③.
(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.
(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,
频率分布直方图可以用一条光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线.
总体密度曲线精确地反映了一个总体在各个区域内取值的规律.
2、根据频率分布直方图求平均数、中位数和众数
众数、中位数、平均数与频率分布直方图的关系
(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(3)众数:众数是最高小矩形底边的中点所对应的数据.
五、总体百分位数的估计
1、第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2、计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;
若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
六、总体集中趋势的估计
1、相关概念
(1)众数:在样本数据中,出现次数最多的那个数据;
(2)中位数:将样本数据按大小顺序排列,若数据的个数为奇数,则最中间的数据为中位数,
若样本数据个数为偶数,则取中间两个数据的平均数作为中位数。
(3)平均数:设样本的数据为,则样本的算术平均数为;
2、众数、中位数和平均数的比较
3、平均数相关结论:
①如果两组数和的平均数分别是和,则一组数的平均数是;
②如果一组数的平均数为,则一组数的平均数为。
③如果一组数的平均数为,则一组数的平均数为
七、总体离散程度的估计
1、用样本的标准差估计总体的标准差
(1)数据的离散程度可以用极差、方差或标准差来描述;
(2)极差(又叫全距)是一组数据的最大值和最小值之差,反映一组数据的变动幅度;
(3)样本方差描述了一组数据围绕平均数波动的大小;
一般地,设样本的数据为,样本的平均数为,
定义样本方差为;
简化公式:=
(方差等于原数据平方的平均数减去平均数的平方)
(4)样本的标准差是方差的算术平方根.
样本标准差.
标准差越大数据离散程度越大,数据家分散;标准差越小,数据集中在平均数周围.
(5)方差相关结论:
①如果一组数的方差为,则一组数的方差为;
②如果一组数的方差为,则一组数的方差为。
八、频率分布直方图中的统计参数
1、频率分布直方图中的“平均数”:因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
2、频率分布直方图中的“中位数”:根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也就有50%的个体大于或等于中位数。因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值。
3、频率分布直方图中的“众数”:根据众数的意义,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数。一般用中点近似值代替。
九、样本相关系数
1、样本相关系数:设由变量x和y获得的两组数据分别为和(i=1,2,…,n),其对应关系如下表所示:
两组数据和的线性相关系数是度量两个变量x与y之间线性相关程度的统计量,
其计算公式为,
其中,,,它们分别是这两组数据的算术平均数.
2、相关系数r与相关程度
(1)当时,称成对样本数据正相关;
当时,成对样本数据负相关;
当时,成对样本数据间没有线性相关关系;
(2)样本相关系数r的取值范围为[-1,1];
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
十、残差与决定系数
1、残差
对于响应变量,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.
2、残差图
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.
3、残差分析
残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.其步骤为:计算残差化残差图在残差图中分析残差特性.
4、残差平方和
残差平方和,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.
5、决定系数
决定系数是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预报变量的能力.
,越大,即拟合效果越好,越小,模型拟合效果越差.
十一、独立性检验
独立性检验的一般方法
(1)根据题目信息,完善列联表;
(2)提出零假设:假设两个变量相互独立,并给出在问题中的解释。
(3)根据列联表中的数据及计算公式求出的值;
(4)当时,我们就推断不成立,即两个变量不独立,该推断犯错误的概率不超过;
当时,我们没有充分证据推断不成立,可以认为两个变量相互独立。
题型一 随机数法
【技巧通法·提分快招】
1.某校从500名同学中用随机数法抽取30人参加这一项调查.将这500名同学编号为001,002,…500,假设从第1行第4列的数字开始,则第5个被抽到的同学的编号为( )
3484 4217 5572 1754 5560 8331
0474 4767 2176 3350 2583 9212
0676 6301 6378 5916 9555 6719
A.331B.047C.447D.672
2.某校从450名同学中用随机数法抽取30人参加这一项调查.将这450名同学编号为,假设从第1行第7列的数字开始,则第5个被抽到的同学的编号为 .
64844217 55721754 55068331
04744767 21763350 25839212
06766301 63785916 95556719
3.(24-25高三上·上海·月考)某校广播室为研究学生对广播节目的喜好情况,从该校名同学中用随机数法抽取人参加这一项调查.将这名同学编号为,在以下随机数表中从任意一个随机数开始读出三位数组,假设从第行第列的数字开始,则第个被抽到的同学的编号为 .
题型二 分层随机抽样
【技巧通法·提分快招】
1.某学校有高中学生3000人,初中学生2000人.学生社团创办文创店,想了解初高中学生对学校吉祥物设计的需求,用等比例分层抽样的方式随机抽取若干人进行问卷调查.已知在初中学生中随机抽取了200人,则在高中学生中抽取了( )
A.150人B.200人C.300人D.500人
2.(25-26高三上·河南新乡·开学考试)某校高三年级有1200名学生,其中男生有660人,现按男女生人数比例采用分层随机抽样的方法抽取一个容量为40的样本,则女生应抽取的人数是( )
A.22B.18C.16D.14
3.某校高一年级有男生160人,女生120人,现需抽调人参与学校“5.4”文艺汇演志愿者工作.若按性别分层,采用比例分配的分层随机抽样.已知男生抽取16人,则( )
A.27B.28C.29D.30
4.(2024·黑龙江哈尔滨·模拟预测)在哈尔滨市2024年第一次市模考试中,三所学校高三年级的参考人数分别为、.现按比例分层抽样的方法从三个学校高三年级中抽取样本,经计算得三所学校高三年级数学成绩的样本平均数分别为,则三所学校学生数学成绩的总平均数约为( )
A.101B.100C.99D.98
5.为了研究某种病毒与血型之间的关系,决定从被感染的人群中抽取样本进行调查,这些感染人群中型血、型血、型血、型血的人数比为,现用比例分配的分层随机抽样方法抽取一个样本量为的样本,已知样本中型血的人数比型血的人数多,则 .
题型三 频率分布直方图
【技巧通法·提分快招】
1.(25-26高三上·江苏镇江·开学考试)(多选题)某农业研究部门在面积相等的100块稻田上种植同一种新型水稻,得到各块稻田的亩产量与田块数的关系(单位:),并整理下表
据表中数据,下列结论正确的是( )
A.100块稻田亩产量的中位数小于
B.100块稻田中亩产量低于的稻田所占比例低于
C.100块稻田亩产量的极差介于至之间
D.100块稻田亩产量的平均值介于至之间
2.(2025·陕西西安·一模)(多选题)某校举办“学党史守初心,践使命担责任”党史知识竞赛,并将2000名师生的竞赛成绩(满分100分,成绩取整数)整理成如图所示的频率分布直方图,则( )
A.B.估计成绩低于50分的有20人
C.估计这组数据的众数为75D.估计这组数据的第75百分位数为82
3.(25-26高三上·广东·开学考试)(多选题)为了了解苗圃中树苗的生长情况,林业部门从一个苗圃中的10000棵树苗中随机抽取了棵,按照树苗的高度进行了分组,并绘制了如图所示的频率分布直方图,已知高度在内的树苗有10棵,将样本频率当做概率,则以下结论正确的是( )
A.,
B.这棵树苗高度的中位数的估计值为114
C.在这10000棵树苗中,高度在100cm以下的约有2000棵
D.若采用按比例分层抽样的方法从这棵树苗中抽取40棵,则高度在内的有5棵
4.(2025·黑龙江大庆·一模)(多选题)某高校组织全体学生参加以“庆祝中华人民共和国成立75周年”为主题的知识竞赛,随机抽取了100名学生的成绩(单位:分)进行统计,按成绩分成5组:,得到如图所示的频率分布直方图.
根据图中数据,下列结论正确的是( )
A.这100名学生成绩的中位数约为75
B.这100名学生成绩的平均数约为78
C.从100名学生中随机抽取一名,估计其成绩不低于70分的概率为0.7
D.从该校学生中随机抽取两名,在这两名学生成绩都不低于70分的条件下,恰有一名学生成绩在内的概率估计值为
题型四 其他统计图表的实际应用
【技巧通法·提分快招】
1.(2024·四川乐山·三模)为了解某中学三个年级的学生对食堂饭菜的满意程度,用分层随机抽样的方法抽取30%的学生进行调查,已知该中学学生人数和各年级学生的满意率分别如图1和图2所示,则样本容量和抽取的二年级学生中满意的人数分别为( )
A.800,360B.600,108C.800,108D.600,360
2.(2025·江西·模拟预测)随着消费者对食品安全和健康饮食的关注度的提升,中国有机燕麦作为有机食品中营养价值较高的产品,受到消费者青睐,下图为中国有机燕麦消费者调研样本构成,根据该图,下列说法正确的是( )
A.中国有机燕麦消费者中女性不超过男性的2倍
B.超过的中国有机燕麦消费者月收入不高于15000元
C.超过半数的中国有机燕麦消费者年龄在31~40岁
D.中国有机燕麦消费者收入构成占比中的5个百分数的中位数是33.0%
3.(2025·宁夏石嘴山·三模)下图1是2020-2024年国内生产总值及其增长速度,图2是2020-2024年三次产业增加值占国内生产总值比重(三次产业包括第一产业,第二产业,第三产业).根据图1,图2,以下描述不正确的是( )
A.2022年第二产业增加值较2021年有所减少
B.2020-2024年国内生产总值呈逐年增长的趋势
C.2022年与2024年国内生产总值的增长速度较上一年有明显回落
D.2020-2024年第三产业增加值占国内生产总值比重的极差为
4.(25-26高三上·广西来宾·月考)(多选题)某城市收集并整理了该市2023年1月份至10月份每月最低气温与最高气温(单位:℃)的数据,绘制了如图所示的折线图.已知该市每月的最低气温与当月的最高气温两变量具有较好的线性关系,则根据该折线图,下列结论正确的是( )
A.每月的最低气温与当月的最高气温两变量为正相关
B.10月份的最高气温不低于5月份的最高气温
C.月温差(最高气温减最低气温)的最大值出现在1月份
D.最低气温低于的月份有4个
5.(多选题)十项全能的比赛成绩是按照国际田径联合会制定的专门田径运动会全能评分表将各个单项成绩所得的评分加起来计算的,总分多者为优胜者.如图,这是某次十项全能比赛中甲、乙两名运动员的各个单项得分的雷达图,则下列说法正确的是( )
A.在400米跑项目中,甲的得分比乙的得分低B.在跳高和标枪项目中,甲、乙水平相当
C.甲的各项得分比乙的各项得分更均衡D.甲的各项得分的极差比乙的各项得分的极差大
题型五 总体百分位数的估计
【技巧通法·提分快招】
1.(25-26高三上·福建·月考)数据3,1,1,4,5,2的第三四分位数为( )
A.B.C.D.
2.(25-26高三上·四川·开学考试)样本数据5.8,5.9,5.9,6.0,6.1,6.1,6.3,6.1的极差与第70百分位数之差为( )
A.B.C.5.6D.5.8
3.(25-26高三上·广东·月考)一组数据10,13,17,25,47的第80百分位数为,若6,,三个数成等差数列,则( )
A.21B.23C.D.
4.(24-25高三上·广东肇庆·月考)某同学在一次数学测试中的成绩是班级第十名(假设测试的成绩两两不同),且该同学的成绩恰好是该班级成绩的第80百分位数,则该班级的人数可能为( )
A.36B.41C.46D.51
5.(2025·甘肃定西·模拟预测)某品牌电动汽车公司为了解车主使用电动车辅助驾驶功能的情况,进行了问卷调查,从中抽取了100位车主进行抽样分析,得出这100位车主每人在100次驾驶途中使用辅助驾驶功能的次数的频率分布直方图,则样本中车主使用辅助驾驶功能次数的分位数为( )
A.62B.64C.66D.68
题型六 平均数、方差等数据特征的计算
【技巧通法·提分快招】
1.(25-26高三上·云南·月考)已知一组数据的平均数为3,则( )
A.B.C.D.
2.(25-26高三上·云南曲靖·月考)甲、乙两名选手在射击训练中各射击5次,成绩(单位:环)如下:
记甲、乙的平均成绩和方差分别为,和,,则下列结论正确的是( )
A.,B.,
C.,D.,
3.(25-26高三上·河北保定·开学考试)小李是一名健身运动爱好者,如图所示的统计图记录了他过去一个月(30天)每天花在健身运动上的时间(单位:分钟),记这组数据的众数为M,中位数为N,平均数为P,则( )
A.N
相关学案
这是一份2026年高考数学一轮复习第九章统计与成对数据的统计分析重难点培优01统计小题易考点全归纳(复习讲义)(学生版+解析),文件包含2026年高考数学一轮复习第九章统计与成对数据的统计分析重难点培优01统计小题易考点全归纳复习讲义教师版docx、2026年高考数学一轮复习第九章统计与成对数据的统计分析重难点培优01统计小题易考点全归纳复习讲义学生版docx等2份学案配套教学资源,其中学案共89页, 欢迎下载使用。
这是一份2026年高考数学一轮复习第九章统计与成对数据的统计分析第02讲成对数据的统计分析(复习讲义)(学生版+解析),文件包含2026年高考数学一轮复习第九章统计与成对数据的统计分析重难点培优01统计小题易考点全归纳复习讲义教师版docx、2026年高考数学一轮复习第九章统计与成对数据的统计分析重难点培优01统计小题易考点全归纳复习讲义学生版docx等2份学案配套教学资源,其中学案共89页, 欢迎下载使用。
这是一份2026年高考数学一轮复重难点培优01统计小题易考点全归纳(复习讲义)(全国通用)(学生版+解析),共10页。
相关学案 更多
- 1.电子资料成功下载后不支持退换,如发现资料有内容错误问题请联系客服,如若属实,我们会补偿您的损失
- 2.压缩包下载后请先用软件解压,再使用对应软件打开;软件版本较低时请及时更新
- 3.资料下载成功后可在60天以内免费重复下载
免费领取教师福利