所属成套资源:2026年高考数学复习举一反三讲义(全国通用)(学生版+解析)
2026年高考数学复习举一反三讲义(全国通用)专题9.3成对数据的统计分析(学生版+解析)
展开
这是一份2026年高考数学复习举一反三讲义(全国通用)专题9.3成对数据的统计分析(学生版+解析),共15页。学案主要包含了全国通用,题型5 残差,方法技巧与总结,解题思路,解答过程,变式1-1,变式1-2,变式1-3等内容,欢迎下载使用。
TOC \ "1-3" \h \u
\l "_Tc1854" 【题型1 变量的相关关系】 PAGEREF _Tc1854 \h 4
\l "_Tc2233" 【题型2 样本相关系数】 PAGEREF _Tc2233 \h 6
\l "_Tc14931" 【题型3 一元线性回归模型】 PAGEREF _Tc14931 \h 8
\l "_Tc27215" 【题型4 非线性回归模型】 PAGEREF _Tc27215 \h 11
\l "_Tc5936" 【题型5 残差】 PAGEREF _Tc5936 \h 17
\l "_Tc30847" 【题型6 列联表与独立性检验】 PAGEREF _Tc30847 \h 19
\l "_Tc364" 【题型7 独立性检验与其他知识综合】 PAGEREF _Tc364 \h 23
1、成对数据的统计分析
知识点1 变量的相关关系
1.变量的相关关系
(1)函数关系
函数关系是一种确定性关系,常用解析式来表示.
(2)相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.与函数关系不同,相关关系是一种非确定性关系.
2.散点图
(1)散点图
成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.
(2)正相关和负相关
如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.
3.线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线性相关.
知识点2 样本相关系数
1.样本相关系数
(1)对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1,y1),(x2,y2),…,(xn,yn),利用相关系数r来衡量两个变量之间线性关系的强弱,相关系数r的计算公式:
(其中x1,x2,…,xn和y1,y2,…,yn的均值分别为x和y).
①当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.
②当r0,所以两种证券是正相关,
那么表明两种证券的收益有同向变动的倾向,B正确,ACD错误.
故选:B.
【变式2-3】(2025·浙江杭州·二模)某兴趣小组研究光照时长x(h)和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,作如图所示的散点图.若去掉D10,2后,下列说法正确的是( )
A.相关系数r变小B.决定系数R2变小
C.残差平方和变大D.解释变量x与预报变量y的相关性变强
【答案】D
【解题思路】从图中分析得到去掉D10,2后,回归效果更好,再由相关系数,决定系数,残差平方和和相关性的概念和性质作出判断即可.
【解答过程】从图中可以看出D10,2较其他点,偏离直线远,故去掉D10,2后,回归效果更好,
对于A,相关系数r越接近于1,模型的拟合效果越好,若去掉D10,2后,相关系数r变大,故A错误;
对于B,决定系数R2越接近于1,模型的拟合效果越好,若去掉D10,2后,决定系数R2变大,故B错误;
对于C,残差平方和越小,模型的拟合效果越好,若去掉D10,2后,残差平方和变小,故C错误;
对于D,若去掉D10,2后,解释变量x与预报变量y的相关性变强,且是正相关,故D正确.
故选:D.
【题型3 一元线性回归模型】
【例3】(2025·浙江温州·三模)为了研究某种商品的广告投入x和收益y之间的相关关系,某研究小组收集了5组样本数据如表所示,得到线性回归方程为y=bx+0.28,则当广告投入为10万元时,收益的预测值为( )万元.
A.2.48B.2.58C.2.68D.2.88
【答案】C
【解题思路】求得样本中心点,得到b=0.24,即可求解.
【解答过程】由1+2+3+4+55=3,0.5+0.8+1+1.2+1.55=1,
可得数据可得样本中心点为:3,1
代入回归方程1=3b+0.28,解得:b=0.24,
所以当x=10时,y=0.24×10+0.28=2.68.
故选:C.
【变式3-1】(2025·辽宁锦州·二模)5G技术在我国已经进入高速发展的阶段,5G手机的销量也逐渐上升.某手机商城统计了1至5月份5G手机的实际销量,如下表所示:
若y与x线性相关,且求得线性回归方程为y=0.32x+a,则下列说法不正确的是( )
A.由题中数据可知,a=0.08
B.由题中数据可知,6月份该商城5G手机的实际销量为2(千只)
C.由题中数据可知,变量x和y正相关,且相关系数一定小于1
D.若不考虑本题中的数据,回归直线可能不过x1,y1,x2,y2,…,xn,yn中任一个点
【答案】B
【解题思路】根据题意,由回归直线方程的性质,对选项逐一判断,即可得到结果.
【解答过程】对于A,由表格可知,x=151+2+3+4+5=3,y=150.5+0.6+1.0+1.4+1.7=1.04,
则a=y−0.32x=1.04−0.32×3=0.08,故A正确;
对于B,将x=6代入y=0.32x+0.08,可得y=2,
所以6月份该商城5G手机的实际销量预测为2(千只),故B错误;
对于C,因为回归方程为y=0.32x+0.08,所以变量x和y正相关,
且样本点不全在回归方程上,所以相关系数一定小于1,故C正确;
对于D,回归直线可能不过样本点中的任何一个点,故D正确;
故选:B.
【变式3-2】(2025·甘肃白银·三模)某材料实验室研究了某种金属材料在不同冷却速率下的凝固点温度,以及冷却环境对材料热物性的影响.下表为某金属材料凝固点温度y(单位:∘C)随冷却速率x(单位:∘C/min)变化的统计数据.
(1)一般认为当r≥0.9时,经验回归方程的拟合效果非常好;当0.75≤r0.9,
所以该经验回归方程的拟合效果非常好.
(2)由(1)知x=30,由b=i=15xi−xyi−yi=15xi−x2=−19001000=−1.9,
因为y=650+640+600+590+5805=612,
所以a=y−bx=612+1.9×30=669,故所求的经验回归方程为y=−1.9x+669.
当x=80时,y^=−1.9×80+669=517,
所以冷却速率为80∘C/min时,该金属的凝固点温度为517∘C.
【变式3-3】(2025·山东·一模)某工厂的某生产车间2020年至2024年生产的年利润y(百万元),统计数据如表所示:
(1)已知变量x,y具有线性相关关系,求年利润y(百万元)关于年份代号x的经验回归方程y=bx+a,并预测2025年该车间的年利润;
(2)已知该工厂共有6个车间,根据每个车间的年利润分为“A类车间”和“B类车间”两类,其中“A类车间”4个,“B类车间”2个,现从这6个车间中任取3个车间,记随机变量X为“A类车间”的个数,求X的分布列及其数学期望.
参考公式:b=i=1nxiyi−nxyi=1nxi2−n(x)2=i=1nxi−xyi−yi=1nxi−x2,a^=y−b^x.
【答案】(1)y=0.5x+2.3,5.3百万元.
(2)分布列见解析,2
【解题思路】(1)由最小二乘法即可求解回归方程,代入方程即可预测,
(2)利用超几何分布的概率公式求解概率,即可得分布列,进而由期望公式得解.
【解答过程】(1)由题意,根据表格中的数据,可得:
x=151+2+3+4+5=3,y=152.8+3.4+3.6+4.4+4.8=3.8,
i=15xi2=55,i=15xiyi=62,可得b=i=15xiyi−5xyi=15xi2−5x2=62−5×3×3.855−5×32=12=0.5.
所以a=y−bx=3.8−0.5×3=2.3,
故x的线性回归方程y=0.5x+2.3,
令x=6,得y=0.5×6+2.3=5.3,故2025年该车间年利润约为5.3百万元.
(2)随机变量X的可能值为1,2,3,
可得PX=1=C22C41C63=15,PX=2=C21C42C63=35,PX=3=C43C63=15,
所以X的分布列为:
所以期望为:EX=1×15+2×35+3×15=2.
【题型4 非线性回归模型】
【例4】(2025·四川绵阳·模拟预测)某汽车公司拟对“东方红”款高端汽车发动机进行科技改造,根据市场调研与模拟,得到科技改造投入x(亿元)与科技改造直接收益y(亿元)的数据统计如下:
当07.879=x0.005,
根据小概率值α=0.005的独立性检验,我们推断H0不成立,
即认为是否接受去外地长时间出差与性别有关,此推断犯错误的概率不大于0.005.
故选:B.
【变式6-2】(2025·全国·模拟预测)癌症术后五年存活率是判断癌症治疗效果的重要指标,某医院通过统计癌症患者手术后五年的生存情况得到如下列联表:
(1)求s,t,m;
(2)根据小概率值0.001的独立性检验,能否认为癌症术后五年存活率主要与患者手术时癌症所处阶段有关?
(3)结合上述情况,对科学预防和治疗癌症提出合理建议.
附:χ2=n(ad−bc)2a+bc+da+cb+d.
【答案】(1)400,600,600;
(2)能;
(3)答案见解析
【解题思路】(1)根据列联表的组成计算即得.
(2)将数据代入卡方公式计算卡方值,然后判断零假设即可.
(3)根据题意和实际情况提出合理建议即可.
【解答过程】(1)根据题意和表格中的数据可得:
t=1600−1000=600;s=t−200=600−200=400;
m=200+s=200+400=600.
所以s=400,t=600,m=600.
(2)零假设为H0:癌症术后五年存活率与患者手术时癌症所处阶段无关联.
由列联表可知:n=1600,a=800,b=200,c=200,d=400,
则χ2=1600(800×400−200×200)21000×600×1000×600≈348.444>10.828=x0.001.
根据小概率值0.001的独立性检验,我们推断H0不成立,
即认为癌症术后五年存活率主要与患者手术时癌症所处阶段有关,此推断犯错误的概率不大于0.001.
(3)前中期癌症患者术后五年存活率显著高于晚期患者术后五年存活率,
所以应当规律体检,及早发现癌症,尽量在前中期进行手术.
【变式6-3】(2025·湖南永州·模拟预测)“村厨”是湖南省宁远县举办的“九嶷山村厨大会”的简称.在2023年火爆“出圈”后,“村厨”热度不减.2025年4月12日,万众瞩目的2025年“村超”新赛季在九嶷山景区拉开帷幕,为了解不同年龄的游客对“村厨”的满意度,某组织进行了一次抽样调查,分别抽取年龄超过35周岁和年龄不超过35周岁各200人作为样本,每位参与调查的游客都对“村厨”给出满意或不满意的评价.设事件A=“游客对”村厨“满意”,事件B=“游客年龄不超过35周岁”,据统计,PA∣B=45,PB∣A=815.
(1)根据已知条件,填写下列2×2列联表并说明理由;
(2)由(1)中2×2列联表数据,根据小概率值α=0.01的独立性检验,能否认为游客对“村厨”的满意度与年龄有关联?
附:K2=nad−bc2a+bc+da+cb+d,n=a+b+c+d.
【答案】(1)列联表见解析,理由见解析
(2)没有关联
【解题思路】(1)根据题意可求出不超过35岁的人中,对“村厨”满意的有160人,对“村厨”满意的人中超过35岁的有140人,从而可完成列联表;
(2)根据列联表中的数据结合公式计算K2,再与临界值比较即可.
【解答过程】(1)由P(A|B)=45,得游客年龄不超过35周岁且对“村厨”满意的有45×200=160人,
由P(B|A)=815,得对“村厨”满意的游客人数为160×158=300,
则对“村厨”满意的人中超过35岁的有300−160=140人,
所以2×2列联表如下:
(2)由(1)得K2=400160×60−140×402300×100×200×200=163≈5.333
相关学案
这是一份2026年高考数学复习举一反三讲义(全国通用)专题9.3成对数据的统计分析(学生版+解析),文件包含2026年高考数学复习举一反三讲义全国通用专题105古典概型概率的基本性质教师版docx、2026年高考数学复习举一反三讲义全国通用专题105古典概型概率的基本性质学生版docx等2份学案配套教学资源,其中学案共53页, 欢迎下载使用。
这是一份2026届高三数学一轮复习讲义(标准版)第九章9.3成对数据的统计分析(Word版附答案),共10页。
这是一份2026年高考数学复习举一反三讲义(全国通用)专题9.1随机抽样、统计图表(学生版+解析),文件包含2026年高考数学复习举一反三讲义全国通用专题93成对数据的统计分析教师版docx、2026年高考数学复习举一反三讲义全国通用专题93成对数据的统计分析学生版docx等2份学案配套教学资源,其中学案共70页, 欢迎下载使用。
相关学案 更多
- 1.电子资料成功下载后不支持退换,如发现资料有内容错误问题请联系客服,如若属实,我们会补偿您的损失
- 2.压缩包下载后请先用软件解压,再使用对应软件打开;软件版本较低时请及时更新
- 3.资料下载成功后可在60天以内免费重复下载
免费领取教师福利