2025版高考数学全程一轮复习学案第九章统计与成对数据的统计分析第三节成对数据的统计分析
展开1.变量的相关关系
(1)相关关系
两个变量有关系,但又没有确切到可由其中一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)正相关、负相关
从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现________的趋势,我们就称这两个变量正相关; 如果当一个变量的值增加时,另一个变量的相应值呈现________的趋势,则称这两个变量负相关.
(3)线性相关关系与经验回归直线
如果两个变量的取值呈现正相关或负相关,而且散点落在一条________附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做经验回归直线.
(4)样本相关系数
①r= eq \f(\(∑,\s\up11(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))2\(∑,\s\up6(n),\s\d4(i=1)) (yi-\(y,\s\up6(-)))2)) ;
②当r>0时,表明成对样本数据________;当r<0时,表明成对样本数据________.
r的绝对值越接近1,表明成对样本数据的线性相关程度________.r的绝对值越接近0,表明成对样本数据的线性相关程度________.
2.一元线性回归模型
(1)经验回归方程
我们将 eq \(y,\s\up6(^)) = eq \(b,\s\up6(^)) x+ eq \(a,\s\up6(^)) 称为y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,其中
eq \b\lc\{(\a\vs4\al\c1(\(b,\s\up11(^))=\f(\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))2),\(a,\s\up6(^))=\(y,\s\up6(-))-\(b,\s\up6(^))\(x,\s\up6(-))))
(2)残差:观测值减去________,称为残差.
(3)利用R2刻画回归效果
R2的计算公式为R2=1- eq \f(\(∑,\s\up11(n),\s\d4(i=1)) (yi-\(y,\s\up6(^))i)2,\(∑,\s\up6(n),\s\d4(i=1)) (yi-\(y,\s\up6(-)))2) ,其意义是R2越大,残差平方和 eq \(∑,\s\up11(n),\s\d4(i=1)) (yi- eq \(y,\s\up6(^)) i)2越小,即模型的拟合效果越________;R2越小,残差平方和越大,即模型的拟合效果越________.
3.列联表与独立性检验
(1)2×2列联表
如图,给出成对分类变量数据的交叉分类频数的数据统计表称为2×2列联表.
(2)独立性检验
依据上述2×2列联表构造统计量χ2= eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)) .
利用χ2的取值推断分类变量X和Y________的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
临界值表
【常用结论】
1.求解经验回归方程的关键是确定回归系数 eq \(a,\s\up6(^)) , eq \(b,\s\up6(^)) ,应充分利用经验回归直线过样本点的中心( eq \(x,\s\up6(-)) , eq \(y,\s\up6(-)) ).
2.回归分析和独立性检验都是基于成对样本观测数据进行估计或推断,得出的结论都可能与实际有误差,我们称之为犯错误.
夯 实 基 础
1.思考辨析(正确的打“√”,错误的打“×”)
(1)两个随机变量的线性相关程度越强,相关系数的绝对值越接近0.( )
(2)经验回归直线 eq \(y,\s\up6(^)) = eq \(b,\s\up6(^)) x+ eq \(a,\s\up6(^)) 至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.( )
(3)事件X,Y关系越密切,则由观测数据计算得到的χ2越大.( )
(4)由独立性检验可知,在犯错误的概率不超过1%的前提下认为物理成绩优秀与数学成绩优秀有关,某人数学成绩优秀,则他有99%的可能物理成绩优秀.( )
2.(教材改编)以下四个散点图中,变量x与y之间具有负的线性相关关系的是( )
3.(教材改编)实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的经验回归方程为( )
A. eq \(y,\s\up6(^)) =x+1 B. eq \(y,\s\up6(^)) =x+2
C. eq \(y,\s\up6(^)) =2x+1 D. eq \(y,\s\up6(^)) =x-1
4.(易错)“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到列联表:
由此列联表得到的正确结论是( )
A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”
B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”
C.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”
D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关”
5.(易错)在一次考试中,5名学生的数学和物理成绩如下表(已知学生的数学和物理成绩具有线性相关关系):
现已知其经验回归方程为 eq \(y,\s\up6(^)) =0.36x+ eq \(a,\s\up6(^)) ,则根据此经验回归方程估计数学得90分的同学的物理成绩为________分.(四舍五入取整数)
第三节 成对数据的统计分析
必备知识
1.(2)增加 减少 (3)直线 (4)正相关 负相关 越强 越弱
2.(2)预测值 (3)好 差
3.(2)是否独立
夯实基础
1.答案:(1)× (2)× (3)√ (4)×
2.解析:观察散点图可以看出B和C选项中的点都在直线附近,即具有线性相关关系,而B中y随着x的增大而增大,具有正的线性相关关系,不合题意.C中y随着x的增大而减小,具有负的线性相关关系.故选C.
答案:C
3.解析:易知变量y与x具有线性相关关系,且b=1,x=2.5,y=3.5,所以a=3.5-1×2.5=1,故可得出经验回归方程为y=x+1.故选A.
答案:A
4.解析:列联表如下:
所以χ2=100×45×15-10×30275×25×55×45≈3.030>2.706,所以在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”.故选C.
答案:C
5.解析:x=60+65+70+75+805=70,
y=62+64+66+68+705=66,所以66=0.36×70+a,得a=40.8,即经验回归方程为y=0.36x+40.8.当x=90时,y=0.36×90+40.8=73.2≈73(分).
答案:73
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
分类
做不到“光盘”
能做到“光盘”
男
45
10
女
30
15
α
0.1
0.05
0.01
xα
2.706
3.841
6.635
学生的编号i
1
2
3
4
5
数学成绩x
80
75
70
65
60
物理成绩y
70
66
68
64
62
分类
做不到“光盘”
能做到“光盘”
总计
男
45
10
55
女
30
15
45
总计
75
25
100
高考数学第一轮复习复习第3节 成对数据的统计分析(讲义): 这是一份高考数学第一轮复习复习第3节 成对数据的统计分析(讲义),共39页。
高考数学复习第十章 第三节 成对数据的统计分析(导学案): 这是一份高考数学复习第十章 第三节 成对数据的统计分析(导学案),共23页。
备考2024届高考数学一轮复习讲义第九章统计与成对数据的统计分析第3讲成对数据的统计分析: 这是一份备考2024届高考数学一轮复习讲义第九章统计与成对数据的统计分析第3讲成对数据的统计分析,共11页。