所属成套资源:2021届山东高考数学一轮创新教学案
2021届山东高考数学一轮创新教学案:第9章 第3讲 变量间的相关关系与统计案例
展开
第3讲 变量间的相关关系与统计案例
[考纲解读] 1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系;根据最小二乘法求出回归直线方程.(重点)
2.了解独立性检验(只要求2×2列联表)的基本思想、方法及其初步应用.
[考向预测] 从近三年高考情况来看,本讲是高考中的一个热点考查内容.预测2021年将会考查:①回归直线方程的判断、求解及相关系数的意义,并用其解决实际问题;②独立性检验思想在实际问题中的应用.试题以解答题的形式呈现,难度为中等.此外,也可能出现在客观题中,此时试题难度不大,属中、低档题型.
1.相关关系与回归方程
(1)相关关系的分类
①正相关:从散点图上看,点散布在从左下角到右上角的区域内,如图1;
②负相关:从散点图上看,点散布在从左上角到右下角的区域内,如图2.
(2)线性相关关系:从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
(3)回归方程
①最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.
②回归方程:两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程为=x+,则==,=- .其中,是回归方程的斜率,是在y轴上的截距,=xi,=yi,(,)称为样本点的中心.
说明:回归直线=x+必过样本点的中心(,),这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.
(4)样本相关系数
r=,用它来衡量两个变量间的线性相关关系.
①当r>0时,表明两个变量正相关;
②当r0.75时,认为两个变量有很强的线性相关关系.
2.残差分析
(1)残差:对于样本点(x1,y1),(x2,y2),…,(xn,yn),它们的随机误差为ei=yi-bxi-a,i=1,2,…,n,其估计值为i=yi-i=yi-xi-,i=1,2,…,n,i称为相应于点(xi,yi)的残差.
(2)残差平方和为 (yi-i)2.
(3)相关指数:R2=1-.
3.独立性检验
(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.
(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
2×2列联表
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
构造一个随机变量K2=,其中n=a+b+c+d为样本容量.
(3)独立性检验
利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.
1.概念辨析
(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.( )
(2)“名师出高徒”可以解释为教师的教学水平与学生水平成正相关关系.( )
(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( )
(4)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大.( )
(5)由独立性检验可知,有99%的把握认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀.( )
答案 (1)× (2)√ (3)√ (4)√ (5)×
2.小题热身
(1)设回归方程为=3-5x,则变量x增加一个单位时( )
A.y平均增加3个单位 B.y平均减少5个单位
C.y平均增加5个单位 D.y平均减少3个单位
答案 B
解析 因为-5是斜率的估计值,说明x每增加一个单位,y平均减少5个单位.故选B.
(2)在下列各图中,两个变量具有相关关系的图是( )
A.①② B.①③
C.②④ D.②③
答案 D
解析 ①为函数关系;②显然成正相关;③显然成负相关;④没有明显相关性.
(3)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如表.
非一线
一线
总计
愿生
45
20
65
不愿生
13
22
35
总计
58
42
100
算得K2=≈9.616.
附表:
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”
C.有99%以上的把握认为“生育意愿与城市级别有关”
D.有99%以上的把握认为“生育意愿与城市级别无关”
答案 C
解析 因为K2≈9.616>6.635,所以有99%以上的把握认为“生育意愿与城市级别有关”.
(4)已知变量x,y具有线性相关关系,它们之间的一组数据如下表所示,若y关于x的回归方程为=1.3x-1,则m=________.
x
1
2
3
4
y
0.1
1.8
m
4
答案 3.1
解析 由已知得=×(1+2+3+4)=2.5,
=(0.1+1.8+m+4)=×(5.9+m).
因为(,)在直线=1.3x-1上,
所以=1.3×2.5-1=2.25,
所以×(5.9+m)=2.25,解得m=3.1.
题型一 相关关系的判断
1.下列两变量中不存在相关关系的是( )
①人的身高与视力;②曲线上的点与该点的坐标之间的关系;③某农田的水稻产量与施肥量;④某同学考试成绩与复习时间的投入量;⑤匀速行驶的汽车的行驶距离与时间;⑥商品的销售额与广告费.
A.①②⑤ B.①③⑥
C.④⑤⑥ D.②⑥
答案 A
解析 根据相关关系的定义知,①②⑤中两个变量不存在相关关系.
2.下列命题中正确的为( )
A.线性相关系数r越大,两个变量的线性相关性越强
B.线性相关系数r越小,两个变量的线性相关性越弱
C.残差平方和越小的模型,模型拟合的效果越好
D.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好
答案 C
解析 线性相关系数r的绝对值越接近于1,两个变量的线性相关性越强,故A,B错误;残差平方和越小,相关指数R2越大,越接近于1,拟合效果越好,故C正确,D错误.
3.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )
A.r2