2021版高考理科数学人教通用版大一轮复习基础自查学案:9.4 变量间的相关关系与统计案例
展开温馨提示:
此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。关闭Word文档返回原板块。
第四节 变量间的相关关系与统计案例
知识体系
必备知识
1.回归分析
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是散点图;统计量有相关系数与相关指数.
(1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.
(2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.
(3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系.
2.线性回归方程
(1)最小二乘法:使得样本数据点到回归直线的距离的平方和最小的方法叫做最小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,
(xn,yn),其回归方程为=x+,则==,=-.
3.独立性检验
(1)利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.
(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)为
| y1 | y2 | 总计 |
x1 | a | b | a+b |
x2 | c | d | c+d |
总计 | a+c | b+d | a+b+c+d |
则随机变量K2=(其中n=a+b+c+d为样本容量).
1.易错点:
(1)易忽视样本数据与回归直线的关系
回归分析中误以为样本数据必在回归直线上,实际上回归直线必过(,),可能所有的数据点都不在回归直线上.
(2)易忽视回归分析的结果为预测值
利用回归方程分析问题时,所得的数据误认为是准确值,而实质上是预测值.
2.注意点:
易混淆相关关系与函数关系
函数关系是一种确定的关系,相关关系是一种非确定的关系;函数关系是一种因果关系,相关关系不一定是因果关系,可能是伴随关系.
基础小题
1.给出下列说法:
①“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系;
②某同学研究卖出的热饮杯数y与气温x(℃)之间的关系,得回归方程=-2.352x
+147.767,则气温为2 ℃时,一定可卖出143杯热饮;
③只有两个变量有相关关系,所得到的回归模型才有预测价值;
④若事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越小.
其中正确的说法有 ( )
A.①③ B.①④ C.②③ D.②④
【解析】选A.利用回归方程得到的数据只是预测值,不是准确值,所以②错误;事件X,Y关系越密切,由观测数据计算得到的K2的观测值越大,所以④错误.
2.某研究机构对高三学生的记忆力x和判断力y进行统计分析,所得数据如下表:
x | 6 | 8 | 10 | 12 |
y | 2 | 3 | 5 | 6 |
则y对x的线性回归方程为 ( )
A.=2.3x-0.7 B.=2.3x+0.7
C.=0.7x-2.3 D.=0.7x+2.3
相关公式:=,=-
【解析】选C.因为xiyi=6×2+8×3+10×5+12×6=158,
==9,
==4.
所以==0.7,
=4-0.7×9=-2.3.
故线性回归方程为=0.7x-2.3.
3.有五组变量:
①汽车的质量和汽车每消耗1升汽油所行驶的平均路程;
②平均日学习时间和平均学习成绩;
③某人每日吸烟量和身体健康情况;
④圆的半径与面积;
⑤汽车的质量和每千米耗油量.
其中两个变量成正相关的是 ( )
A.①③ B.②④ C.②⑤ D.④⑤
【解析】选C.由变量的相关关系的概念知,②⑤是正相关,①③是负相关,④为函数关系.
4.为了判断高中三年级学生选修文理科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:
| 理科 | 文科 |
男 | 13 | 10 |
女 | 7 | 20 |
已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.
根据表中数据,得到K2的观测值
k=≈4.844.则认为选修文科与性别有关系出错的可能性为__________.
【解析】K2的观测值k≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“选修文理科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.
答案:5%
关闭Word文档返回原板块