高中数学湘教版(2019)选择性必修 第二册4.1 成对数据的统计相关性学案
展开教 材 要 点
要点一 相关关系
1.散点图:由坐标系及散点形成的数据图.
2.相关关系:如果两个变量之间的关系近似地表现为一条________,则称它们有线性相关关系,简称为相关关系.
3.函数关系:如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称它们线性相关,这实际上就是函数关系.
4.相关系数:一般地,对于n个成对观测数据(x1,y1),(x2,y2),…,(xn,yn),当数据{xi},{yi}(i=1,2,…,n)的标准差都不为0❶时,我们称r= eq \f(\i\su(i=1,n, )(xi-x)(yi-y),\r(\i\su(i=1,n,)(xi-x)2\i\su(i=1,n,)(yi-y)2))= eq \f(\i\su(i=1,n,x)iyi-n\a\vs4\al(x) y,\r((\i\su(i=1,n,x) eq \\al(\s\up1(2),\s\d1(i)) -nx2)(\i\su(i=1,n,y) eq \\al(\s\up1(2),\s\d1(i)) -ny2)))为{xi},{yi}的相关系数.
批注❶ 当标准差为0时,数据{xi},{yi}(i=1,2,…,n)全部相同,表明数据离散程度为0.
5.相关系数的性质:
(1)rxy值范围是[-1,1].当0
(3)|rxy|越接近于0时,变量x,y的线性相关程度________.
(4)rxy具有对称性,即rxy=ryx.
(5)rxy仅仅是变量x与y之间线性相关程度的一个度量.rxy=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有关系,它们之间可能存在非线性关系.
批注❷ 统计经验告诉我们,当rxy>0.8时,y有随着x的增加而增加的趋势,这时我们认为{xi}和{yi}是高度正相关的;当rxy<0.8时,y有随着x的增加而减少的趋势,这时我们认为{xi}和{yi}是高度负相关的.
要点二 相关系数与向量夹角
把两组成对数据分别看作n维空间的两个向量(x1,x2,…,xn),(y1,y2,…,yn),向量夹角的大小可以用余弦来刻画,我们就用余弦来刻画两个向量的相关关系.
设a=(x1-x,x2-x,…,xn-x),b=(y1-y,y2-y,…,yn-y),从
而有cs 〈a,b〉= eq \f(a·b,|a||b|)= eq \f(\(∑,\s\up6(n),\s\d4(i=1)) (xi-x)(yi-y),\r(\(∑,\s\up6(n),\s\d4(i=1)) (xi-x)2·\(∑,\s\up6(n),\s\d4(i=1)) (yi-y)2)) .❸
当夹角在[0,)内时,余弦值越大表示两个向量的夹角越小,两组数据的正相关程度越高;余弦值越小表示两个向量的夹角越大,两组数据的正相关程度越低.
当夹角在(,π]内时,余弦值越大表示两个向量的夹角越小,两组数据的负相关程度越低;余弦值越小表示两个向量的夹角越大,两组数据的负相关程度越高.
当夹角为时,余弦值为0,说明两组数据不相关.
批注❸ 用两组成对数据表示的向量在原点处夹角的余弦值与相关系数公式本质上是一致的.
基 础 自 测
1.判断正误(正确的画“√”,错误的画“×”)
(1)若两个变量正相关,则样本相关系数大于0小于1.( )
(2)相关系数越大,两个变量的相关性就越强.( )
(3)若相关系数r=0,则两变量x,y之间没有关系.( )
2.下列两个量之间的关系是相关关系的是( )
A.匀速直线运动中时间与位移的关系
B.学生的成绩和身高
C.儿童的年龄与体重
D.物体的体积和质量
3.若变量y与x之间的样本相关系数r=-0.983 2,则变量y与x之间( )
A.具有很弱的线性相关关系
B.具有较强的线性相关关系
C.它们的线性相关关系还需要进一步确定
D.不确定
4.如图所示的两个变量具有相关关系的是________(填序号).
题型探究·课堂解透——强化创新性
题型 1 线性相关关系
例1 某零售店近5个月的销售额和利润额资料如下表所示:
(1)根据上表数据作出散点图;
(2)观察散点判断利润额y关于销售额x是否具有线性相关关系.如果具有线性相关关系,那么是正相关还是负相关?
方法归纳
两个变量是否线性相关的判断方法
巩固训练1 某个男孩的年龄与身高的统计数据如下表所示.
(1)画出散点图;
(2)判断y与x是否具有线性相关关系.
题型 2 相关系数
例2 互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分,某市一调查机构针对该市市场占有率较高的甲、乙两家网络外卖企业(以下称外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表:
据统计表明,y与x之间具有线性相关关系,请用样本相关系数r对y与x之间的相关性强弱进行判断.(若|r|>0.8,则可认为y与x有较强的线性相关关系)
方法归纳
相关系数可以反映两个变量之间的线性相关程度,即散点集中于一条直线的程度,其符号反映了相关关系的正负性.用相关系数能够较准确的判断相关的程度.
巩固训练2 科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的简单随机样本数据,如下表:
根据上表中的样本数据,计算样本相关系数(精确到0.01),并推断它们的相关关系及相关程度.
参考数据及公式: eq \i\su(i=1,10,)xiyi=13 527.8, eq \i\su(i=1,10,)x eq \\al(\s\up1(2),\s\d1(i)) =23 638, eq \i\su(i=1,10,)y eq \\al(\s\up1(2),\s\d1(i)) =7 759.6, eq \r(43) ≈6.56, eq \r(2 935) ≈54.18,相关系数r= eq \f(\i\su(i=1,n,x)iyi-n\a\vs4\al(x) y,\r(\i\su(i=1,n,x) eq \\al(\s\up1(2),\s\d1(i)) -nx2)·\r(\i\su(i=1,n,y) eq \\al(\s\up1(2),\s\d1(i)) -ny2)).
题型 3 多组成对数据的相关性
例3 某电器销售公司的管理人员认为,月销售收入是广告费用的函数.下面是该公司近8个月的月销售收入与广告费用数据,试分析其月销售收入与电视广告费用、月销售收入与报纸广告费用之间的相关关系.
题型 4 相关系数与向量夹角
例4 用向量夹角分析例3中月销售收入与电视广告费用、月销售收入与报纸广告费用之间的相关关系.
4.1 成对数据的统计相关性
新知初探·课前预习
[教材要点]
要点一
2.直线
5. (1)正相关 负相关 (3)越低
[基础自测]
1.(1)√ (2)× (3)×
2.解析:A、D是函数关系;B是不相关关系;C是相关关系,故选C.
答案:C
3.解析:变量y与x之间的样本相关系数r=-0.983 2,|r|=0.983 2,接近1,样本相关系数的绝对值越大,相关性越强,
∴变量y与x之间有较强的线性相关关系,故选B.
答案:B
4.解析:①是确定的函数关系;②中的点大都分布在一条曲线周围;③中的点大都分布在一条直线周围;④中点的分布没有任何规律可言,x,y不具有相关关系.
答案:②③
题型探究·课堂解透
例1 解析:(1)散点图如图所示:
(2)由散点图可知,所有散点接近一条直线排列,
所以利润额与销售额是线性相关关系,
由图可知当销售额增加时,利润额呈现增加的趋势,所以是正相关.
巩固训练1 解析:(1)散点图如图所示.
(2)由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.
例2 解析:由题意知,x= eq \f(5+2+9+8+11,5)=7,
y= eq \f(2+3+10+5+15,5)=7,
样本相关系数r= eq \f(\i\su(i=1,5, )(xi-x)(yi-y),\r(\i\su(i=1,5, )(xi-x)2\i\su(i=1,5, )(yi-y)2))= eq \f(66,77) ≈0.857>0.8.
故可认为y与x有较强的线性相关关系.
巩固训练2 解析:x= eq \f(1,10) (26+56+39+49+61+53+27+58+41+60)=47,
y= eq \f(1,10) (14.5+31.4+21.2+26.3+34.6+29.6+17.8+33.5+25.9+35.2)=27,
r= eq \f(\i\su(i=1,10,x)iyi-10\a\vs4\al(x) y,\r(\i\su(i=1,10,x) eq \\al(\s\up1(2),\s\d1(i)) -10x2)·\r(\i\su(i=1,10,y) eq \\al(\s\up1(2),\s\d1(i)) -10y2))
= eq \f(13 527.8-10×47×27,\r(23 638-10×472)×\r(7 759.6-10×272))
= eq \f(8 378,6\r(43)×4\r(2 935)) ,
因为 eq \r(43) ≈6.56, eq \r(2 935) ≈54.18,
所以r= eq \f(8 378,6×6.56×4×54.18) ≈0.98,
由样本相关系数r≈0.98,可以推断人体脂肪含量和年龄的相关程度很强.
例3 解析:由题意可得x≈93.75,y≈3.187 5,z≈2.475,s eq \\al(\s\up1(2),\s\d1(x)) = eq \f(1,8) eq \(∑,\s\up6(8),\s\d4(i=1))(xi-x)2= eq \f(1,8) [(96-93.75)2+(90-93.75)2+…+(94-93.75)2]≈3.188,
s eq \\al(\s\up1(2),\s\d1(y)) = eq \f(1,8) eq \(∑,\s\up6(8),\s\d4(i=1))(yi-y)2= eq \f(1,8) [(5-3.187 5)2+(2-3.187 5)2+…+(3-3.187 5)2]≈0.809,
s eq \\al(\s\up1(2),\s\d1(z)) = eq \f(1,8) eq \(∑,\s\up6(8),\s\d4(i=1))(zi-z)2= eq \f(1,8) [(1.5-2.475)2+(2-2.475)2+…+(2.5-2.475)2]≈0.727,
sxy= eq \f(x1y1+x2y2+…+x8y8,8) - eq \a\vs4\al(x) y= eq \f(1,8) (96×5+90×2+…+94×3)-93.75×3.187 5≈1.297,
sxz= eq \f(x1z1+x2z2+…+x8z8,8) - eq \a\vs4\al(x) z= eq \f(1,8) (96×1.5+90×2+…+94×2.5)-93.75×2.475≈-0.031,
所以rxy= eq \f(sxy,sxsy) = eq \f(1.297,\r(3.188)×\r(0.809)) ≈0.808,
rxz= eq \f(sxz,sxsz) = eq \f(-0.031,\r(3.188)×\r(0.727)) ≈-0.020.
上述结果表明月销售收入与电视广告费用之间正相关程度高,月销售收入与报纸广告费用之间呈负相关关系.
例4 解析:由于x≈93.75,y≈3.187 5,z≈2.475,将例3表中的三组数据分别减去x,y,z.
记x=(x1-x,x2-x,…,x8-x),y=(y1-y,y2-y,…,y8-y),z=(z1-z,z2-z,…,z8-z).
则可得
x=(2.25,-3.75,1.25,-1.75,1.25,0.25,0.25,0.25),
y=(1.812 5,-1.187 5,0.812 5,-0.687 5,-0.187 5,0.312 5,-0.687 5,-0.187 5),
z=(-0.975,-0.475,-0.975,0.025,0.825,-0.175,1.725,0.025),
于是有cs 〈x,y〉
= eq \f(2.25×1.812 5+(-3.75)×(-1.187 5)+…+0.25×(-0.187 5),\r([2.252+(-3.75)2+…+0.252][1.812 52+(-1.187 5)2+…+(-0.187 5)2]))
≈0.808,
cs 〈x,z〉
= eq \f(2.25×(-0.975)+(-3.75)×(-0.475)+…+0.25×0.025,\r([2.252+(-3.75)2+…+0.252][(-0.975)2+(-0.475)2+…+0.0252]))
≈-0.021.
由此可以看出,月销售收入与电视广告费用的余弦值较大,说明这两组数据正相关程度高;月销售收入与报纸广告费用的余弦值为负数,说明这两组数据呈负相关关系,且负相关程度较低.商店名称
A
B
C
D
E
销售额x/千万元
3
5
6
7
9
利润额y/百万元
2
3
3
4
5
年龄x(岁)
1
2
3
4
5
6
身高y(cm)
78
87
98
108
115
120
日期
1日
2日
3日
4日
5日
外卖甲日接单:x(百单)
5
2
9
8
11
外卖乙日接单:y(百单)
2
3
10
5
15
x(年龄/岁)
26
56
39
49
61
53
27
58
41
60
y(脂肪含量/%)
14.5
31.4
21.2
26.3
34.6
29.6
17.8
33.5
25.9
35.2
月销售收入x/万元
电视广告费用y/万元
报纸广告费用z/万元
96
5
1.5
90
2
2
95
4
1.5
92
2.5
2.5
95
3
3.3
94
3.5
2.3
94
2.5
4.2
94
3
2.5
备考2024届高考数学一轮复习讲义第九章统计与成对数据的统计分析第3讲成对数据的统计分析: 这是一份备考2024届高考数学一轮复习讲义第九章统计与成对数据的统计分析第3讲成对数据的统计分析,共11页。
高中数学北师大版 (2019)选择性必修 第一册2.2 成对数据的线性相关性学案: 这是一份高中数学北师大版 (2019)选择性必修 第一册2.2 成对数据的线性相关性学案,共7页。
高中数学人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系优秀导学案: 这是一份高中数学人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系优秀导学案,共7页。学案主要包含了学习目标,自主学习,小试牛刀,经典例题,跟踪训练,当堂达标,参考答案等内容,欢迎下载使用。