高中数学人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系课前预习课件ppt
展开自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.
2、相关关系与函数关系的异同点
不同点:函数关系是一种确定的关系,因果关系;而相关关系是一种非确定性关系,也可能是伴随关系。
相同点:均是指两个变量的关系
相关关系—当自变量取值一定,因变量的取值带有一定的随机性( 非确定性关系) 函数关系---函数关系指的是自变量和因变量之间的关系是相互唯一确定的.
1、散点图:将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,以表示具有相关关系的两个变量的一组数据的图形叫做散点图.
2、分类:(1)正相关、负相关
正相关:如果散点图的点散布在从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也近似的由小变大,对于两个变量的这种相关关系,我们称为正相关
负相关:如果散点图的点散布的位置是从在左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值也近似的由大变小,对于两个变量的这种相关关系,我们称为负相关.
(2)线性相关和非线性相关
两个变量之间相关关系的确定
(2).通过样本数据分析,从数据中提取信息,并构建适当的模型,再利用模型进行估计或推断
通过观察散点图中成对样本数据的分布规律,我们可以大致推断两个变量是否存在相关关系、是正相关还是负相关、是线性相关还是非线性相关等,散点图虽然直观,但无法确切地反映成对样本数据的相关程度,也就无法量化两个变量之间相关程度的大小.能否像引入平均值、方差等数字特征对单个变量数据进行分析那样,引入一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析呢?
对于变量?和变量?,设经过随机抽样得到的成对数据为(?1,?1),(?2,?2),⋯,(??,??),
这时的散点大多数分布在第一象限、第三象限,大多数散点的横、纵坐标同号,显然,这样的规律是由人体脂肪含量与年龄正相关所决定的
如果变量x和变量y负相关,那么关于均值平移后的大多数点将分布在第二、四象限,对应的成对数据异号居多.
如果变量x和变量y正相关,那么均值平移后的大多数点将分布在第一、三象限, 对应的成对数据同号居多;
思考:根据上述分析,你能利用正相关变量和负相关变量的成对样本数据平移后星现的规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗?
根据散点图特征,初步构造统计量.
一般情形下,Lxy>0表明成对样本数据正相关; Lxy <0表明成对样本数据负相关.
思考: Lxy的大小一定能度量出成对样本数据的相关程度吗?
在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高单位由米改为厘米,单位的改变不会改变体重与身高之间的相关程度.
我们发现, Lxy的大小与数据的度量单位有关,所以不能直接用它度量成对样本数据相关程度的大小.
为了消除单位的影响,进一步做“标准化”处理
为简单起见,把上述“标准化”处理后的成对数据分别记为
仿照Lxy的构造,可以得到
为什么是除以标准差而不是方差?
因为标准差单位与原式单位一致,而方差单位是原单位平方。
当r>0时,称成对样本数据正相关;当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大。 当r<0时,称成对样本数据负相关;当其中一个数据的值变小时,另一个数据的值通常会变大:当其中一个数据的值变大时,另一个数据的值通常会变小。
我们称r为变量x和变量y的样本相关系数.
样本相关系数r是一个描述成对样本数据的数字特征,它的正负和绝对值的大小可以反映成对样本数据的变化特征:
样本相关系数r的大小与成对样本数据的相关程度有什么内在联系呢?
样本相关系数r的取值范围
样本相关系数r的取值范围为[-1,1]
当|r|=1时,成对样本数据之间具有怎样的关系?
成对样本数据的两个分量之间满足一种线性关系
由此可见,样本相关系数r的取值范围为[-1,1],样本相关系数r的绝对值大小可以反映成对样本数据之间线性相关的程度:
当|r|越接近1时,成对样本数据的线性相关程度越强; 当|r|越接近0时,成对样本数据的线性相关程度越弱.
样本相关系数r有时也称样本线性相关系数,|r|刻画了样本点集中于某条直线的程度.当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
两个随机变量的相关性可以通过散点图对成对样本数据进行分析,而样本相关系数r可以反映两个随机变量之间的线性相关程度: r 的符号反映相关关系的正负性,|r|的大小反映两个变量线性相关的程度,即散点集中于一条直线的程度.
例1根据下表中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度
解:先画出散点图,如右图所示观察散点图,可以看出样本点都集中在一条直线附近,由此推断脂肪含量和年龄线性相关.
由样本相关系数?≈0.97,可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强。脂肪含量与年龄变化趋势相同.
散点图可以从直观上判断成对样本数据的相关性,通过样本相关系数则可以从定量的角度刻画成对样本数据相关的正负性和线性相关程度.
画出散点图,判断成对样本数据是否线性相关,并通过样本相关系数推断居民年收入与A商品销售额的相关程度和变化趋势的异同.
从散点图看,A商品销售额与居民年收入的样本数据呈现线性相关关系.
例2 有人收集了某城市居民年收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如表所示.
例3.在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如下表所示.
体重与身高、臂展与身高分别具有怎样的相关性?
通过计算得到体重与身高、臂展与身高的样本相关系数分别约为0.34和0.78,都为正相关.其中,臂展与身高的相关程度更高.
1.对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是( )
A.r2
依据数据的散点图可以看出,y与x之间有较强的线性相关关系.请计算样本相关系数r并加以说明(若|r|>0.75,则线性相关程度很高):
∵r>0.75,∴可用线性回归模型拟合y与x的关系.
高中数学人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系优秀ppt课件: 这是一份高中数学人教A版 (2019)选择性必修 第三册<a href="/sx/tb_c4000363_t3/?tag_id=26" target="_blank">8.1 成对数据的相关关系优秀ppt课件</a>,文件包含812《样本相关系数》课件-人教版高中数学选修三pptx、812《样本相关系数》分层作业原卷版-人教版高中数学选修三docx、812《样本相关系数》分层作业解析版-人教版高中数学选修三docx等3份课件配套教学资源,其中PPT共31页, 欢迎下载使用。
数学人教A版 (2019)8.1 成对数据的相关关系优质ppt课件: 这是一份数学人教A版 (2019)8.1 成对数据的相关关系优质ppt课件,共32页。PPT课件主要包含了问题导入,新知探索,课堂总结等内容,欢迎下载使用。
人教A版 (2019)8.1 成对数据的相关关系教学课件ppt: 这是一份人教A版 (2019)8.1 成对数据的相关关系教学课件ppt,共29页。PPT课件主要包含了样本相关系数的应用,样本相关系数等内容,欢迎下载使用。