







2025届高考数学一轮总复习第十章统计与成对数据的统计分析第二节成对数据的统计分析课件
展开知识梳理1.变量的相关关系(1)两个变量有关系,但又没有确切到可由其中一个去精确地决定另一个的程度,这种关系称为相关关系.
是一种非确定的关系,不是函数关系
(2)正相关、负相关从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现_______的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现 的趋势,则称这两个变量负相关.
(3)线性相关、非线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条 附近,我们就称这两个变量线性相关. 一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
微点拨由散点图判断两个变量正相关、负相关的方法:当散点图中的点散布在平面直角坐标系中从左下角到右上角的区域时,两个变量正相关;当散点图中的点散布在平面直角坐标系中从左上角到右下角的区域时,两个变量负相关.
微点拨当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.
微思考成对样本数据的线性相关程度的强弱与样本相关系数r有怎样的关系?
提示 样本相关系数r的取值范围为[-1,1],当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.
3.一元线性回归模型
(1)数学表述式:如果两个变量之间的关系可以表示为
我们称该式为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.
(3)利用R2刻画回归效果
微点拨经验回归方程不一定都有实际意义.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的经验回归方程才有实际意义.
4.列联表与独立性检验(1)2×2列联表如图,给出成对分类变量数据的交叉分类频数的数据统计表称为2×2列联表.
利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.常用的小概率值和临界值表
作为判断χ2大小的标准
对点演练1.判断下列结论是否正确,正确的画“√”,错误的画“×”.(1)利用散点图可以直观判断两个变量是否具有线性相关关系.( )(2)事件X,Y关系越密切,则由观测数据计算得到的χ2越大.( )
(4)两个变量的样本相关系数的绝对值越接近于1,它们的线性相关程度越强.( )
2.(多选)下列说法不正确的有( )A.经验回归方程适用于一切样本和总体B.经验回归方程一般都有局限性C.样本取值的范围会影响经验回归方程的适用范围D.经验回归方程得到的预测值是响应变量的精确值
答案 AD 解析 样本或总体具有线性相关关系时,才可求经验回归方程,而且由经验回归方程得到的函数值是近似值,而非精确值,因此经验回归方程有一定的局限性,所以A,D错误.故选AD.
3.为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”,得到如下的列联表:
参照附表,得到的正确结论是( )A.依据小概率值α=0.01的独立性检验,认为该市居民能否做到“光盘”与性别有关联B.依据小概率值α=0.01的独立性检验,认为该市居民能否做到“光盘”与性别无关联C.依据小概率值α=0.10的独立性检验,认为该市居民能否做到“光盘”与性别有关联D.依据小概率值α=0.10的独立性检验,认为该市居民能否做到“光盘”与性别无关联
解析 零假设为H0:该市居民能否做到“光盘”与性别无关联.由表计算得χ2= ≈3.03>2.706=x0.10,依据α=0.10的独立性检验,我们推断H0不成立,即认为该市居民能否做到“光盘”与性别有关联,并且该推断犯错误的概率不超过0.10.故选C.
典例突破例1.(1)(多选)有一散点图如图所示,在5组(x,y)数据中去掉D(3,10)后,下列说法正确的是( )A.经验回归方程不变B.样本相关系数r变大C.各组数据对应的点到经验回归直线的距离的平方和变小D.变量x与变量y的相关程度变强
(2)上图是具有相关关系的两个变量的一组数据的散点图和经验回归直线,若去掉一个点使得余下的5个点所对应的数据的样本相关系数最大,则应当去掉的点是( )
答案 (1)BCD (2)B 解析 (1)根据D点在散点图中的位置可知,D比较偏离经验回归直线,故去掉D(3,10)后,数据比原来集中,相关程度变强,经验回归方程有所改变,A错误,B,C,D都正确.故选BCD.
(2)因为样本相关系数的绝对值越大,|r|越接近于1,则说明两个变量的线性相关程度越强.因为点E到直线的距离最远,所以去掉点E,余下的5个点所对应的数据的样本相关系数最大,故选B.
方法总结判断成对数据的相关关系的三种方法
A.0
例2.(2023山东潍坊一模)某学校研究性学习小组在学习生物遗传学的过程中,为验证高尔顿提出的关于儿子成年后身高y(单位:cm)与父亲身高x(单位:cm)之间的关系及存在的遗传规律,随机抽取了5对父子的身高数据,如下表:
(1)根据表中数据,求出y关于x的线性回归方程,并利用回归直线方程分别确定儿子比父亲高和儿子比父亲矮的条件,由此可得到怎样的遗传规律?
的残差.求(1)中儿子身高的残差的和,并探究这个结果是否对任意具有线性相关关系的两个变量都成立?若成立,加以证明;若不成立,说明理由.
令0.5x+89-x>0,得x<178,即x<178时,儿子比父亲高;令0.5x-89-x<0,得x>178,即x>178时,儿子比父亲矮.可得当父亲身高较高时,儿子平均身高要矮于父亲,即儿子身高有一个回归,回归到全种群平均高度的趋势.
方法总结求经验回归方程的步骤
对点训练2某滑雪场开业,下表统计了该滑雪场开业第x天的滑雪人数y(单位:百人)的数据.
(1)根据第1至7天的数据分析,可用线性回归模型拟合y与x的关系,请用样本相关系数加以说明(保留两位有效数字);(2)经过测算,若一天中滑雪人数超过3 000人时,当天滑雪场可实现盈利,请建立y关于x的经验回归方程,并预测该滑雪场开业的第几天开始盈利.
因为样本相关系数|r|接近于1,所以可以推断x和y这两个变量线性相关,且相关程度很强.
因为一天中滑雪人数超过3 000人时,当天滑雪场可实现盈利,即2x+9>30时,可实现盈利,解得x>10.5,所以根据经验回归方程预测,该滑雪场开业的第11天开始盈利.
考向2.非线性经验回归方程及应用典例突破例3.已知蕲艾的株高y(单位:cm)与一定范围内的温度x(单位:℃)有关,现收集了蕲艾的13组观测数据,得到如下的散点图:
且(si,yi)与(ti,yi)(i=1,2,3,…,13)的样本相关系数分别为r1,r2,且r2≈-0.995 3.(1)用样本相关系数说明用哪种模型建立y关于x的经验回归方程更合适;(2)根据(1)的结果及表中数据,建立y关于x的经验回归方程;
名师点析解决非线性经验回归分析问题的一般思路是换元,化非线性为线性,再用经验回归方程的方法求解.
对点训练3近期,某公交公司分别推出A和B两种扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引了越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次(计10人次为1个单位,例如y=6表示60人次),统计数据如表所示:
根据以上数据,绘制了如图所示的散点图.
(1)根据散点图判断,在推广期内,y=a+bx与y=c·dx(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数x的经验回归方程类型;(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中的数据,建立y关于x的经验回归方程,并预测活动推出第8天使用扫码支付的人次.参考数据:
解 (1)根据散点图判断,y=c·dx适宜作为扫码支付的人次y关于活动推出天数x的经验回归方程类型.
例4.甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)试根据小概率值α=0.10的独立性检验,分析甲、乙两城之间的长途客车是否准点与客车所属公司有没有关系.
(2)根据已知数据得到列联表如下:
零假设为H0:甲、乙两城之间的长途客车是否准点与客车所属公司有关.
≈3.205>2.706=x0.10.根据小概率值α=0.10的独立性检验,推断H0不成立,即认为甲、乙两城之间的长途客车是否准点与客车所属公司有关,此推断犯错误的概率不大于0.10.
方法总结独立性检验的一般步骤
对点训练4某校组织了全体学生参加传统文化知识竞赛,从高一、高二年级各随机抽取50名学生的竞赛成绩(满分100分),统计如下表:
(1)分别估计高一、高二年级竞赛成绩的平均值(同一组中的数据以该组数据所在区间的中点值作代表);(2)学校规定竞赛成绩不低于80分的为优秀,根据所给数据,完成下面的2×2列联表,并依据小概率值α=0.1的独立性检验,分析竞赛成绩优秀与年级是否有关联.
解(1)高一年级随机抽出的50名学生竞赛成绩的平均值为 =(55×3+65×10+75×12+85×15+95×10)÷50=78.8,高二年级随机抽出的50名学生竞赛成绩的平均值为 =(55×4+65×6+75×10+85×18+95×12)÷50=80.6,故估计高一、高二年级竞赛成绩的平均值分别为78.8与80.6.
2025版高考数学一轮总复习第9章统计成对数据的统计分析第2讲成对数据的统计分析课件: 这是一份2025版高考数学一轮总复习第9章统计成对数据的统计分析第2讲成对数据的统计分析课件,共60页。PPT课件主要包含了去精确地决定,正相关或负相关,一条直线,相关或曲线相关,非线性,正相关,负相关,bx+a+e,因变量或响应变量,自变量或解释变量等内容,欢迎下载使用。
适用于新高考新教材备战2025届高考数学一轮总复习第10章统计与成对数据的统计分析第3节成对数据的统计分析课件新人教A版: 这是一份适用于新高考新教材备战2025届高考数学一轮总复习第10章统计与成对数据的统计分析第3节成对数据的统计分析课件新人教A版,共52页。PPT课件主要包含了强基础固本增分,研考点精准突破,目录索引,样本相关系数,正相关,负相关,2经验回归方程,2独立性检验,参考数据等内容,欢迎下载使用。
高考数学一轮总复习课件第8章统计与统计分析第3讲成对数据的统计分析(含解析): 这是一份高考数学一轮总复习课件第8章统计与统计分析第3讲成对数据的统计分析(含解析),共60页。PPT课件主要包含了回归分析,独立性检验,12×2列联表,2独立性检验,名师点睛,题组一,走出误区,答案1√,2√3×,题组二等内容,欢迎下载使用。