2025版高考数学全程一轮复习第九章统计与成对数据的统计分析第三节成对数据的统计分析课件
展开必 备 知 识1.变量的相关关系(1)相关关系两个变量有关系,但又没有确切到可由其中一个去精确地决定另一个的程度,这种关系称为相关关系.(2)正相关、负相关从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现________的趋势,我们就称这两个变量正相关; 如果当一个变量的值增加时,另一个变量的相应值呈现________的趋势,则称这两个变量负相关.
(3)线性相关关系与经验回归直线如果两个变量的取值呈现正相关或负相关,而且散点落在一条________附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做经验回归直线.
3.列联表与独立性检验(1)2×2列联表如图,给出成对分类变量数据的交叉分类频数的数据统计表称为2×2列联表.
2.(教材改编)以下四个散点图中,变量x与y之间具有负的线性相关关系的是( )
解析:观察散点图可以看出B和C选项中的点都在直线附近,即具有线性相关关系,而B中y随着x的增大而增大,具有正的线性相关关系,不合题意.C中y随着x的增大而减小,具有负的线性相关关系.故选C.
4.(易错)“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到列联表:
由此列联表得到的正确结论是( )A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关”
1.了解样本相关系数的统计意义.2.了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会用一元线性回归模型进行预测.3.理解2×2列联表的统计意义,了解2×2列联表独立性检验及其应用.
问题思考·夯实技能【问题1】 在回归分析的过程中,散点图、样本相关系数r、决定系数R2的作用相同吗?
提示:不同.散点图判定两个分类变量是否具有相关关系,样本相关系数r判定两个分类变量相关性的强弱,决定系数R2判定所选模型拟合的程度.
【问题2】 根据χ2的值可以判断两个分类变量有关的可信程度,若χ2越大,则两分类变量有关的把握越大对吗?
(2)(多选)[2024·河北沧州模拟]医学上判断体重是否超标有一种简易方法,就是用一个人身高的厘米数减去105所得差值即为该人的标准体重.比如身高175 cm的人,其标准体重为175-105=70公斤,一个人实际体重超过了标准体重,我们就说该人体重超标了,现分析某班学生的身高和体重的相关性时,随机抽测了8人的身高和体重,数据如下表所示:
题后师说判断数据的相关关系的三种方法
巩固训练1(1)下列图中,能反映出相应两个变量之间具有线性相关关系的是( )
解析:(1)对于A,由图象可知,两个变量是确定的函数关系,不是相关关系,故A不正确;对于B,由散点图可知,散点呈带状分布,所以两个变量具有线性相关关系,故B正确;由散点图可知,散点不呈带状分布,所以两个变量不具有线性相关关系,故CD不正确.故选B.
(2)对两个变量x,y进行线性相关检验,得线性相关系数r1=0.899 5,对两个变量u,v进行线性相关检验,得线性相关系数r2=-0.956 8,则下列判断正确的是( )A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强
解析:因为线性相关系数r1=0.899 5>0,所以x,y正相关,因为线性相关系数r2=-0.956 8<0,所以u,v负相关,又因为|r1|<|r2|,所以变量u,v的线性相关性比x,y的线性相关性强,故A、B、D错误,C正确.故选C.
题型二 回归模型角度一 一元线性回归模型例2 [2024·辽宁辽阳模拟]2022年12月份以来,全国多个地区纷纷采取不同的形式发放多轮消费券,助力消费复苏.记发放的消费券额度为x(百万元),带动的消费为y(百万元).某省随机抽查的一些城市的数据如下表所示.
(1)根据表中的数据,请用相关系数说明y与x有很强的线性相关关系,并求出y关于x的经验回归方程.(2)(ⅰ)若该省A城市在2023年2月份准备发放一轮额度为10百万元的消费券,利用(1)中求得的经验回归方程,预计可以带动多少消费?(ⅱ)当实际值与估计值的差的绝对值与估计值的比值不超过10%时,认为发放的该轮消费券助力消费复苏是理想的.若该省A城市2月份发放额度为10百万元的消费券后,经过一个月的统计,发现实际带动的消费为30百万元,请问发放的该轮消费券助力消费复苏是否理想?若不理想,请分析可能存在的原因.
题后师说求经验回归方程的步骤
巩固训练2[2024·吉林长春模拟]偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把某同学的某科考试成绩与该科平均成绩的差叫某科偏差(实际成绩-平均成绩=偏差).在某次考试成绩统计中,教研人员为了对学生数学偏差x(单位:分)与物理偏差y(单位:分)之间的关系进行分析,随机挑选了8位同学,得到他们的两科成绩偏差数据如下:(1)若x与y之间具有线性相关关系,求y关于x的经验回归方程;(2)若本次考试数学平均成绩为100分,物理平均成绩为70.5分,试由(1)的结论预测数学成绩为116分的同学的物理成绩.
巩固训练3[2024·山东滨州模拟]为了加快实现我国高水平科技自立自强,某科技公司逐年加大高科技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图,其中年份代码1~10分别对应年份2013~2022.
题型三 独立性检验例4 [2023·全国甲卷]一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.132.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2试验组的小白鼠体重的增加量从小到大排序为7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.219.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5
题后师说独立性检验的一般步骤
巩固训练4[2024·河北秦皇岛模拟]某市电视台为了解一档节目收视情况,随机抽取了该市n对夫妻进行调查,根据调查得到每人日均收看该节目的时间绘制成如图所示的频率分布直方图,收视时间不低于40分钟的观众称为“热心观众”,收视时间低于40分钟的观众称为“非热心观众”,已知抽取样本中收视时间低于10分钟的有10人.
1.[2023·天津卷]调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数r=0.8245,下列说法正确的是( )A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈现负相关C.花瓣长度和花萼长度呈现正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.824 5
解析:根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A选项错误;散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关,B选项错误,C选项正确;由于r=0.824 5是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱,即取出的数据的相关系数不一定是0.824 5,D选项错误.故选C.
3.[2024·福建莆田模拟]根据分类变量X和Y的样本观察数据的计算结果,有不少于99.5%的把握认为X和Y有关,则χ2的一个可能取值为( )A. 3.971 B.5.872C.6.775 D.9.698
解析:因为有不少于99.5%的把握认为X和Y有关,所以χ2≥7.879,9.698≥7.879,满足题意,故选D.
2025年高考数学一轮复习-成对数据的统计分析【课件】: 这是一份2025年高考数学一轮复习-成对数据的统计分析【课件】,共47页。PPT课件主要包含了基础知识·诊断,变量的相关关系,样本相关系数,一元线性回归模型,题组1走出误区,题组2走进教材,题组3走向高考,考点聚焦·突破等内容,欢迎下载使用。
2025届高考数学一轮总复习第十章统计与成对数据的统计分析第二节成对数据的统计分析课件: 这是一份2025届高考数学一轮总复习第十章统计与成对数据的统计分析第二节成对数据的统计分析课件,共60页。PPT课件主要包含了内容索引,强基础增分策略,增素能精准突破,样本相关系数,2经验回归方程,2独立性检验,答案C,典例突破等内容,欢迎下载使用。
2025版高考数学一轮总复习第9章统计成对数据的统计分析第2讲成对数据的统计分析课件: 这是一份2025版高考数学一轮总复习第9章统计成对数据的统计分析第2讲成对数据的统计分析课件,共60页。PPT课件主要包含了去精确地决定,正相关或负相关,一条直线,相关或曲线相关,非线性,正相关,负相关,bx+a+e,因变量或响应变量,自变量或解释变量等内容,欢迎下载使用。