适用于新高考新教材备战2025届高考数学一轮总复习第10章统计与成对数据的统计分析第3节成对数据的统计分析课件新人教A版
展开1.了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系.会通过相关系数比较成对数据的相关性.2.了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法.3.针对实际问题,会用一元线性回归模型进行预测.4.理解2×2列联表的统计意义,了解2×2列联表独立性检验及其应用.
1.变量的相关关系(1)两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.(2)正相关、负相关从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现_______ 的趋势,我们就称这两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现 的趋势,则称这两个变量负相关.
是一种非确定的关系,不是函数关系
(3)线性相关、非线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条 附近,我们就称这两个变量线性相关. 一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
微点拨由散点图判断两个变量正相关、负相关的方法:当散点图中的点散布在平面直角坐标系中从左下角到右上角的区域时,两个变量正相关;当散点图中的点散布在平面直角坐标系中从左上角到右下角的区域时,两个变量负相关.
来衡量两个变量间的线性相关关系.(1)当r>0时,称成对样本数据 ; 当r<0时,称成对样本数据 . (2)r的绝对值越接近1,成对样本数据的线性相关程度 ;r的绝对值越接近0,成对样本数据的线性相关程度越弱.
3.一元线性回归模型(1)数学表述式:如果两个变量之间的关系可以表示为我们称该式为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.
微点拨经验回归方程不一定都有实际意义.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的经验回归方程才有实际意义.
4.列联表与独立性检验(1)2×2列联表如下表,给出成对分类变量数据的交叉分类频数的数据统计表称为2×2列联表.
利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
常用的小概率值和相应的临界值表
作为判断χ2大小的标准
题组一思考辨析(判断下列结论是否正确,正确的画“√”,错误的画“×”)1.相关关系是一种非确定性关系.( )
3.相关系数的绝对值越接近1,样本数据的线性相关程度越强.( )4.若分类变量X,Y关系越密切,则由观测数据计算得到的χ2的观测值越小.( )
题组二回源教材5.(人教B版选择性必修第二册4.3.1节例1改编)咽拭子检测是一种医学检测方法,用医用棉签从人体的咽部蘸取少量分泌物进行检测,可以了解患者病情、口腔黏膜和咽部感染情况.某地区医院的医务人员统计了该院近五天的棉签使用情况,具体数据如下表所示:
6.(人教A版选择性必修第三册8.3.2节例3)某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析乙种疗法的效果是否比甲种疗法好.
解 零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.将所给数据进行整理,得到两种疗法治疗数据的列联表,如下.单位:人
根据列联表中的数据,经计算得到χ2= 4.881 <7.879=x0.005.根据小概率值α=0.005的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为两种疗法效果没有差异.
题组三连线高考7.(2021·全国甲,理17)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
(2)零假设为H0:甲机床的产品质量与乙机床的产品质量无差异.由题意可
所以依据α=0.01的独立性检验,推断H0不成立,即甲机床的产品质量与乙机床的产品质量有差异.
考点一 成对数据的相关性
例1(1)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数r=0.824 5,下列说法正确的是( )A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈现负相关C.花瓣长度和花萼长度呈现正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.824 5
解析 根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A选项错误;散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,B选项错误,C选项正确;由于r=0.824 5是全部数据的样本相关系数,取出来一部分数据,相关性可能变强,可能变弱,即取出的数据的样本相关系数不一定是0.824 5,D选项错误.
(2)近些年来,短视频社交软件日益受到追捧,用户可以通过软件选择歌曲,拍摄音乐短视频,创作自己的作品.某用户对自己发布的视频个数x与收到的点赞个数之和y之间的关系进行了分析研究,得到如下数据:
计算x,y的样本相关系数r(计算结果精确到0.01),并判断是否可以认为发布的视频个数与收到的点赞数之和的相关性很强.
由此可以认为发布的视频个数与收到的点赞数之和的相关性很强.
[对点训练1](多选题)对两组数据进行统计后得到的散点图如图,关于其样本相关系数的结论正确的是( )A.r1<0B.r2>1C.r1+r2>0D.|r1|>|r2|
解析 由散点图可知,样本相关系数r1的图象表示y与x负相关,故-1
考点二 回归模型(多考向探究预测)
考向1一元线性回归模型例2(2024·四川绵阳南山中学模拟)移动物联网广泛应用于生产制造、公共服务、个人消费等领域.截至2022年底,我国移动物联网连接数达18.45亿户,成为全球主要经济体中首个实现“物超人”的国家.下图是2018~2022年移动物联网连接数w(单位:亿户)与年份代码t的散点图,其中年份2018~2022对应的t分别为1~5.
(1)根据散点图推断两个变量是否线性相关.计算样本相关系数(精确到0.01),并推断它们的相关程度;(2)求w关于t的经验回归方程,并预测2024年移动物联网连接数.
[对点训练2](2024·青海西宁模拟)造林绿化对生态发展特别是在防风固沙、缓解温室效应、净化空气、涵养水源等方面有着重要意义.某苗木培养基地为了对某种树苗的高度偏差x(单位:cm)与树干最大直径偏差y(单位:mm)之间的关系进行分析,随机挑选了8株该品种的树苗,得到它们的偏差数据(偏差是指个别测定值与测定的平均值之差)如下:
(1)若x与y之间具有线性相关关系,求y关于x的经验回归方程;(2)若这种树苗的平均高度为120 cm,树干最大直径平均为31.5 mm,试由(1)的结论预测高度为128 cm的这种树苗的树干最大直径为多少毫米.
(2)当树干高度为128 cm时,高度偏差x=128-120=8(cm),
即预测高度为128 cm的这种树苗的树干最大直径为34毫米.
考向2非线性回归模型例3(2024·云南昆明一中校考)《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,这是21世纪以来第18个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴,要大力推进数字乡村建设,推进智慧农业发展.某乡村合作社借助互联网直播平台进行农产品销售,众多网红主播参与到直播当中,在众多网红直播中,统计了10名网红直播的观看人次xi和农产品销售量yi(i=1,2,3,…,10)的数据,得到如图所示的散点图.
x和销售量y的回归方程类型;(只要给出判断即可,不必说明理由)(2)对数据作出如下处理,得到相关统计量的值如表:
解 (1)由散点图可知,散点分布在一条对数型曲线附近,所以选择回归方程
[对点训练3](2024·山西吕梁模拟)数据显示中国车载音乐已步入快速发展期,随着车载音乐的商业化模式进一步完善,市场将持续扩大,下表为2018~2022年中国车载音乐市场规模(单位:十亿元),其中年份2018~2022对应的代码分别为1~5.
(1)由上表数据知,可用指数函数模型y=a·bx拟合y与x的关系,请建立y关于x的回归方程(a,b的值精确到0.1);(2)综合考虑2023年及2024年的经济环境等因素,某预测公司根据上述数据求得y关于x的回归方程后,通过修正,把b-1.3作为2023年与2024年这两年的年平均增长率,请根据2022年中国车载音乐市场规模及修正后的年平均增长率预测2024年的中国车载音乐市场规模.
(2)由(1)知2023年与2024年这两年的年平均增长率为1.6-1.3=0.3,2022年中国车载音乐市场规模为170亿元,故预测2024年的中国车载音乐市场规模为17(1+0.3)2=28.73(十亿元),即287.3亿元.
考点三 列联表与独立性检验
例4(2024·四川宜宾模拟)为了解学生对党的“二十大”精神的学习情况,学校开展了“二十大”相关知识的竞赛活动,全校共有1 000名学生参加,其中男生450名,采用分层随机抽样的方法抽取100人,将他们的比赛成绩(满分为100分),分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],得到如图所示的频率分布直方图.其中成绩不低于80分为“优秀”,低于80分为“非优秀”.
(1)求实数a的值,并估算全校1 000名学生中成绩优秀的人数;(2)完成下列2×2列联表,依据α=0.05的独立性检验,能否认为比赛成绩优秀与性别有关.
解 (1)由题意可得(0.005+0.015+0.030+0.025+0.005+a)×10=1,解得a=0.020,所以样本中成绩优秀的频率为(0.020+0.005)×10=0.25,据此估算全校1 000名学生中成绩优秀的人数为0.25×1 000=250(人).
(2)零假设为H0:比赛成绩优秀与性别无关.由题意,采用分层随机抽样,男生抽取 100=45(人),女生抽取100-45=55(人),且样本中优秀的人数为100×0.25=25人,故补全2×2列联表如下:单位:人
可得χ2= 3.030<3.841=x0.05,根据小概率值α=0.05的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即比赛成绩优秀与性别无关.
[对点训练4]甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面表格:
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)依据α=0.1的独立性检验,能否认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
适用于新高考新教材备战2025届高考数学一轮总复习第10章统计与成对数据的统计分析课时规范练74成对数据的统计分析课件新人教A版: 这是一份适用于新高考新教材备战2025届高考数学一轮总复习第10章统计与成对数据的统计分析课时规范练74成对数据的统计分析课件新人教A版,共29页。PPT课件主要包含了答案AB等内容,欢迎下载使用。
适用于新高考新教材备战2025届高考数学一轮总复习第10章统计与成对数据的统计分析课时规范练73用样本估计总体课件新人教A版: 这是一份适用于新高考新教材备战2025届高考数学一轮总复习第10章统计与成对数据的统计分析课时规范练73用样本估计总体课件新人教A版,共30页。PPT课件主要包含了答案B,答案ABD等内容,欢迎下载使用。
适用于新高考新教材备战2025届高考数学一轮总复习第10章统计与成对数据的统计分析第2节用样本估计总体课件新人教A版: 这是一份适用于新高考新教材备战2025届高考数学一轮总复习第10章统计与成对数据的统计分析第2节用样本估计总体课件新人教A版,共49页。PPT课件主要包含了强基础固本增分,研考点精准突破,目录索引,至少有p%,100-p%,ABC等内容,欢迎下载使用。