专题08 成对数据的统计分析【知识梳理】-高二数学下学期期末专项复习(新人教A版2019)
展开
这是一份专题08 成对数据的统计分析【知识梳理】-高二数学下学期期末专项复习(新人教A版2019),文件包含专题08成对数据的统计分析知识梳理原卷版doc、专题08成对数据的统计分析知识梳理解析版doc等2份试卷配套教学资源,其中试卷共19页, 欢迎下载使用。
专题08 成对数据的统计分析【知识梳理】 一、一元线性回归方程及其应用1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在左上角到右下角的区域内,两个变量的相关关系为负相关.2.回归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析.其基本步骤是:(ⅰ)画散点图;(ⅱ)求回归直线方程;(ⅲ)用回归直线方程作预报.(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(2)回归直线方程的求法——最小二乘法.设具有线性相关关系的两个变量x,y的一组观察值为(xi,yi)(i=1,2,…,n),则回归直线方程=x+的系数为:称为样本点的中心.(3)相关系数①计算相关系数r,r有以下性质:|r|≤1,并且|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱;②|r|>r0.05,表明有95%的把握认为变量x与y之间具有线性相关关系,回归直线方程有意义;否则寻找回归直线方程毫无意义.【例题1】在建立两个变量与的回归模型中,分别选择了4个不同的模型,模型1的相关指数为,模型2的相关指数为,模型3的相关指数为,模型4的相关指数为,其中拟合效果最好的模型是( )A.模型1 B.模型2 C.模型3 D.模型4【答案】B【详解】所给四个模型中,模型2的相关指数最大,回归模型的拟合效果越好.故选:B.【例题2】以下四个散点图中,两个变量的关系适合用线性回归模型刻画的是( )A.①② B.①③ C.②③ D.③④【答案】B【详解】解析:①③中的点分布在一条直线附近,适合线性回归模型.故选:B【例题3】已知的取值如下表:0134与线性相关,且线性回归直线方程为,则=( )A. B. C. D.【答案】B【详解】由题意可得 所以样本中心为 线性回归直线方程为过点所以,解得 故选:B【变式训练1】已知两个线性相关变量与的统计数据如下表:其回归直线方程是,据此计算,样本处的残差为,则表中的值为( )A. B. C. D.【答案】B【详解】由题意,样本处的残差为,所以,所以,由回归方程过样本的中心点,且,所以可得,由,得.故选:B.【变式训练2】下列关于回归分析的说法中错误的是( )A.线性回归方程对应的直线不一定经过其样本数据中的点B.残差图中的残差点比较均匀地落在水平的带状区域中,宽度越窄,则说明模型拟合精度越高C.若回归方程为,则当时,的值必为58.79D.以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则,的值分别是和0.3【答案】C【详解】解:选项A,线性回归方程对应的直线过样本中心点,不一定过样本数据中的点,故A正确:选项B,残差图中,残差分布的带状区域的宽度越窄,说明模型的拟合精度越高,故B正确;选项C,若回归方程为,则当时,的预测值为58.79,故C错误;选项D,,则,所以,,故D正确.故选:C. 【变式训练3】某厂家营销人员收集了日平均气温(单位:)与某款取暖器的日销售额(单位:万元)的有关数据如下表:日平均气温()日销售额(万元)2023252730已知日销售额与日平均气温之间具有线性相关关系.(1)根据上表数据,用最小二乘法求出关于的线性回归方程;(2)根据(1)求出的线性回归方程,预测日平均气温为时该取暖器的日销售额为多少万元.参考公式:在线性回归方程中,,.参考依据:.【详解】解:(1)由已知条件可得,,,,则.再由,可得.所以回归直线方程为.(2)由回归直线方程为可得,当时,,即预测日平均气温为时,该取暖器的日销售额为32.2万元.【变式训练4】某集团商品的推销员每年推销商品的件数(件)往往与推销员从事推销工作的年数(年)有关,该集团人事部随机调研了集团内推销吊每年推销商品的件数(件)与推销员从事推销工作的年数(年),得到一组数据如下.(1)利用相关系数判断与之间相关关系的强弱(若,则与间相关关系强,否则相关关系弱);(2)求线性回归直线方程(3)预测从事推销工作年的推销员推销商品的件数会不会比从事推销工作年的推销员推销商品的件数的倍还要多?附:①;②相关系数;③回归直线方程中,【详解】解:(1)因为,,.所以与之间具有很强的相关关系.(2),.故回归直线方程为.(3)因为时,;时,;由于,所以可以预测从事推销工作10年的推销员推销商品的件数比从事推销工作2年的推销员推销商品的件数的倍还要多. 二、独立性检验(1)2×2列联表 B总计An11n12n1+An21n22n2+总计n+1n+2n其中n1+=n11+n12,n2+=n21+n22,n+1=n11+n21,n+2=n12+n22,n=n11+n21+n12+n22.(2)χ2统计量χ2=.(3)两个临界值:3.841与6.635当χ2>3.841时,有95%的把握说事件A与B有关;当χ2>6.635时,有99%的把握说事件A与B有关;当χ2≤3.841时,认为事件A与B是无关的.【例题1】关于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是( )A.k的值越大,“X和Y有关系”可信程度越小B.k的值越小,“X和Y有关系”可信程度越小C.k的值越接近于0,“X和Y无关”程度越小D.k的值越大,“X和Y无关”程度越大【答案】B【详解】k的值越大,X和Y有关系的可能性就越大,也就意味着X与Y无关系的可能性就越小.故选:B【例题2】为了判断两个分类变量X、Y是否有关系,应用独立性检验的方法算得的观测值为5,则下列说法中正确的是( )A.有95%的把握认为“X和Y有关系”B.有95%的把握认为“X和Y没有关系”C.有99%的把握认为“X和Y有关系”D.有99%的把握认为“X和Y没有关系”【答案】A【详解】因为,,所以有的把握认为“和有关系”.故选:A【例题3】在一次独立性检验中,得出列联表如下: A合计B2008001 000180a180+a合计380800+a1 180+a且最后发现,两个分类变量A和B没有任何关系,则a的可能值是( )A.200 B.720C.100 D.180【答案】B【详解】由题意知与基本相等,由列联表知与基本相等,,解得.故选:B【变式训练1】第届冬季奥林匹克运动会将于年在北京举办.为了解某城市居民对冰雪运动的关注情况,随机抽取了该市人进行调查统计,得到如下列联表. 男女合计关注冰雪运动不关注冰雪运动合计根据列联表可知( )参考公式:,其中.附表: A.该市女性居民中大约有的人关注冰雪运动B.该市男性届民中大约有的人关注冰雪运动C.有的把握认为该市居民是否关注冰雪运动与性别有关D.有的把握认为该市居民是否关注冰雪运动与性别有关【答案】C【详解】由列联表中的数据可得,因此,有的把握认为该市居民是否关注冰雪运动与性别有关.故选:C.【变式训练2】某医疗研究所为了检验新开发的流感疫苗对流感的预防作用,根据1000名注射了疫苗的人与另外1000名未注射疫苗的人半年的感冒记录作出如下的的列联表,并提出假设“这种疫苗不能起到预防流感的作用”’则下列说法正确是( ) 患流感未患流感合计注射疫苗2008001000未注射疫苗2607401000合计46015402000附:.0.1000.0500.0250.0102.7063.8415.0246.635 A.这种疫苗能起到预防流感的有效率为99%;B.若某人未使用该疫苗,则他在半年中有超过99%的可能性得流感;C.有1%的把握认为“这种疫苗能起到预防流感的作用”;D.有99%的把握认为“这种疫苗能起到预防流感的作用”.【答案】D【详解】,由临界值表可知,有99%的把握认为“这种疫苗能起到预防流感的作用”,故选:D 【变式训练3】为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573试画出列联表的等高堆积条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?【详解】解:铅中毒组的阳性比例为,阴性比例为;对照组的阳性比例为,阴性比例为,由此画出等高堆积条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.【变式训练4】2021年5月14日,郑州国际会展中心举办了关于“服务教育共筑梦想暨中小学书香校园发展论坛”的活动.某中学为进一步推进书香校园系列活动,增加学生对古典文学的学习兴趣,随机抽取名学生做统计调查.统计显示,被调查的学生中,喜欢阅读古典文学的男生有人,占男生调查人数的一半,不喜欢阅读古典文学的女生有人.(1)完成下面列联表,并判断能否在犯错误概率不超过的情况下认为学生喜欢阅读古典文学与性别有关? 喜欢不喜欢总计男生____________女生____________总计____________(2)为鼓励学生阅读古典文学书籍,学校特开展一场古典文学趣味有奖活动,并设置六个奖项(每个人只获一项奖项每项只有一个人获奖,每个人等可能获奖)现从这名同学中选出名男生,名女生参加活动,记为参加活动的同学中获奖的女生人数,求的分布列及数学期望.附:,【详解】(1)由已知可得调查中男生共有人,女生有人,其中喜欢阅读古典文学的女生有人故列联表为: 喜欢不喜欢总计男生女生总计.故能在犯错误概率不超过的情况下认为学生喜欢阅读古典文学与性别有关.(2),,,,.的分布列为.
相关试卷
这是一份第8章 成对数据的统计分析——【期末复习】高中数学章节知识点梳理(人教A版2019选择性必修第三册),共2页。试卷主要包含了1 成对数据的统计相关性,一元线性回归模型,经验回归方程,独立性检验,635,879等内容,欢迎下载使用。
这是一份专题02 直线与圆的方程【知识梳理】-高二数学下学期期末专项复习(新人教A版2019),文件包含专题02直线与圆的方程知识梳理原卷版doc、专题02直线与圆的方程知识梳理解析版doc等2份试卷配套教学资源,其中试卷共19页, 欢迎下载使用。
这是一份专题01 空间向量与立体几何【知识梳理】-高二数学下学期期末专项复习(新人教A版2019),文件包含专题01空间向量与立体几何知识梳理原卷版doc、专题01空间向量与立体几何知识梳理解析版doc等2份试卷配套教学资源,其中试卷共16页, 欢迎下载使用。