备战2024年高考总复习一轮(数学)第10章 算法初步、 统计与统计案例 第4节 变量间的相关关系、统计案例课件PPT
展开1.变量间的相关关系(1)定义:常见的两变量之间的关系有两类:一类是函数关系,另一类是 .当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.与函数关系不同,相关关系是一种 . (2)散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图,它可直观地判断两个变量的关系是否可以用线性关系表示.若这些散点分布在从左下角到右上角的区域,则称两个变量 ;若这些散点分布在从左上角到右下角的区域,则称两个变量 .
(3)线性相关关系、回归直线:如果散点图中点的分布从整体上看大致在 ,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. (4)非线性相关:若散点图上所有点看上去都在 附近波动,则称此相关为非线性相关.此时,可以用 来拟合.(5)不相关:如果所有的点在散点图中 ,那么称变量间是不相关的. 微点拨相关关系与函数关系的异同共同点:二者都是指两个变量间的关系;不同点:函数关系是一种确定性关系,体现的是因果关系,而相关关系是一种非确定性关系,体现的不一定是因果关系,也可能是伴随关系.
某条曲线(不是一条直线)
2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有 ,这条直线叫 .
(6)回归分析模型拟合效果的判断
3.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)2×2列联表:假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:
微点拨用K2的观测值k的大小可以决定是否拒绝原来的统计假设H0,若k的值较大,就拒绝H0,即拒绝事件A与B无关,也可以理解根据k的值判断两个分类变量有关的可信程度,若k的值越大,则两分类变量有关的把握越大.
例1(1)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )A.r2
答案:(1)A (2)B 解析:(1)题中图1和图3是正相关,相关系数大于0;图2和图4是负相关,相关系数小于0;图1和图2的点相对更加集中,所以相关性要强,所以r1接近于1,r2接近于-1,由此可得r2
(2)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴、y轴的单位长度相同),用回归直线方程 近似地刻画其相关关系,根据图形,以下结论最有可能成立的是( )
答案:(1)D (2)B 解析:(1)由散点图得x与y负相关,所以r1,r2<0,因为剔除点(10,21)后,剩下点的数据更具有线性相关性,|r2|更接近1,所以-1
药材乙的收购价格始终为21元/千克,其亩产量的频率分布直方图如下:
(1)若药材甲的单价y(单位:元/千克)与年份编号x具有线性相关关系,请求出y关于x的线性回归方程,并估计2022年药材甲的单价.(2)用上述频率分布直方图估计药材乙的平均亩产量,若不考虑其他因素,试判断2022年该地区种植哪种药材收益更高?并说明理由.
(2)由直方图可知药材乙的平均亩产量为[0.005×(360+440)+0.01×380+0.017 5×400+0.012 5×420]×20=401(千克),所以2022年药材乙收益为21×401=8 421(元),而药材甲收益为32.9×300=9 870(元),所以药材甲收益更高.
对点训练2 2021年2月25日,在全国脱贫攻坚总结表彰大会上,习近平总书记庄严宣告:我国脱贫攻坚战取得全面胜利.2016年起,某贫困地区创新开展产业扶贫,响应第三产业的扶贫攻坚政策,经济收入逐年增加.该地的经济收入变化及构成比例如图所示:
(1)根据以上图表,试分析:与2016年相比,2020年第三产业与种植业收入变化情况;(2)求经济收入y关于x的线性回归方程,并预测2025年该地区的经济收入.参考公式:对于一组具有线性相关关系的数据(xi,yi)(i=1,2,3,…,n),其回归直
解:(1)①与2016年相比,2020年第三产业的收入占比大幅度增加;②2016年第三产业的收入为0.3百万元,2020年第三产业的收入为6百万元,收入大幅度增加;③与2016年相比,种植业收入占比减少,但种植业收入依然保持增长.
考向2非线性回归方程及应用例3(2022江西赣州二模)某公交公司推出了扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次,统计数据如下表所示:
根据以上数据,绘制如图所示的散点图.
(1)根据散点图,判断在推广期内,y=a+bx与y=c·dx(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及题干中表格内的数据,建立y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.参考数据:
规律方法 1.根据样本画出散点图.观察散点图中散点的分布,从整体看,如果散点没有在某一条直线附近,称这两个变量具有相关性,但不是线性相关,即这两个变量非线性相关.2.借助于散点图,与已学过的函数(如指数函数、对数函数、幂函数等)的图象相比较,找到合适的函数模型.3.通过变量转换,把非线性回归问题化成线性回归问题,并求出线性回归方程.4.再利用变量代换,可得非线性回归方程.
对点训练3数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1—9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛,赛前小明在某数独软件上进行一段时间的训练,每天的解题平均速度y(单位:秒)与训练天数x(单位:天)有关,经统计得到如表的数据:
例4(2022河南开封三模)根据统计,某蔬菜基地西红柿亩产量的增加量y(单位:百千克)与某种液体肥料每亩使用量x(单位:千克)之间对应数据的散点图,如图所示.(1)请从相关系数r(精确到0.01)的角度分析,能否用线性回归模型拟合y与x的关系
(若|r|∈[0.75,1],则线性相关程度很强,可用线性回归模型拟合);(2)建立y关于x的线性回归方程,并用其估计当该种液体肥料每亩使用量为9千克时,该蔬菜基地西红柿亩产量的增加量约为多少百千克?
对点训练4 某公司为了准确地把握市场,做好产品生产计划,对过去四年的数据进行整理得到了第x年与年销售量y(单位:万件)之间的关系如表:
(1)在图中画出表中数据的散点图;(2)根据(1)中的散点图拟合y与x的回归模型,并用相关系数加以说明;(3)建立y关于x的回归方程,预测第5年的销售量约为多少?
解:(1)作出散点图如图:(2)由(1)中的散点图可知,各点大致分布在一条直线附近,由题中所给表格及参考数据,得
∵y与x的相关系数近似为0.996 6,接近1,说明y与x的线性相关程度相当强,∴可以用线性回归模型拟合y与x的关系.
例5(2022山西临汾考前适应一)在某医院,因为患心脏病而住院的600名男性病人中,有200人秃顶,而另外750名不是因为患心脏病而住院的男性病人中有150人秃顶.(1)填写下列秃顶与患心脏病列联表:
据表中数据估计秃顶病患中患心脏病的概率P1和不秃顶病患中患心脏病的概率P2,并用两个估计概率判断秃顶与患心脏病是否有关.
(2)能否有99.9%的把握认为秃顶与患心脏病有关,请说明理由.
规律方法 1.独立性检验
2.用K2的观测值k的大小可以决定是否拒绝原来的统计假设H0,若k较大,就拒绝H0,即拒绝事件A与事件B无关;换一种说法,k越大,说明“两个变量有关系”的可能性越大,根据临界值表判断k大于的临界值,然后下结论.
对点训练5打乒乓球是一项众多中学生喜爱的体育运动,某中学体育协会为了解这项运动与性别的关联性,随机调查了100名男生和100名女生,每位学生回答喜欢或不喜欢,得到下面的列联表:
(1)分别估计该中学男、女生喜欢打乒乓球的概率;(2)能否有99.5%的把握认为该中学学生喜欢打乒乓球与性别有关?
备战2024高考一轮复习数学(理) 第十章 统计与统计案例 第二节 变量间的相关关系与统计案例课件PPT: 这是一份备战2024高考一轮复习数学(理) 第十章 统计与统计案例 第二节 变量间的相关关系与统计案例课件PPT,共55页。PPT课件主要包含了函数关系,相关关系,非确定性,正相关,负相关,线性相关,回归直线,最小二乘法,答案C,答案A等内容,欢迎下载使用。
备战2024年高考总复习一轮(数学)第10章 算法初步、 统计与统计案例 第1节 算法初步课件PPT: 这是一份备战2024年高考总复习一轮(数学)第10章 算法初步、 统计与统计案例 第1节 算法初步课件PPT,共50页。PPT课件主要包含了内容索引,强基础固本增分,研考点精准突破,流程图,程序框,流程线,文字说明,起始和结束,输入的信息,成立与否等内容,欢迎下载使用。
备战2024年高考总复习一轮(数学)第10章 算法初步、 统计与统计案例 第2节 随机抽样课件PPT: 这是一份备战2024年高考总复习一轮(数学)第10章 算法初步、 统计与统计案例 第2节 随机抽样课件PPT,共31页。PPT课件主要包含了内容索引,强基础固本增分,研考点精准突破,一部分个体,不放回,机会都相等,抽签法,随机数法,分段间隔k,简单随机抽样等内容,欢迎下载使用。