中考数学优化探究一轮复习(理数) 第10章 第4节 变量间的相关关系与统计案例课件PPT
展开知识点一 变量间的相关关系1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是_________;与函数关系不同,_________是一种非确定性关系.(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为_________,点散布在左上角到右下角的区域内,两个变量的相关关系为_________.
2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有_____________,这条直线叫做_________.
(4)相关系数:当r>0时,表明两个变量_________;当r<0时,表明两个变量_________.r的绝对值越接近于1,表明两个变量的线性相关性_________.r的绝对值越接近于0时,表明两个变量之间_______________________.通常|r|大于_________时,认为两个变量有很强的线性相关性.
几乎不存在线性相关关系
1.易混淆相关关系与函数关系,两者的区别是函数关系是一种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
1.为研究语文成绩和英语成绩之间是否具有线性相关关系,统计两科成绩得到如图所示的散点图(两坐标轴单位长度相同),用回归直线y=bx+a近似地刻画其相关关系,根据图形,以下结论最有可能成立的是( )
A.线性相关关系较强,b的值为3.25B.线性相关关系较强,b的值为0.83C.线性相关关系较强,b的值为-0.87D.线性相关关系太弱,无研究价值解析:依题意,注意到题中相关的点均集中在某条直线的附近,且该直线的斜率小于1,结合各选项知,选B.
2.相关变量x,y的样本数据如下表:
经回归分析可得y与x线性相关,并由最小二乘法求得回归直线方程为y=1.1x+a,则a=( )A.0.1 B.0.2C.0.3 D.0.4
3.(易错题)(2021·兰州市高三实战考试)已知变量x,y具有线性相关关系,它们之间的一组数据如下表所示,若y关于x的回归方程为y=1.3x-1,则m=_________.
知识点二 独立性检验假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
1.下面是2×2列联表:
则表中a,b的值分别为( )A.94,72 B.52,50C.52,74 D.74,52
2.为考察某种药物预防疾病的效果,对100只某种动物进行试验,得到如下的列联表:
题型一 相关关系的判断
1.(2021·昆明市诊断测试)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:
根据表中数据,下列说法正确的是( )A.利润率与人均销售额成正相关关系B.利润率与人均销售额成负相关关系C.利润率与人均销售额成正比例函数关系D.利润率与人均销售额成反比例函数关系
解析:画出利润率与人均销售额的散点图,如图.由图可知利润率与人均销售额成正相关关系.
2.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:
则哪位同学的试验结果体现A,B两变量有更强的线性相关性( )A.甲 B.乙C.丙 D.丁
解析:在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近于1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,B两变量有更强的线性相关性.
3.(2020·高考全国卷Ⅰ)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )A.y=a+bx B.y=a+bx2C.y=a+bex D.y=a+bln x解析:由散点图可以看出,这些点大致分布在对数型函数的图像附近.
1.散点图中如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关.2.利用相关系数判定,当|r|越趋近于1,相关性越强.当残差平方和越小,相关指数R2越大,相关性越强.若r>0,则正相关;r<0时,则负相关.3.线性回归直线方程中:b>0时,正相关;b<0时,负相关.
[例] (2021·福州市模拟)随着我国中医学的发展,药用昆虫的使用相应愈来愈多.每年春暖以后至寒冬前,昆虫大量活动与繁殖,易于采集各种药用昆虫.已知一只药用昆虫的产卵数y(单位:个)与一定范围内的温度x(单位:℃)有关,于是科研人员在3月份的31天中随机挑选了5天进行研究,现收集了该种药用昆虫的5组观测数据如下表:
(1)从这5天中任选2天,记这2天药用昆虫的产卵数分别为m,n,求事件“m,n均不小于25”的概率;(2)科研人员确定的研究方案是:先从这5组数据中任选2组,用剩下的3组数据建立y关于x的线性回归方程,再对被选取的2组数据进行检验.①若选取的是3月2日与30日这2组的数据,请根据3月7日、15日和22日这3组的数据,求出y关于x的线性回归方程;②若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2个,则认为得到的线性回归方程是可靠的,试问①中所得的线性回归方程是否可靠?
[例] (2021·洛阳市统考)某共享单车经营企业欲向甲市投放单车,为制定适宜的经营策略,该企业首先在已投放单车的乙市进行单车使用情况调查.调查过程分随机问卷、整理分析及开座谈会三个阶段.在随机问卷阶段,A,B两个调查小组分赴全市不同区域发放问卷并及时收回;在整理分析阶段,两个调查小组从所获取的有效问卷中,针对15至45岁的人群,按比例随机抽取了300份,进行数据统计,具体情况如下表:
(1)先用分层抽样的方法从上述300人中按“年龄是否达到35岁”抽出一个容量为60人的样本,再用分层抽样的方法将“年龄达到35岁”的被抽个体分配到“经常使用单车”和“偶尔使用单车”中去,①求这60人中“年龄达到35岁且偶尔使用单车”的人数;②为听取对发展共享单车的建议,调查小组专门组织所抽取的“年龄达到35岁且偶尔使用单车”的人员召开座谈会.会后共有3份礼品赠送给其中3人,每人1份(其余人员仅赠送骑行优惠券).已知参加座谈会的人员中有且只有4人来自A组,求A组这4人中得到礼品的人数X的分布列和数学期望.
(2)从统计数据可直观得出“经常使用共享单车与年龄达到m岁有关”的结论.在用独立性检验的方法说明该结论成立时,为使犯错误的概率尽可能小,年龄m应取25还是35?请通过比较χ2的大小加以说明.
[对点训练]3(2021·惠州调研)在某校举行的航天知识竞赛中,参与竞赛的文科生与理科生人数之比为1∶3,且成绩分布在[40,100],分数在80以上(含80)的同学获奖.按文理科用分层抽样的方法抽取200人的成绩作为样本,得到成绩的频率分布直方图如下.
(2)填写2×2列联表如下:
非线性回归问题中的核心素养
数学建模、数学运算——非线性回归的应用问题[例] 为了研究一种昆虫的产卵数y(单位:个)和温度x(单位:℃)是否有关,现收集了7组观测数据列于下表中,并作出了如图所示的散点图,发现样本点没有分布在某个带状区域内,两个变量不呈线性相关关系,现分别用模型①:y=C1x2+C2与模型②:y=eC3x+C4作为产卵数y和温度x的回归方程来建立两个变量之间的关系.
(1)分别在下图(1)(2)中画出y关于t的散点图和z关于x的散点图,根据散点图判断哪一个模型更适宜作为昆虫的产卵数y关于温度x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据表中数据,分别在两个模型下建立y关于x的回归方程,并在两个模型下分别估计温度为30 ℃时的产卵数;(参考数据:e4.65≈104.58,e4.85≈127.74,e5.05≈156.02)
解析:(1)画出y关于t的散点图,如图所示.
画出z关于x的散点图,如图所示.
非线性回归方程的求法(1)根据原始数据作出散点图;(2)根据散点图,选择恰当的拟合函数;(3)作恰当变换,将其转化成线性函数,求线性回归方程;(4)在(3)的基础上通过相应变换,即可得非线性回归方程.
[对点训练] (2021·汕头模拟)二手车经销商小王对其所经营的A型号二手汽车的使用年数x与销售价格y(单位:万元/辆)进行整理,得到如下数据:
下面是z关于x的折线图:
(1)由折线图可以看出,可以用线性回归模型拟合z与x的关系,请用相关系数加以说明;(2)求y关于x的回归方程,并预测某辆A型号二手车当使用年数为9年时售价约为多少;(b、a小数点后保留两位有效数字)
(3)基于成本的考虑,该型号二手车的售价不得低于7 118元,请根据(2)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年.
∴z与x的线性回归方程是z=-0.36x+3.62,又z=ln y,∴y关于x的回归方程是y=e-0.36x+3.62.令x=9,得y=e-0.36×9+3.62=e0.38,∵ln 1.46≈0.38,∴y=1.46,即预测某辆A型号二手车当使用年数为9年时售价约为1.46万元.
中考数学优化探究一轮复习(理数) 第5章 第4节 数列求和课件PPT: 这是一份中考数学优化探究一轮复习(理数) 第5章 第4节 数列求和课件PPT,共40页。PPT课件主要包含了na1等内容,欢迎下载使用。
中考数学优化探究一轮复习(理数) 第10章 第3节 用样本估计总体课件PPT: 这是一份中考数学优化探究一轮复习(理数) 第10章 第3节 用样本估计总体课件PPT,共47页。PPT课件主要包含了最大值,最小值,频率分布表,频率分布直方图,所分的组数,从小到大的等内容,欢迎下载使用。
中考数学优化探究一轮复习(理数) 第10章 第2节 随机抽样课件PPT: 这是一份中考数学优化探究一轮复习(理数) 第10章 第2节 随机抽样课件PPT,共37页。PPT课件主要包含了不放回抽取,抽签法,随机数法,互不交叉,差异明显,分段间隔k,简单随机抽样,l+k,l+2k,答案3等内容,欢迎下载使用。