![高端精品高中数学一轮专题-线性回归方程、相关系数、2x2列联表(讲)(带答案)教案第1页](http://m.enxinlong.com/img-preview/3/3/12487692/0/0.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![高端精品高中数学一轮专题-线性回归方程、相关系数、2x2列联表(讲)(带答案)教案第2页](http://m.enxinlong.com/img-preview/3/3/12487692/0/1.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![高端精品高中数学一轮专题-线性回归方程、相关系数、2x2列联表(讲)(带答案)教案第3页](http://m.enxinlong.com/img-preview/3/3/12487692/0/2.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
高端精品高中数学一轮专题-线性回归方程、相关系数、2x2列联表(讲)(带答案)教案
展开
这是一份高端精品高中数学一轮专题-线性回归方程、相关系数、2x2列联表(讲)(带答案)教案,共8页。
线性回归方程、相关系数、2x2列联表核心素养立意下的命题导向1.会作两个相关变量的散点图,会利用散点图认识变量之间的相关关系.2.了解最小二乘法的思想,能根据给出的线性回归系数公式建立线性回归方程,凸显数学运算的核心素养.3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其应用,凸显数学建模、数据分析的核心素养.4.了解回归分析的基本思想、方法及其简单应用,凸显数学建模、数据分析的核心素养.[理清主干知识]1.变量间的相关关系常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.(3)我们将=x+称为Y关于x的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计(least squares estimate ),其中(4)相关系数当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常|r|大于0.75时,认为两个变量有很强的线性相关性.3.独立性检验(1)2×2列联表:假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为: y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d(2)K2统计量K2=(其中n=a+b+c+d为样本容量). 考点一 相关关系的判断[典例] (1)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图①,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图如图②.由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关(2)某公司在2019年上半年的月收入x(单位:万元)与月支出y(单位:万元)的统计资料如表所示:月份1月份2月份3月份4月份5月份6月份收入x12.314.515.017.019.820.6支出y5.635.755.825.896.116.18根据统计资料,则( )A.月收入的中位数是15,x与y有正线性相关关系B.月收入的中位数是17,x与y有负线性相关关系C.月收入的中位数是16,x与y有正线性相关关系D.月收入的中位数是16,x与y有负线性相关关系[解析] (1)由散点图可得两组数据均线性相关,且图①的线性回归方程斜率为负,图②的线性回归方程斜率为正,则由散点图可判断变量x与y负相关,u与v正相关.(2)月收入的中位数是=16,收入增加,支出增加,故x与y有正线性相关关系.[答案] (1)C (2)C[方法技巧] 判断相关关系的2种方法散点图法如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系相关系数法利用相关系数判定,当|r|越趋近于1时,相关性越强[针对训练]1.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且=2.347x-6.423;②y与x负相关且=-3.476x+5.648;③y与x正相关且=5.437x+8.493;④y与x正相关且=-4.326x-4.578.其中一定不正确的结论的序号是( )A.①② B.②③C.③④ D.①④解析:选D 正相关指的是y随x的增大而增大,负相关指的是y随x的增大而减小,故不正确的为①④.2.在一组数据为(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若这组样本数据的相关系数为-1,则所有的样本点(xi,yi)(i=1,2,…,n)满足的方程可以是( )A.y=-x+1 B.y=x-1C.y=x+1 D.y=-x2解析:选A ∵这组样本数据的相关系数为-1,∴这一组数据(x1,y1),(x2,y2),…,(xn,yn)线性相关,且是负相关,∴可排除B、C、D,故选A.考点二 回归分析考法(一) 线性回归方程[例1] 某手机厂商在销售200万台某型号手机时开展“手机碎屏险”活动.活动规则如下:用户购买该型号手机时可选购“手机碎屏险”,保费为x元.若在购机后一年内发生碎屏可免费更换一次屏幕.该手机厂商将在这200万台该型号手机全部销售完毕一年后,在购买碎屏险且购机后一年内未发生碎屏的用户中随机抽取1 000名,每名用户赠送1 000元的红包.为了合理确定保费x的值,该手机厂商进行了问卷调查,统计后得到下表(其中y表示保费为x元时愿意购买该“手机碎屏险”的用户比例):x1020304050y0.790.590.380.230.01(1)根据上面的数据求出y关于x的回归直线方程;(2)通过大数据分析,在使用该型号手机的用户中,购机后一年内发生碎屏的比例为0.5%.已知更换一次该型号手机屏幕的费用为800元,若该手机厂商要求在这次活动中因销售该“手机碎屏险”产生的利润不少于70万元,能否把保费x定为5元?参考数据:表中x的5个值从左到右分别记为x1,x2,x3,x4,x5,相应的y值分别记为y1,y2,y3,y4,y5,经计算有 (xi-)(yi-)=-19.2,其中=xi,=yi.[解] (1)由=30,=0.4, (xi-)(yi-)=-19.2, (xi-)2=1 000,得==-0.0192,=-=0.976,所以y关于x的回归直线方程为y=-0.019 2x+0.976.(2)能把保费x定为5元.理由如下:若保费x定为5元,则估计y=-0.019 2×5+0.976=0.88,估计该手机厂商在这次活动中因销售该“手机碎屏险”产生的利润为2 000 000×0.88×5-2 000 000×0.88×0.5%×800-1 000×1 000=0.76×106(元)=76(万元)>70(万元),所以能把保费x定为5元.考法(二) 相关系数[例2] 我国大力发展校园足球,为了解某地区足球特色学校的发展状况,社会调查小组得到如下统计数据:年份x20142015201620172018足球特色学校y(百个)0.300.601.001.401.70(1)根据上表数据,计算y与x的相关系数r,并说明y与x的线性相关性强弱;(已知:0.75≤|r|≤1,则认为y与x的线性相关性很强;0.3≤|r|<0.75,则认为y与x的线性相关性一般;|r|≤0.25,则认为y与x的线性相关性较弱)(2)求y关于x的线性回归方程,并预测该地区2021年足球特色学校的个数(精确到个).参考数据:(xi-)2=10,(yi-)2=1.3,(xi-)·(yi-)=3.6,≈3.6056.[解] (1)由题得=×(2 014+2 015+2 016+2 017+2 018)=2016,=×(0.30+0.60+1.00+1.40+1.70)=1,∴r=≈≈0.998>0.7.∴y与x的线性相关性很强.(2)设y关于x的线性回归方程为=+x,则==0.36,=-=1-0.36×2 016=-724.76,∴y关于x的线性回归方程是=0.36x-724.76.当x=2 021时,=0.36×2 021-724.76=2.8,故预测该地区2021年足球特色学校有280个.考法(三) 非线性回归分析[例3] 已知某地区某种昆虫产卵数和温度有关.现收集了一只该品种昆虫的产卵数y(个)和温度x(℃)的7组观测数据,其散点图如图所示: 根据散点图,结合函数知识,可以发现产卵数y和温度x可用方程y=ebx+a来拟合,令z=ln y,结合样本数据可知z与温度x可用线性回归方程来拟合.根据收集到的数据,计算得到如下值:(xi-)2(zi-)2(xi-)(zi-)27743.53718211.946.418表中zi=ln yi,=i.(1)求z关于温度x的回归方程(回归系数结果精确到0.001);(2)求产卵数y关于温度x的回归方程;若该地区一段时间内的气温在26 ℃~36 ℃之间(包括26 ℃与36 ℃),估计该品种一只昆虫的产卵数的范围.参考数据:e3.282≈27,e3.792≈44,e5.832≈341,e6.087≈440,e6.342≈568.[解] (1)由题意,z和温度x可以用线性回归方程拟合,设=x+,则=≈0.255,=-=3.537-0.255×27=-3.348,故z关于x的线性回归方程为=0.255x-3.348.(2)由(1)可得,ln y=0.255x-3.348.于是产卵数y关于温度x的回归方程为y=e0.255x-3.348.当x=26时,y=e0.255×26-3.348=e3.282≈27;当x=36时,y=e0.255×36-3.348=e5.832≈341.∵函数y=e0.255x-3.348为增函数,∴在气温在26℃~36℃之间时,一只该品种昆虫的产卵数的估计范围是{y|27≤y≤341,y∈N*}.[针对训练]1.已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下表对应数据,根据表中数据可得回归方程=x+其中=11据此估计,当投入6万元广告费时,销售额约为( )x12345y1015304550A.60万元 B.63万元C.65万元 D.69万元解析:选B 由表格数据可知==3,==30,因为回归方程过点(,),所以30=3+,且=11,得=-3,所以=11x-3,代入x=6,得=63,故选B.2.某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1月份至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下数据:日期1月10日2月10日3月10日4月10日5月10日6月10日昼夜温差x/℃1011131286就诊人数y/个222529261612 该兴趣小组确定的研究方案是:先从这6组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月份与6月份的两组数据,请根据2月份至5月份的数据,求出y关于x的线性回归方程=x+;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?参考数据:11×25+13×29+12×26+8×16=1 092,112+132+122+82=498.解:(1)设选到相邻两个月的数据为事件A.因为从6组数据中选取2组数据共有15种情况,且每种情况都是等可能的,其中,选到相邻两个月的数据的情况有5种,所以P(A)==.(2)由表中2月份至5月份的数据可得=11,=24,所以=,则=- =-,所以y关于x的线性回归方程为=x-.(3)当x=10时,=,<2;当x=6时,=,<2.所以该小组所得线性回归方程是理想的. 考点三 独立性检验[典例] 某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天): 锻炼人次 空气质量等级 [0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关? 人次≤400人次>400空气质量好 空气质量不好 附:K2=,P(K2≥k)0.0500.0100.001k3.8416.63510.828[解] (1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:空气质量等级1234概率的估计值0.430.270.210.09(2)一天中到该公园锻炼的平均人次的估计值为(100×20+300×35+500×45)=350.(3)根据所给数据,可得2×2列联表: 人次≤400人次>400空气质量好3337空气质量不好228根据列联表得K2=≈5.820.由于5.820>3.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.[方法技巧] 解独立性检验应用问题的2个关注点两个明确明确两类主体;明确研究的两个问题两个准确准确画出2×2列联表;准确计算K2[针对训练] 在某次测验中,某班40名考生的成绩满分100分统计如图所示.(1)估计这40名学生的测验成绩的中位数x0(精确到0.1);(2)记80分以上为优秀,80分及以下为合格,结合频率分布直方图完成下表,并判断是否有95%的把握认为数学测验成绩与性别有关? 合格优秀总计男生16 女生 4 总计 40解:(1)由频率分布直方图易知0.01×10+0.015×10+0.02×10=0.45,即分数在的频率为0.45,∴0.03×=0.5-0.45,解得x0=≈71.7,∴40名学生的测验成绩的中位数为71.7.(2)由频率分布直方图,可得列联表如下: 合格优秀总计男生16622女生14418总计301040∴K2==≈0.135<3.841,故没有95%的把握认为数学测验成绩与性别有关.
相关教案
这是一份高端精品高中数学一轮专题-复数的乘、除运算(讲)(带答案)教案,共4页。教案主要包含了自主学习,合作探究等内容,欢迎下载使用。
这是一份高端精品高中数学一轮专题-双曲线(讲)(带答案)教案,共15页。
这是一份高端精品高中数学一轮专题-椭圆(讲)(带答案)教案,共13页。