终身会员
搜索
    上传资料 赚现金
    英语朗读宝

    2021版高考文科数学(北师大版)一轮复习教师用书:第十一章 第3讲 变量间的相关关系、统计案例

    立即下载
    加入资料篮
    2021版高考文科数学(北师大版)一轮复习教师用书:第十一章 第3讲 变量间的相关关系、统计案例第1页
    2021版高考文科数学(北师大版)一轮复习教师用书:第十一章 第3讲 变量间的相关关系、统计案例第2页
    2021版高考文科数学(北师大版)一轮复习教师用书:第十一章 第3讲 变量间的相关关系、统计案例第3页
    还剩12页未读, 继续阅读
    下载需要20学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    2021版高考文科数学(北师大版)一轮复习教师用书:第十一章 第3讲 变量间的相关关系、统计案例

    展开

    3讲 变量间的相关关系、统计案例一、知识梳理1变量间的相关关系常见的两变量之间的关系有两类:一类是函数关系另一类是相关关系;与函数关系不同相关关系是一种非确定性关系2两个变量的线性相关(1)从散点图上看如果这些点从整体上看大致分布在通过散点图中心的一条直线附近称两个变量之间具有线性相关关系这条直线方程叫线性回归方程(2)从散点图上看点分布在从左下角到右上角的区域内两个变量的这种相关关系称为正相关点分布在左上角到右下角的区域内两个变量的相关关系为负相关(3)回归方程为ybxa其中bayb(4)相关系数r>0表明两个变量正相关r<0表明两个变量负相关r的绝对值越接近于1表明两个变量的线性相关性越强r的绝对值越接近于0表明两个变量之间几乎不存在线性相关关系3独立性检验AB为两个变量每一个变量都可以取两个值变量AA1A21;变量BB1B21通过观察得到下表所示数据:BA  B1B2 A1ababA2cdcd acbdnabcdχ2用它的大小来检验变量之间是否独立χ22.706没有充分的证据判定变量AB有关联可以认为变量AB是没有关联的;χ22.70690%的把握判定变量AB有关联;χ23.84195%的把握判定变量AB有关联;χ26.63599%的把握判定变量AB有关联常用结论1求解线性回归方程的关键是确定回归系数ab应充分利用线性回归方程过样本中心点()2根据χ2的值可以判断两个分类变量有关的可信程度χ2越大则两分类变量有关的把握越大3根据线性回归方程计算的y仅是一个预报值不是真实发生的二、教材衍化1已知xy之间的一组数据如表:x0123ym35.57已求得y关于x的线性回归方程为y2.1x0.85m的值为________答案:0.52为了判断高中三年级学生是否选修文科与性别的关系现随机抽取50名学生得到如下2×2列联表: 理科文科1310720已知P(χ2>3.841)0.05P(χ2>6.635)0.01.根据表中数据得到χ24.844.则认为选修文科与性别有关系出错的可能性为________解析:χ24.844>3.841这表明小概率事件发生根据假设检验的基本原理应该断定是否选修文科与性别之间有关系成立并且这种判断出错的可能性约为5%.答案:5%一、思考辨析判断正误(正确的打“√”错误的打“×”)(1)相关关系与函数关系都是一种确定性的关系也是一种因果关系(  )(2)利用散点图可以直观判断两个变量的关系是否可以用线性关系表示(  )(3)只有两个变量有相关关系所得到的回归模型才有预测价值(  )(4)事件XY的关系越密切由观测数据计算得到的χ2的观测值越大(  )(5)通过线性回归方程ybxa可以估计和观测变量的取值和变化趋势(  )答案:(1)× (2) (3) (4) (5)二、易错纠偏(1)混淆相关关系与函数关系;(2)对独立性检验χ2值的意义不清楚;(3)不知道线性回归直线必过样本点中心1两个变量的相关关系有正相关负相关不相关则下列散点图从左到右分别反映的变量间的相关关系是(  )A①②③   B②③①C②①③   D①③②解析:D.第一个散点图中散点图中的点是从左下角区域分布到右上角区域则是正相关;第三个散点图中散点图中的点是从左上角区域分布到右下角区域则是负相关;第二个散点图中散点图中的点的分布没有什么规律则是不相关所以应该是①③②.2某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系运用2×2列联表进行独立性检验经计算χ27.069则所得到的统计学结论是:有多少的把握认为学生性别与支持该活动有关系(  )A0.1%   B1%  C99%   D99.9%解析:C.因为7.069与附表中的6.635最接近所以得到的统计学结论是:有10.0100.9999%的把握认为学生性别与支持该活动有关系3已知xy的取值如下表从散点图可以看出yx线性相关且线性回归方程为y0.95xaa________x0134y2.24.34.86.7解析:由已知得24.5因为线性回归方程经过点()所以a4.50.95×22.6.答案:2.6相关关系的判断(师生共研) 已知变量xy满足关系y=-0.1x1变量yz正相关下列结论中正确的是(  )Axy正相关xz负相关   Bxy正相关xz正相关Cxy负相关xz负相关   Dxy负相关xz正相关解析 因为y=-0.1x1的斜率小于0xy负相关因为yz正相关可设zbyab>0zbya=-0.1bxbaxz负相关答案 C判定两个变量正、负相关性的方法(1)画散点图:点的分布从左下角到右上角两个变量正相关;点的分布从左上角到右下角两个变量负相关  (2)相关系数r>0正相关;r<0负相关(3)线性回归方程中b>0正相关;b<0负相关1对变量xy有观测数据(xiyi)(i1210)得散点图如图对变量uv有观测数据(uivi)(i1210)得散点图如图.由这两个散点图可以判断(  )A变量xy正相关uv正相关B变量xy正相关uv负相关C变量xy负相关uv正相关D变量xy负相关uv负相关解析:C.由散点图可得两组数据均线性相关且题图的线性回归方程斜率为负题图的线性回归方程斜率为正则由散点图可判断变量xy负相关uv正相关2对变量xy有观测数据(xiyi)(i12345)得表1;对变量uv有观测数据(uivi)(i12345)得表2.由这两个表可以判断(  )1x12345y2.93.33.64.45.12u12345v2520211513A.变量xy正相关uv正相关B变量xy负相关uv正相关C变量xy负相关uv负相关D变量xy正相关uv负相关解析:D.由题可知随着x的增大对应的y值增大其散点图呈上升趋势xy正相关;随着u的增大v减小其散点图呈下降趋势uv负相关线性回归方程及其应用(师生共研) (2020·江西宜春模拟)随着我国中医学的发展药用昆虫的使用相应愈来愈多每年春暖以后至寒冬前昆虫大量活动与繁殖易于采集各种药用昆虫已知一只药用昆虫的产卵数y(单位:个)与一定范围内的温度x(单位:)有关于是科研人员在3月份的31天中随机挑选了5天进行研究现收集了该种药用昆虫的5组观测数据如下表:日期27152230温度x/101113128产卵数y/2325302616科研人员确定的研究方案是:先从这5组数据中任选2用剩下的3组数据建立y关于x的线性回归方程再对被选取的2组数据进行检验(1)若选取的是32日与30日这2组的数据请根据37日、15日和22日这3组的数据求出y关于x的线性回归方程;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2则认为得到的线性回归方程是可靠的试问(1)中所得的线性回归方程是否可靠?附:线性回归方程的斜率和截距的最小二乘估计公式分别为bab. (1)由已知数据得1227 (xi)(yi)5 (xi)22.所以a27×12=-3.所以y关于x的线性回归方程为yx3.(2)(1)y关于x的线性回归方程为yx3.x10y×10322|2223|<2x8y×8317|1716|<2.所以(1)中所得的线性回归方程yx3是可靠的线性回归分析问题的类型及解题方法(1)求线性回归方程利用公式求出回归系数ba待定系数法:利用线性回归方程过样本点的中心求系数(2)样本数据的相关系数r反映样本数据的相关程度|r|越大则相关性越强  1对两个变量xy进行线性回归分析计算得到相关系数r=-0.996 2则下列说法中正确的是(  )Axy正相关Bxy具有较强的线性相关关系Cxy几乎不具有线性相关关系Dxy的线性相关关系还需进一步确定解析:B.因为相关系数r=-0.996 2所以xy负相关因为|r|0.996 2非常接近1所以相关性很强故选B.2(2020·成都第一次诊断性检测)2018年俄罗斯世界杯期间莫斯科的部分餐厅销售了来自中国的小龙虾这些小龙虾均标有等级代码为得到小龙虾等级代码数值x与销售单价y(单位:元)之间的关系经统计得到如下数据:等级代码数值x384858687888销售单价y/16.818.820.822.82425.8(1)已知销售单价y与等级代码数值x之间存在线性相关关系y关于x的线性回归方程(系数精确到0.1)(2)若莫斯科某餐厅销售的中国小龙虾的等级代码数值为98请估计该等级的中国小龙虾销售单价为多少元?参考公式:对于一组数据(x1y1)(x2y2)(xnyn)其线性回归方程ybxa的斜率和截距的最小二乘估计分别为bab.参考数据:xiyi8 440x25 564.解:(1)由题意6321.5b0.2ab21.50.2×638.9.故所求线性回归方程为y0.2x8.9.(2)(1)知当x98y0.2×988.928.5.所以估计该等级的中国小龙虾销售单价为28.5独立性检验(师生共研) (2019·高考全国卷改编)某商场为提高服务质量随机调查了50名男顾客和50名女顾客每位顾客对该商场的服务给出满意或不满意的评价得到下面列联表: 满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:χ2.P(χ2>k)0.0500.0100.001k3.8416.63510.828 (1)由调查数据知男顾客中对该商场服务满意的比率为0.8因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为0.6因此女顾客对该商场服务满意的概率的估计值为0.6.(2)χ24.762.由于4.762>3.841故有95%的把握认为男、女顾客对该商场服务的评价有差异(1)独立性检验的一般步骤根据样本数据制成2×2列联表;根据公式χ2计算χ2的值;查表比较χ2与临界值的大小关系作出统计判断(2)解独立性检验的应用问题的关注点两个明确:()明确两类主体;()明确研究的两个问题;两个准确:()准确画出2×2列联表;()准确理解χ2.   (2020·陕西渭南模拟考试)为了解某校学生参加社区服务的情况采用按性别分层抽样的方法进行调查已知该校共有学生960其中男生560从全校学生中抽取了容量为n的样本得到一周参加社区服务时间的统计数据如下表: 超过1小时不超过1小时20812m(1)mn的值;(2)能否有95%的把握认为该校学生一周参加社区服务时间是否超过1小时与性别有关?附:P(χ2>k)0.0500.0100.001k3.8416.63510.828χ2解:(1)由已知该校有女生400m8从而n20812848.(2)作出2×2列联表如下: 超过1小时的人数不超过1小时的人数总计2082812820合计321648χ20.685 7<3.841.所以没有95%的把握认为该校学生一周参加社区服务时间是否超过1小时与性别有关[基础题组练]1(2020·陕西西安陕师大附中等八校联考)设两个变量xy之间具有线性相关关系它们的相关系数为ry关于x的线性回归方程为ykxb(  )Akr的符号相同   Bbr的符号相同Ckr的符号相反   Dbr的符号相反解析:A.因为相关系数r为正表示正相关回归直线方程上升r为负表示负相关回归直线方程下降所以kr的符号相同故选A.2在一次对性别与说谎是否相关的调查中得到如下数据: 说谎不说谎总计67138917总计141630根据表中数据得到如下结论正确的一项是(  )A在此次调查中有95%的把握认为是否说谎与性别有关B在此次调查中有99%的把握认为是否说谎与性别有关C在此次调查中有99.5%的把握认为是否说谎与性别有关D在此次调查中没有充分的证据显示说谎与性别有关解析:D.由已知得χ20.002<0.455所以在犯错误的概率不超过50%的情况下认为说谎与性别无关也就是说在此调查中没有充分的证据显示说谎与性别有关3经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系并得到y关于x的回归直线方程:0.245x0.321由回归直线方程可知家庭年收入每增加1万元年饮食支出平均增加________万元解析:x变为x1y0.245(x1)0.3210.245x0.3210.245因此家庭年收入每增加1万元年饮食支出平均增加0.245万元答案:0.2454如图是一组数据(xy)的散点图经最小二乘估计公式计算yx之间的线性回归方程为ybx1b________解析:由题图知22.6(22.6)代入ybx1解得b0.8.答案:0.85(2020·陕西汉中略阳天津高级中学等12校联考)某市为了了解民众对开展创建文明城市工作以来的满意度随机调查了40名群众并将他们随机分成AB两组每组20A组群众给第一阶段的创文工作评分B组群众给第二阶段的创文工作评分根据两组群众的评分绘制了如图所示的茎叶图(1)根据茎叶图比较群众对两个阶段的创文工作满意度评分的平均值和集中数据(不要求计算出具体值给出结论即可)(2)完成下面的2×2列联表并通过计算判断是否有99%把握认为民众对两个阶段创文工作的满意度存在差异? 低于70不低于70总计第一阶段   第二阶段   总计   参考公式:χ2nabcd.P(χ2>k)0.0500.0100.001k3.8416.63510.828解:(1)根据题中茎叶图可以看出B组群众给第二阶段创文工作满意度评分的平均值高于A组群众给第一阶段创文工作满意度评分的平均值且给分相对于A组更集中些(2)填写2×2列联表如下: 低于70不低于70总计第一阶段11920第二阶段31720总计142640所以χ27.033>6.635.所以有99%的把握认为民众对两个阶段创文工作的满意度存在差异6某品牌手机厂商推出新款的旗舰机型并在某地区跟踪调查得到这款手机上市时间(x个月)和市场占有率(y%)的几组相关对应数据:x12345y0.020.050.10.150.18(1)根据上表中的数据用最小二乘法求出y关于x的线性回归方程;(2)根据上述回归方程分析该款旗舰机型市场占有率的变化趋势并预测自上市起经过多少个月该款旗舰机型市场占有率能超过0.5%(精准到月)解:(1)根据表中数据计算×(12345)3×(0.020.050.10.150.18)0.1所以b0.042所以a0.10.042×3=-0.026所以线性回归方程为y0.042x0.026.(2)由上面的线性回归方程可知上市时间与市场占有率正相关即上市时间每增加1个月市场占有率都增加0.042个百分点;y0.042x0.026>0.5解得x13预计上市13个月时该款旗舰机型市场占有率能超过0.5%.[综合题组练]1(2020·兰州市诊断考试改编)一本书一碗面一条河一座桥曾是兰州的城市名片而现在兰州马拉松又成为了兰州的另一张名片随着全民运动健康意识的提高马拉松运动不仅在兰州而且在全国各大城市逐渐兴起参与马拉松训练与比赛的人数逐年增加为此某市对人们参加马拉松运动的情况进行了统计调查其中一项调查是调查人员从参与马拉松运动的人中随机抽取200对其每周参与马拉松长跑训练的天数进行统计得到以下统计表:平均每周进行长跑训练天数不大于234不少于5人数3013040若某人平均每周进行长跑训练天数不少于5则称其为热烈参与者否则称为非热烈参与者(1)经调查该市约有2万人参与马拉松运动试估计其中热烈参与者的人数;(2)根据上表的数据填写下列2×2列联表并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为热烈参与马拉松与性别有关? 热烈参与者非热烈参与者总计  140 55 总计   附:χ2(n为样本容量)P(χ2>k)0.5000.4000.2500.1500.1000.0500.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828解:(1)200人中热烈参与者的频率作为概率则该市热烈参与者的人数约为20 000×4 000.(2)2×2列联表为 热烈参与者非热烈参与者总计3510514055560总计40160200χ27.292>6.635.故能在犯错误的概率不超过0.01的前提下认为热烈参与马拉松与性别有关2(2020·鹰潭市统一模拟考试)某互联网公司为了确定下一季度的前期广告投入计划收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:月份123456广告投入量/万元24681012收益/万元14.2120.3131.831.1837.8344.67他们用两种模型ybxayaebx分别进行拟合得到相应的线性回归方程并进行残差分析得到如图所示的残差图及一些统计量的值:xiyix7301 464.24364(1)根据残差图比较模型的拟合效果应选择哪个模型?并说明理由;(2)残差绝对值大于2的数据被认为是异常数据需要剔除剔除异常数据后求出(1)中所选模型的线性回归方程;广告投入量x18(1)中所选模型收益的预报值是多少?附:对于一组数据(x1y1)(x2y2)(xnyn)其线性回归方程ybxa的斜率和截距的最小二乘估计分别为:bab.解:(1)应该选择模型因为模型的残差点比较均匀地落在水平的带状区域中且模型的带状区域比模型的带状区域窄所以模型的拟合精度高线性回归方程的预报精度高(2)剔除异常数据3月份的数据后×(7×66)7.2×(30×631.8)29.64.xiyi1 464.246×31.81 273.44x36462328.b3ab29.643×7.28.04.所以y关于x的线性回归方程为y3x8.04.x18代入()中所求线性回归方程得y3×188.0462.04.故预报值为62.04万元  

    • 精品推荐
    • 所属专辑
    欢迎来到教习网
    • 900万优选资源,让备课更轻松
    • 600万优选试题,支持自由组卷
    • 高质量可编辑,日均更新2000+
    • 百万教师选择,专业更值得信赖
    微信扫码注册
    qrcode
    二维码已过期
    刷新

    微信扫码,快速注册

    手机号注册
    手机号码

    手机号格式错误

    手机验证码 获取验证码

    手机验证码已经成功发送,5分钟内有效

    设置密码

    6-20个字符,数字、字母或符号

    注册即视为同意教习网「注册协议」「隐私条款」
    QQ注册
    手机号注册
    微信注册

    注册成功

    返回
    顶部
    Baidu
    map