|学案下载
终身会员
搜索
    上传资料 赚现金
    高考数学统考一轮复习第9章统计与统计案例第3节变量间的相关关系统计案例学案
    立即下载
    加入资料篮
    高考数学统考一轮复习第9章统计与统计案例第3节变量间的相关关系统计案例学案01
    高考数学统考一轮复习第9章统计与统计案例第3节变量间的相关关系统计案例学案02
    高考数学统考一轮复习第9章统计与统计案例第3节变量间的相关关系统计案例学案03
    还剩9页未读, 继续阅读
    下载需要10学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    高考数学统考一轮复习第9章统计与统计案例第3节变量间的相关关系统计案例学案

    展开
    这是一份高考数学统考一轮复习第9章统计与统计案例第3节变量间的相关关系统计案例学案,共12页。

     变量间的相关关系、统计案例

    [考试要求] 1.会做两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.

    2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归系数公式不要求记忆).

    3.了解回归分析的基本思想、方法及其简单应用.

    4.了解独立性检验(只要求2×2列联表)的思想、方法及其初步应用.

    1.两个变量的线性相关

    (1)正相关

    在散点图中,点散布在从左下角右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.

    (2)负相关

    在散点图中,点散布在从左上角右下角的区域,两个变量的这种相关关系称为负相关.

    (3)线性相关关系、回归直线

    如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.

    2.回归方程

    (1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.

    (2)回归方程:方程x+是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中是待定参数.

    3.回归分析

    (1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.

    (2)样本点的中心

    对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中()称为样本点的中心,即回归直线经过点().

    (3)相关系数

    当r>0时,表明两个变量正相关

    当r<0时,表明两个变量负相关

    r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.

    4.独立性检验

    (1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.

    (2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为

    2×2列联表

     

    y1

    y2

    总计

    x1

    a

    b

    a+b

    x2

    c

    d

    c+d

    总计

    a+c

    b+d

    a+b+c+d

    构造一个随机变量K2,其中n=a+b+c+d为样本容量.

    1.回归直线必过样本点的中心().

    2.当两个变量的相关系数|r|=1时,两个变量呈函数关系.

    一、易错易误辨析(正确的打“√”,错误的打“×”)

    (1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.(  )

    (2)通过回归直线方程x+可以估计预报变量的取值和变化趋势. (  )

    (3)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验. (  )

    (4)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大. (  )

    [答案] (1)√ (2)√ (3)× (4)√

    二、教材习题衍生

    1.在两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合效果最好的是(  )

    A.模型1的相关指数R2为0.98

    B.模型2的相关指数R2为0.80

    C.模型3的相关指数R2为0.50

    D.模型4的相关指数R2为0.25

    A [R2越接近于1,其拟合效果越好.]

    2.下面是2×2列联表:

     

    y1

    y2

    总计

    x1

    a

    21

    73

    x2

    22

    25

    47

    总计

    b

    46

    120

    则表中a,b的值分别为(  )

    A.94,72       B.52,50

    C.52,74   D.74,52

    C [∵a+21=73,∴a=52.又a+22=b,∴b=74.]

    3.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:

     

    理科

    文科

    13

    10

    7

    20

    已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.

    根据表中数据,得到K2的观测值k=≈4.844.则认为选修文科与性别有关系出错的可能性约为       

    5% [K2的观测值k≈4.844,这表明小概率事件发生.根据独立性检验,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.]

    4.某同学家里开了一个小卖部,为了研究气温对某种冷饮销售量的影响,他收集了一段时间内这种冷饮每天的销售量y(杯)与当天最高气温x(℃)的有关数据,通过描绘散点图,发现y和x呈线性相关关系,并求得其回归方程=2x+60.如果气象预报某天的最高气温为34 ℃,则可以预测该天这种饮料的销售量为          杯.

    128 [由题意x=34时,该小卖部大约能卖出冷饮的杯数=2×34+60=128杯.]

    考点一 相关关系的判断                   

     判定两个变量正、负相关的方法

    (1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.

    (2)相关系数:r>0时,正相关;r<0时,负相关.

    (3)线性回归直线方程中:>0时,正相关;<0时,负相关.

    1.观察下列各图形,其中两个变量x,y具有相关关系的图是(  )

    ①    ②    ③    ④

    A.①②   B.①④   C.③④   D.②③

    C [由散点图知③中的点都分布在一条直线附近.④中的点都分布在一条曲线附近,所以③④中的两个变量具有相关关系.]

    2.已知变量x和y近似满足关系式y=-0.1x+1,变量y与z正相关.下列结论中正确的是(  )

    A.x与y正相关,x与z负相关

    B.x与y正相关,x与z正相关

    C.x与y负相关,x与z负相关

    D.x与y负相关,x与z正相关

    C [由y=-0.1x+1,知x与y负相关,即y随x的增大而减小,又y与z正相关,所以z随y的增大而增大,减小而减小,所以z随x的增大而减小,x与z负相关.]

    3.对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是(  )

    相关系数为r1     相关系数为r2

    相关系数为r3     相关系数为r4

    A.r2<r4<0<r3<r1   B.r4<r2<0<r1<r3

    C.r4<r2<0<r3<r1   D.r2<r4<0<r1<r3

    A [由相关系数的定义以及散点图可知r2<r4<0<r3<r1.]

    4.x和y的散点图如图所示,则下列说法中所有正确命题的序号为       

    ①x,y是负相关关系;

    ②在该相关关系中,若用y=c1e拟合时的相关系数为r1,用x+拟合时的相关系数为r2,则|r1|>|r2|;

    ③x,y之间不能建立线性回归方程.

    ①② [在散点图中,点散布在从左上角到右下角的区域,因此x,y是负相关关系,故①正确;由散点图知用y=c1拟合比用x+拟合效果要好,则|r1|>|r2|,故②正确;x,y之间可以建立线性回归方程,但拟合效果不好,故③错误.]

    考点二 回归分析                         

     用最小二乘法求线性回归方程的步骤

     线性回归分析

    [典例1-1](2020·贵阳模拟)某地随着经济的发展,居民收入逐年增长,下表1是该地一建设银行连续五年的储蓄存款(年底余额),

    年份x

    2013

    2014

    2015

    2016

    2017

    储蓄存款y(千亿元)

    5

    6

    7

    8

    10

    表1

    为了研究计算的方便,工作人员将上表的数据进行了处理,t=x-2 012,z=y-5得到下表2:

    时间代号t

    1

    2

    3

    4

    5

     

    z

    0

    1

    2

    3

    5

     

    表2

    (1)求z关于t的线性回归方程;

    (2)通过(1)中的方程,求出y关于x的回归方程;

    (3)用所求回归方程预测到2022年年底,该地储蓄存款额可达多少?

    (附:对于线性回归方程x+,其中)

    [解] (1)=3,=2.2,tizi=45,t=55,

    =1.2,

    =2.2-3×1.2=-1.4,

    所以=1.2t-1.4.

    (2)将t=x-2 012,z=y-5,代入=1.2t-1.4,

    得y-5=1.2(x-2 012)-1.4,即=1.2x-2 410.8.

    (3)因为=1.2×2 022-2 410.8=15.6,所以预测到2022年年底,该地储蓄存款额可达15.6千亿元.

    点评:在线性回归分析中,只需利用公式求出回归直线方程并利用其进行预测即可(注意回归直线过样本点的中心()),利用回归方程进行预测,常把线性回归方程看作一次函数,求函数值.利用回归直线方程求出的是估算值,非准确值.

     非线性回归方程

    [典例1-2] 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.

    表中wi,w]=

    (1)根据散点图判断,y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型;(给出判断即可,不必说明理由)

    (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;

    (3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:

    ①年宣传费x=49时,年销售量及年利润的预报值是多少?

    ②年宣传费x为何值时,年利润的预报值最大?

    附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线u的斜率和截距的最小二乘估计分别为

     [解] (1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.

    (2)令w=,先建立y关于w的线性回归方程.

    由于=68,

    =563-68×6.8=100.6,

    所以y关于w的线性回归方程为=100.6+68w,

    因此y关于x的回归方程为=100.6+68.

    (3)①由(2)知,当x=49时,

    年销售量y的预报值=100.6+68=576.6,

    年利润z的预报值=576.6×0.2-49=66.32.

    ②根据(2)的结果知,年利润z的预报值

    =0.2(100.6+68)-x=-x+13.6+20.12.

    所以当=6.8,即x=46.24时,取得最大值.

    故年宣传费为46.24千元时,年利润的预报值最大.

    点评:对于非线性回归分析问题,应先进行变量代换,求出代换后的回归直线方程,再求非线性回归方程.

    1.(2020·全国卷Ⅱ)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加,为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得xi=60,yi=1 200, (xi)2=80, (yi)2=9 000, (xi)(yi)=800.

    (1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);

    (2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);

    (3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.

    附:相关系数r=≈1.414.

    [解] (1)由已知得样本平均数i=60,从而该地区这种野生动物数量的估计值为60×200=12 000.

    (2)样本(xi,yi)(i=1,2,…,20)的相关系数

    .

    (3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.

    理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.

    2.十九大报告指出,必须树立“绿水青山就是金山银山”的生态文明发展理念,这一理念将进一步推动新能源汽车产业的迅速发展.以下是近几年我国新能源汽车的年销量数据及其散点图(如图所示):

    年份

    2013

    2014

    2015

    2016

    2017

    年份代码x

    1

    2

    3

    4

    5

    新能源汽车的年销量y/万辆

    1.5

    5.9

    17.7

    32.9

    55.6

     

    (1)请根据散点图判断x+x2中哪个更适宜作为新能源汽车年销量y关于年份代码x的回归方程模型;(给出判断即可,不必说明理由)

    (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测2022年我国新能源汽车的年销量.(精确到0.1)

    附:令wi=x.

    [解] (1)根据散点图得,x2更适宜作为年销量y关于年份代码x的回归方程.

    (2)依题意得,=11,≈2.28,

    =22.72-2.28×11=-2.36,

    =2.28x2-2.36.

    令x=10,则=2.28×100-2.36=225.64≈225.6,

    故预测2022年我国新能源汽车的年销量为225.6万辆.

    考点三 独立性检验                       

     

    1.比较几个分类变量有关联的可能性大小的方法

    (1)通过计算K2的大小判断:K2越大,两变量有关联的可能性越大.

    (2)通过计算|ad-bc|的大小判断:|ad-bc|越大,两变量有关联的可能性越大.

    2独立性检验的一般步骤

    (1)根据样本数据制成2×2列联表.

    (2)根据公式K2计算K2的观测值k.

    (3)比较观测值k与临界值的大小关系,作统计推断.

    [典例2](2020·全国卷Ⅲ)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):

    锻炼人次

    空气质量等级   

    [0,200]

    (200,400]

    (400,600]

    1(优)

    2

    16

    25

    2(良)

    5

    10

    12

    3(轻度污染)

    6

    7

    8

    4(中度污染)

    7

    2

    0

    (1)分别估计该市一天的空气质量等级为1,2,3,4的概率;

    (2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);

    (3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?

     

    人次≤400

    人次>400

    空气质量好

     

     

    空气质量不好

     

     

    附:K2

    P(K2≥k)

    0.050

    0.010

    0.001

    k

    3.841

    6.635

    10.828

     .

    [解] (1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如表:

    空气质量等级

    1

    2

    3

    4

    概率的估计值

    0.43

    0.27

    0.21

    0.09

    (2)一天中到该公园锻炼的平均人次的估计值为

    (100×20+300×35+500×45)=350.

    (3)根据所给数据,可得2×2列联表:

     

    人次≤400

    人次>400

    空气质量好

    33

    37

    空气质量不好

    22

    8

    根据列联表得

    K2≈5.820.

    由于5.820>3.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.

     点评:独立性检验是判断两个分类变量之间是否有关系的一种方法.在判断两个分类变量之间是否有关系时,作出等高条形图只能近似地判断两个分类变量是否有关系,而独立性检验可以精确地得到可靠的结论.

    1.党的十九大报告明确提出:在共享经济等领域培育增长点、形成新动能.共享经济是公众将闲置资源通过社会化平台与他人共享,进而获得收入的经济现象.为考察共享经济对企业经济活跃度的影响,在四个不同的企业各取两个部门进行共享经济对比试验,根据四个企业得到的试验数据画出如下四个等高条形图,最能体现共享经济对该部门的发展有显著效果的图形是(  )

    A          B

    C          D

    D [根据四个选项中的等高条形图可知,选项D中共享与不共享的企业经济活跃度的差异较大,且最能体现共享经济对该部门的发展有显著效果,故选D.]

    2.(2020·新高考全国卷Ⅰ)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:

       SO2

    PM2.5   

    [0,50]

    (50,150]

    (150,475]

    [0,35]

    32

    18

    4

    (35,75]

    6

    8

    12

    (75,115]

    3

    7

    10

    (1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;

    (2)根据所给数据,完成下面的2×2列联表:

       SO2

    PM2.5   

    [0,150]

    (150,475]

    [0,75]

     

     

    (75,115]

     

     

    (3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?

    附:K2

     

    [解] (1)根据抽查数据,该市100天空气中的PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为=0.64.

    (2)根据抽查数据,可得2×2列联表:

       SO2

    PM2.5   

    [0,150]

    (150,475]

    [0,75]

    64

    16

    (75,115]

    10

    10

    (3)根据(2)的列联表得

    K2≈7.484.

    由于7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.

     

     

    相关学案

    统考版高中数学(文)复习11-2变量间的相关关系、统计案例学案: 这是一份统考版高中数学(文)复习11-2变量间的相关关系、统计案例学案,共17页。学案主要包含了必记3个知识点,必明3个常用结论,必练4类基础题等内容,欢迎下载使用。

    高考数学统考一轮复习第11章11.5变量间的相关关系与统计案例学案: 这是一份高考数学统考一轮复习第11章11.5变量间的相关关系与统计案例学案,共12页。学案主要包含了知识重温,小题热身等内容,欢迎下载使用。

    高考数学(理数)一轮复习学案11.3《变量间的相关关系与统计案例》(含详解): 这是一份高考数学(理数)一轮复习学案11.3《变量间的相关关系与统计案例》(含详解),共15页。

    免费资料下载额度不足,请先充值

    每充值一元即可获得5份免费资料下载额度

    今日免费资料下载份数已用完,请明天再来。

    充值学贝或者加入云校通,全网资料任意下。

    提示

    您所在的“深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载 10 份资料 (今日还可下载 0 份),请取消部分资料后重试或选择从个人账户扣费下载。

    您所在的“深深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载10份资料,您的当日额度已用完,请明天再来,或选择从个人账户扣费下载。

    您所在的“深圳市第一中学”云校通余额已不足,请提醒校管理员续费或选择从个人账户扣费下载。

    重新选择
    明天再来
    个人账户下载
    下载确认
    您当前为教习网VIP用户,下载已享8.5折优惠
    您当前为云校通用户,下载免费
    下载需要:
    本次下载:免费
    账户余额:0 学贝
    首次下载后60天内可免费重复下载
    立即下载
    即将下载:资料
    资料售价:学贝 账户剩余:学贝
    选择教习网的4大理由
    • 更专业
      地区版本全覆盖, 同步最新教材, 公开课⾸选;1200+名校合作, 5600+⼀线名师供稿
    • 更丰富
      涵盖课件/教案/试卷/素材等各种教学资源;900万+优选资源 ⽇更新5000+
    • 更便捷
      课件/教案/试卷配套, 打包下载;手机/电脑随时随地浏览;⽆⽔印, 下载即可⽤
    • 真低价
      超⾼性价⽐, 让优质资源普惠更多师⽣
    VIP权益介绍
    • 充值学贝下载 本单免费 90%的用户选择
    • 扫码直接下载
    元开通VIP,立享充值加送10%学贝及全站85折下载
    您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      充值到账1学贝=0.1元
      0学贝
      本次充值学贝
      0学贝
      VIP充值赠送
      0学贝
      下载消耗
      0学贝
      资料原价
      100学贝
      VIP下载优惠
      0学贝
      0学贝
      下载后剩余学贝永久有效
      0学贝
      • 微信
      • 支付宝
      支付:¥
      元开通VIP,立享充值加送10%学贝及全站85折下载
      您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      扫码支付0直接下载
      • 微信
      • 支付宝
      微信扫码支付
      充值学贝下载,立省60% 充值学贝下载,本次下载免费
        下载成功

        Ctrl + Shift + J 查看文件保存位置

        若下载不成功,可重新下载,或查看 资料下载帮助

        本资源来自成套资源

        更多精品资料

        正在打包资料,请稍候…

        预计需要约10秒钟,请勿关闭页面

        服务器繁忙,打包失败

        请联系右侧的在线客服解决

        单次下载文件已超2GB,请分批下载

        请单份下载或分批下载

        支付后60天内可免费重复下载

        我知道了
        正在提交订单

        欢迎来到教习网

        • 900万优选资源,让备课更轻松
        • 600万优选试题,支持自由组卷
        • 高质量可编辑,日均更新2000+
        • 百万教师选择,专业更值得信赖
        微信扫码注册
        qrcode
        二维码已过期
        刷新

        微信扫码,快速注册

        手机号注册
        手机号码

        手机号格式错误

        手机验证码 获取验证码

        手机验证码已经成功发送,5分钟内有效

        设置密码

        6-20个字符,数字、字母或符号

        注册即视为同意教习网「注册协议」「隐私条款」
        QQ注册
        手机号注册
        微信注册

        注册成功

        下载确认

        下载需要:0 张下载券

        账户可用:0 张下载券

        立即下载
        使用学贝下载
        账户可用下载券不足,请取消部分资料或者使用学贝继续下载 学贝支付

        如何免费获得下载券?

        加入教习网教师福利群,群内会不定期免费赠送下载券及各种教学资源, 立即入群

        返回
        顶部
        Baidu
        map