|学案下载
搜索
    上传资料 赚现金
    2021高考数学一轮复习学案:第九章9.3变量间的相关关系、统计案例
    立即下载
    加入资料篮
    2021高考数学一轮复习学案:第九章9.3变量间的相关关系、统计案例01
    2021高考数学一轮复习学案:第九章9.3变量间的相关关系、统计案例02
    2021高考数学一轮复习学案:第九章9.3变量间的相关关系、统计案例03
    还剩20页未读, 继续阅读
    下载需要20学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    2021高考数学一轮复习学案:第九章9.3变量间的相关关系、统计案例

    展开
    §9.3 变量间的相关关系、统计案例


    1.相关关系与回归方程
    (1)相关关系的分类
    ①正相关
    在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.
    ②负相关
    在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.
    (2)线性回归方程
    能用直线方程=x+近似表示的相关关系叫做线性相关关系,该方程叫线性回归方程.
    (3)最小平方法是一种求回归直线的方法,用这种方法求得的回归直线能使样本数据的点到回归直线的距离的平方和最小.
    (4)给出一组数据(x1,y1),(x2,y2),…,(xn,yn),用最小平方法求得线性回归方程的系数,满足

    上式还可以表示为

    (5)回归分析
    ①定义:对具有相关关系的两个变量进行统计分析的一种常用方法.
    ②样本点的中心
    对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中(,)称为样本点的中心.
    ③相关系数
    |r|≤1;
    当r>0时,表明两个变量正相关;
    当r<0时,表明两个变量负相关.
    r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.
    (6)对相关系数r进行显著性检验的基本步骤
    ①提出统计假设H0:变量x,y不具有线性相关关系;
    ②如果以95%的把握作出判断,那么可以根据1-0.95=0.05与n-2在教材附录2中查出一个r的临界值r0.05(其中1-0.95=0.05称为检验水平);
    ③计算样本相关系数r;
    ④作出统计推断:若|r|>r0.05,则否定H0,表明有95%的把握认为x与y之间具有线性相关关系;若|r|≤r0.05,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为y与x之间有线性相关关系.
    2.独立性检验
    (1)2×2列联表
    一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B,Ⅱ也有两类取值,即类1和类2,得到如下列联表所示的抽样数据:



    类1
    类2
    合计

    类A
    a
    b
    a+b
    类B
    c
    d
    c+d
    合计
    a+c
    b+d
    a+b+c+d

    上述表格称为2×2列联表.
    |ad-bc|越小,说明两个分类变量x,y之间的关系越弱;
    |ad-bc|越大,说明两个分类变量x,y之间的关系越强.
    (2)χ2统计量
    χ2=.
    用χ2的大小可判断事件A,B有关联的可信程度.
    (3)独立性检验
    ①独立性检验的步骤
    要判断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:
    a.提出假设H0:Ⅰ与Ⅱ没有关系;
    b.根据2×2列联表及χ2公式,计算χ2的值;
    c.查对临界值,作出判断.
    其中临界值如表所示:
    P(χ2≥x0)
    0.50
    0.40
    0.25
    0.15
    0.10
    0.05
    0.025
    0.010
    0.005
    0.001
    x0
    0.455
    0.708
    1.323
    2.072
    2.706
    3.841
    5.024
    6.635
    7.879
    10.828

    表示在H0成立的情况下,事件“χ2≥x0”发生的概率.
    ②推断依据
    a.若χ2>10.828,则有99.9%的把握认为“Ⅰ与Ⅱ有关系”;
    b.若χ2>6.635,则有99%的把握认为“Ⅰ与Ⅱ有关系”;
    c.若χ2>2.706,则有90%的把握认为“Ⅰ与Ⅱ有关系”;
    d.若χ2≤2.706,则认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“H0成立”,即不能认为Ⅰ与Ⅱ没有关系.
    概念方法微思考
    1.变量的相关关系与变量的函数关系有什么区别?
    提示 相同点:两者均是指两个变量的关系.
    不同点:①函数关系是一种确定的关系,相关关系是一种非确定的关系.
    ②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
    2.线性回归方程是否都有实际意义?根据回归方程进行预报是否一定准确?
    提示 (1)不一定都有实际意义.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.
    (2)根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.

    题组一 思考辨析
    1.判断下列结论是否正确(请在括号中打“√”或“×”)
    (1)散点图是判断两个变量是否相关的一种重要方法和手段.( √ )
    (2)回归方程=x+至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.( × )
    (3)若事件X,Y关系越密切,则由观测数据计算得到的χ2的观测值越小.( × )
    (4)两个变量的相关系数的绝对值越接近于1,它们的相关性越强.( √ )
    题组二 教材改编
    2.为调查中学生近视情况,测得某校150名男生中有80名近视,在140名女生中有70名近视.在检验这些学生眼睛近视是否与性别有关时,用下列哪种方法最有说服力(  )
    A.回归分析 B.均值与方差
    C.独立性检验 D.概率
    答案 C
    解析 “近视”与“性别”是两类变量,其是否有关,应用独立性检验判断.
    3.下面是2×2列联表:

    y1
    y2
    合计
    x1
    a
    21
    73
    x2
    22
    25
    47
    合计
    b
    46
    120

    则表中a,b的值分别为(  )
    A.94,72 B.52,50
    C.52,74 D.74,52
    答案 C
    解析 ∵a+21=73,∴a=52.
    又a+22=b,∴b=74.
    4.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程=0.67x+54.9.
    零件数x
    (个)
    10
    20
    30
    40
    50
    加工时间y
    (min)
    62

    75
    81
    89

    现发现表中有一个数据看不清,请你推断出该数据的值为________.
    答案 68
    解析 由=30,得=0.67×30+54.9=75.
    设表中的“模糊数字”为a,
    则62+a+75+81+89=75×5,∴a=68.
    题组三 易错自纠
    5.某医疗机构通过抽样调查(样本容量n=1 000),利用2×2列联表和χ2统计量研究患肺病是否与吸烟有关.计算得χ2=4.453,经查阅临界值表知P(χ2≥3.841)≈0.05,现给出四个结论,其中正确的是(  )
    A.在100个吸烟的人中约有95个人患肺病
    B.若某人吸烟,那么他有95%的可能性患肺病
    C.有95%的把握认为“患肺病与吸烟有关”
    D.只有5%的把握认为“患肺病与吸烟有关”
    答案 C
    解析 由已知数据可得,有1-0.05=95%的把握认为“患肺病与吸烟有关”.
    6.(多选)在统计中,由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)利用最小二乘法得到两个变量的线性回归方程为=x+,那么下列说法正确的是(  )
    A.相关系数r不可能等于1
    B.直线=x+必经过点(,)
    C.直线=x+表示最接近y与x之间真实关系的一条直线
    D.相关系数为r,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小
    答案 BCD
    解析 相关系数的取值范围是|r|≤1,故A错;直线=x+必过样本点中心即点(,),故B正确;直线=x+是采用最小二乘法求解出的直线方程,接近真实关系,故C正确;相关系数r的绝对值越接近于1,表示相关程度越大,越接近于0,相关程度越小,故D正确.故选BCD.
    7.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是________.(填序号)
    ①y与x具有正的线性相关关系;
    ②回归直线过样本点的中心(,);
    ③若该大学某女生身高增加1 cm,则其体重约增加0.85 kg;
    ④若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg.
    答案 ④
    解析 ①正确;②正确;③正确.对于④,当x=170 cm时,=0.85×170-85.71=58.79,但这是预测值,不可断定其体重为58.79 kg.故不正确.

    相关关系的判断
    1.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.根据该图,下列结论中正确的是(  )

    A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%
    B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%
    C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%
    D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%
    答案 B
    解析 观察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%,故选B.
    2.某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:
    月份
    1
    2
    3
    4
    5
    6
    人均销售额
    6
    5
    8
    3
    4
    7
    利润率(%)
    12.6
    10.4
    18.5
    3.0
    8.1
    16.3

    根据表中数据,下列说法正确的是(  )
    A.利润率与人均销售额成正相关关系
    B.利润率与人均销售额成负相关关系
    C.利润率与人均销售额成正比例函数关系
    D.利润率与人均销售额成反比例函数关系
    答案 A
    解析 由统计表可得利润率与人均销售额不是正比例关系,也不是反比例关系,排除C和D;其属于正相关关系,A正确,B错误.
    思维升华 判定两个变量正、负相关性的方法
    (1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.
    (2)相关系数:当r>0时,两个变量正相关;当r<0时,两个变量负相关.
    (3)线性回归方程:当 >0时,两个变量正相关;当 <0时,两个变量负相关.

    回归分析
    命题点1 线性回归分析
    例1 (2020·湖北部分重点中学联考)“精准扶贫”的重要思想最早在2013年11月提出,习近平到湘西考察时首次作出“实事求是,因地制宜,分类指导,精准扶贫”的重要指导.2015年习总书记在贵州调研时强调要科学谋划好“十三五”时期精准扶贫开发工作,确保贫困人口到2020年如期脱贫.某农科所实地考察,研究发现某贫困村适合种植A、B两种药材,可以通过种植这两种药材脱贫,通过大量考察研究得到如下统计数据:药材A的亩产量约为300公斤,其收购价格处于上涨趋势,最近五年的价格如下表:
    编号
    1
    2
    3
    4
    5
    年份
    2015
    2016
    2017
    2018
    2019
    单价(元/公斤)
    18
    20
    23
    25
    29

    药材B的收购价格始终为20元/公斤,其亩产量的频率分布直方图如下:

    (1)若药材A的单价y(单位:元/公斤)与年份编号x具有线性相关关系,请求出y关于x的线性回归方程,并估计2020年药材A的单价;
    (2)用上述频率分布直方图估计药材B的平均亩产量,若不考虑其他因素,试判断2020年该村应种植药材A还是药材B?并说明理由.
    附:==,=-.
    解 (1)==3,==23,
    所以=
    =2.7,
    又因为=+,即23=2.7×3+,解得=14.9,
    所以=2.7x+14.9;
    当x=6时,=31.1.
    (2)360×0.1+380×0.2+400×0.35+420×0.25+440×0.1=401,
    若种植A种药材每亩地的收入约为31.1×300=9 330,
    若种植B种药材每亩地的收入约为401×20=8 020<9 330,
    所以应该种植A种药材.
    命题点2 非线性回归
    例2 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.





    (xi-)2
    (wi-)2
    (xi-)·
    (yi-)
    (wi-)·
    (yi-)
    46.6
    563
    6.8
    289.8
    1.6
    1 469
    108.8

    表中wi=,=i.
    (1)根据散点图判断y=a+bx与y=c+d哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
    (2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
    (3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.根据(2)的结果回答下列问题:
    ①年宣传费x=49时,年销售量及年利润的预报值是多少?
    ②年宣传费x为何值时,年利润的预报值最大?
    附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线=+u的斜率和截距的最小二乘估计分别为
    =,=-.
    解 (1)由散点图可以判断,y=c+d适宜作为年销售量y关于年宣传费x的回归方程类型.
    (2)令w=,先建立y关于w的线性回归方程,由于
    ===68,
    =-=563-68×6.8=100.6,
    所以y关于w的线性回归方程为 =100.6+68w,
    因此y关于x的回归方程为 =100.6+68.
    (3)①由(2)知,当x=49时,
    年销售量y的预报值 =100.6+68=576.6,
    年利润z的预报值 =576.6×0.2-49=66.32.
    ②根据(2)的结果知,年利润z的预报值
    =0.2(100.6+68)-x=-x+13.6+20.12.
    所以当==6.8,即x=46.24时, 取得最大值.
    故年宣传费为46.24千元时,年利润的预报值最大.
    思维升华 回归分析问题的类型及解题方法
    (1)求回归方程
    ①根据散点图判断两变量是否线性相关,如不是,应通过换元构造线性相关.
    ②利用公式,求出回归系数.
    ③待定系数法:利用回归直线过样本点的中心求系数.
    (2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.
    (3)利用回归直线判断正、负相关,决定正相关还是负相关的是系数.
    (4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.
    跟踪训练1 下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.

    为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①: =-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②: =99+17.5t.
    (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
    (2)你认为用哪个模型得到的预测值更可靠?并说明理由.
    解 (1)利用模型①,可得该地区2018年的环境基础设施投资额的预测值为 =-30.4+13.5×19=226.1(亿元).
    利用模型②,可得该地区2018年的环境基础设施投资额的预测值为 =99+17.5×9=256.5(亿元).
    (2)利用模型②得到的预测值更可靠.
    理由如下:
    (ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型 =99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
    (ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.

    独立性检验
    例3 (2020·湖北荆、荆、襄、宜四地七校联考)为积极响应国家“阳光体育运动”的号召,某学校在了解到学生的实际运动情况后,发起以“走出教室,走到操场,走到阳光”为口号的课外活动倡议.为调查该校学生每周平均体育运动时间的情况,从高一高二基础年级与高三三个年级学生中按照4∶3∶3的比例分层抽样,收集300位学生每周平均体育运动时间的样本数据(单位:小时),得到如图所示的频率分布直方图.(已知高一年级共有1 200名学生)

    (1)据图估计该校学生每周平均体育运动时间,并估计高一年级每周平均体育运动时间不足4小时的人数;
    (2)规定每周平均体育运动时间不少于6小时记为“优秀”,否则为“非优秀”,在样本数据中,有30位高三学生的每周平均体育运动时间不少于6小时,请完成下列2×2列联表,并判断是否有99%的把握认为“该校学生的每周平均体育运动时间是否‘优秀’与年级有关”.

    基础年级
    高三
    合计
    优秀



    非优秀



    合计


    300

    附:χ2=.
    参考数据:
    P(χ2≥x0)
    0.100
    0.050
    0.010
    0.005
    x0
    2.706
    3.841
    6.635
    7.879

    解 (1)该校学生每周平均体育运动时间为=1×0.05+3×0.2+5×0.3+7×0.25+9×0.15+11×0.05=5.8.
    样本中高一年级每周平均体育运动时间不足4小时的人数为300××(0.025×2+0.100×2)=30(人).
    又样本中高一的人数有120人,所以估计高一年级每周平均体育运动时间不足4小时的人数约为1 200×=300(人).
    (2)列联表如下:

    基础年级
    高三
    合计
    优秀
    105
    30
    135
    非优秀
    105
    60
    165
    合计
    210
    90
    300

    假设该校学生的每周平均体育运动时间是否优秀与年级无关,
    则χ2=
    =≈7.071>6.635.
    又P(χ2≥6.635)=0.01.
    所以有99%的把握认为“该校学生的每周平均体育运动时间是否‘优秀’与年级有关”.
    思维升华 独立性检验的一般步骤
    (1)根据样本数据制成2×2列联表.
    (2)根据公式χ2=计算χ2.
    (3)比较χ2与临界值的大小关系,作统计推断.
    跟踪训练2 (2017·全国Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:


    (1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;
    (2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:

    箱产量<50 kg
    箱产量≥50 kg
    旧养殖法


    新养殖法



    (3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较.
    附:
    P(χ2≥x0)
    0.050
    0.010
    0.001
    x0
    3.841
    6.635
    10.828

    χ2=.
    解 (1)旧养殖法的箱产量低于50 kg的频率为
    (0.012+0.014+0.024+0.034+0.040)×5=0.62.
    因此,事件A的概率估计值为0.62.
    (2)根据箱产量的频率分布直方图得列联表如下:

    箱产量<50 kg
    箱产量≥50 kg
    旧养殖法
    62
    38
    新养殖法
    34
    66

    χ2的观测值k=≈15.705.
    由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
    (3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.

    数据分析是指针对研究对象获得相关数据,运用统计方法对数据中的有用信息进行分析和推断,形成知识的过程.主要包括:收集数据、整理数据、提取信息、构建模型对信息进行分析、推断、获得结论.
    例 (2019·全国Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:

    记C为事件“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
    (1)求乙离子残留百分比直方图中a,b的值;
    (2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
    解 (1)由已知得0.70=a+0.20+0.15,
    故a=0.35.
    b=1-0.05-0.15-0.70=0.10.
    (2)甲离子残留百分比的平均值的估计值为
    2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
    乙离子残留百分比的平均值的估计值为
    3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
    素养提升 考题从所给直方图中的数据来进行求甲、乙离子残留百分化的平均值的过程体现的就是数据分析素养.


    1.已知变量x和y满足关系=-0.1x+1,变量y与z正相关.下列结论中正确的是(  )
    A.x与y正相关,x与z负相关
    B.x与y正相关,x与z正相关
    C.x与y负相关,x与z负相关
    D.x与y负相关,x与z正相关
    答案 C
    解析 因为 =-0.1x+1,-0.1<0,所以x与y负相关.又y与z正相关,故可设 = y+ ( >0),所以 =-0.1 x+ + ,-0.1 <0,所以x与z负相关.故选C.
    2.(2020·合肥检测)某公司一种型号的产品近期销售情况如下表:
    月份x
    2
    3
    4
    5
    6
    销售额y/万元
    15.1
    16.3
    17.0
    17.2
    18.4

    根据上表可得到线性回归方程=0.75x+,据此估计,该公司7月份这种型号产品的销售额为(  )
    A.19.5万元 B.19.25万元
    C.19.15万元 D.19.05万元
    答案 D
    解析 由题意,==4,
    ==16.8,
    回归直线=0.75x+过(,),
    可得=13.8,
    当x=7时,可得=0.75×7+13.8=19.05.
    3.下列现象中线性相关程度最强的是(  )
    A.商店的职工人数与商品销售额之间的线性相关系数为0.87
    B.流通费用率与商业利润率之间的线性相关系数为-0.94
    C.商品销售额与商业利润率之间的线性相关系数为0.51
    D.商品销售额与流通费用率之间的线性相关系数为0.70
    答案 B
    解析 线性相关系数r的绝对值越接近于1,两个变量间的线性相关程度越强.
    4.以下关于线性回归的判断,正确的个数是(  )

    ①若散点图中所有点都在一条直线附近,则这条直线为回归直线;
    ②散点图中的绝大多数点都在一条直线附近,个别特殊点不影响线性回归,如图中的A,B,C点;
    ③已知线性回归方程为=0.50x-0.81,则x=25时,y的估计值为11.69;
    ④回归直线的意义是它反映了样本整体的变化趋势.
    A.0 B.1 C.2 D.3
    答案 D
    解析 能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数,,得到的直线=x+才是回归直线,∴①不对;②正确;将x=25代入=0.50x-0.81,得=11.69,∴③正确;④正确,故选D.
    5.(2019·南通模拟)2018世界特色魅力城市200强新鲜出炉,包括黄山市在内的28个中国城市入选,美丽的黄山风景和人文景观迎来众多宾客.现在很多人喜欢“自助游”,某调查机构为了了解“自助游”是否与性别有关,在黄山旅游节期间,随机抽取了100人,得如下所示的列联表:

    赞成“自助游”
    不赞成“自助游”
    合计
    男性
    30
    15
    45
    女性
    45
    10
    55
    合计
    75
    25
    100

    参考公式:χ2=,其中n=a+b+c+d.
    P(χ2≥x0)
    0.15
    0.10
    0.05
    0.025
    0.010
    0.005
    0.001
    x0
    2.072
    2.706
    3.841
    5.024
    6.635
    7.879
    10.828

    参照公式,得到的正确结论是(  )
    A.有99.5%以上的把握认为“赞成‘自助游’与性别无关”
    B.有99.5%以上的把握认为“赞成‘自助游’与性别有关”
    C.在犯错误的概率不超过0.1的前提下,认为“赞成‘自助游’与性别无关”
    D.在犯错误的概率不超过0.1的前提下,认为“赞成‘自助游’与性别有关”
    答案 D
    解析 将2×2列联表中的数据代入计算,得χ2=≈3.030,∵2.706<3.030<3.841,∴在犯错误的概率不超过0.1的前提下,可以认为“赞成‘自助游’与性别有关”.
    6.(2020·焦作模拟)根据下表中的数据可以得到线性回归方程=0.7x+0.35,则实数m,n应满足(  )
    x
    3
    m
    5
    6
    y
    2.5
    3
    4
    n

    A.n-0.7m=1.7 B.n-0.7m=1.5
    C.n+0.7m=1.7 D.n+0.7m=1.5
    答案 A
    解析 =(3+m+5+6)=(14+m),
    =(2.5+3+4+n)=(9.5+n),
    故(9.5+n)=0.7×(14+m)+0.35,
    解得n-0.7m=1.7.
    7.(多选)下列说法中错误的是(  )
    A.将一组数据中的每一个数据都加上或减去同一个常数后,方差不变
    B.设有一个线性回归方程=3-5x,变量x增加1个单位时,y平均增加5个单位
    C.设具有相关关系的两个变量x,y的相关系数为r,则|r|越接近于0,x和y之间的线性相关程度越强
    D.在一个2×2列联表中,由计算得χ2的值,则χ2的值越大,判断两个变量间有关联的把握就越大
    答案 BC
    解析 根据方差公式,可知将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变,故A正确;变量x增加一个单位时,y平均减小5个单位,故B不正确;设具有相关关系的两个变量x,y的相关系数为r,则|r|越接近于0,x和y之间的线性相关程度越弱,故C错误;在一个2×2列联表中,由计算得χ2的值,则χ2的值越大,判断两个变量间有关联的把握就越大,故D正确.
    故选BC.
    8.(多选)小明同学在做市场调查时得到如下样本数据.
    x
    1
    3
    6
    10
    y
    8
    a
    4
    2

    他由此得到回归方程为=-2.1x+15.5,则下列说法正确的是(  )
    A.变量x与y线性负相关
    B.当x=2时可以估计y=11.3
    C.a=6
    D.变量x与y之间是函数关系
    答案 ABC
    解析 由回归方程为=-2.1x+15.5,可知变量x与y之间线性负相关,故A正确;当x=2时,y=-2.1×2+15.5=11.3,故B正确;∵=5,=,∴样本点的中心坐标为,代入=-2.1x+15.5,得=-2.1×5+15.5,解得a=6,故C正确;变量x与y之间具有线性负相关关系,不是函数关系,故D错误.
    故选ABC.
    9.某市居民2015~2019年家庭年平均收入x(单位:万元)与年平均支出y(单位:万元)的统计资料如下表所示:
    年份
    2015
    2016
    2017
    2018
    2019
    收入x
    11.5
    12.1
    13
    13.3
    15
    支出y
    6.8
    8.8
    9.8
    10
    12

    根据统计资料,居民家庭年平均收入的中位数是______,家庭年平均收入与年平均支出有________相关关系.(填“正”或“负”)
    答案 13 正
    解析 中位数是13.由相关性知识,根据统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正相关关系.
    10.(2020·成都模拟)某公司一种新产品的销售额y与宣传费用x之间的关系如下表:
    x(单位:万元)
    0
    1
    2
    3
    4
    y(单位:万元)
    10
    15
    20
    30
    35

    已知销售额y与宣传费用x具有线性相关关系,并求得其线性回归方程为=x+9,则的值为________.
    答案 6.5
    解析 ==2,===22,由回归直线=x+9过点(2,22)得,22=2+9,解得==6.5.
    11.已知10只狗的血球体积x(单位:mm3)及红血球数y(单位:百万)的测量值如下:
    x
    45
    42
    46
    48
    42
    35
    58
    40
    39
    50
    y
    6.53
    6.30
    9.25
    7.50
    6.99
    5.90
    9.49
    6.20
    6.55
    7.72

    (1)画出散点图;
    (2)求出y对x的线性回归方程;
    (3)若血球体积为49 mm3,预测红血球数大约是多少?
    解 (1)散点图如图所示.

    (2)设线性回归方程为=x+,由表中数据代入公式,得=≈0.16,=- ≈0.12.
    所以所求线性回归方程为=0.16x+0.12.
    (3)把x=49代入线性回归方程得
    =0.16×49+0.12=7.96,计算结果表明,当血球体积为49 mm3时,红血球数大约为7.96百万.
    12.某淘宝店经过对春节七天假期的消费者的消费金额进行统计,发现在消费金额不超过1 000元的消费者中男女比例为1∶4,该店按此比例抽取了100名消费者进行进一步分析,得到下表:
    女性消费情况:
    消费金
    额/元
    (0,200)
    [200,400)
    [400,600)
    [600,800)
    [800,1 000]
    人数
    5
    10
    15
    47
    3

    男性消费情况:
    消费金
    额/元
    (0,200)
    [200,400)
    [400,600)
    [600,800)
    [800,1 000]
    人数
    2
    3
    10
    3
    2

    若消费金额不低于600元的网购者为“网购达人”,低于600元的网购者为“非网购达人”.
    (1)分别计算女性和男性消费的平均数,并判断平均消费水平高的一方“网购达人”出手是否更阔绰?
    (2)根据列表中统计数据填写如下2×2列联表,并判断能否在犯错误的概率不超过0.005的前提下认为“是否为‘网购达人’与性别有关”.

    女性
    男性
    合计
    “网购达人”



    “非网购达人”



    合计




    附:χ2=,其中n=a+b+c+d.
    P(χ2≥x0)
    0.10
    0.05
    0.025
    0.010
    0.005
    x0
    2.706
    3.841
    5.024
    6.635
    7.879

    解 (1)女性消费者消费的平均数为×(100×5+300×10+500×15+700×47+900×3)=582.5.
    男性消费者消费的平均数为×(100×2+300×3+500×10+700×3+900×2)=500.
    “女网购达人”消费的平均数为×(700×47+900×3)=712.
    “男网购达人”消费的平均数为×(700×3+900×2)=780.
    虽然女性消费者平均消费水平较高,但“女网购达人”平均消费水平低于“男网购达人”平均消费水平,所以“平均消费水平”高的一方“网购达人”出手不一定更阔绰.
    (2)2×2列联表如下所示:

    女性
    男性
    合计
    “网购达人”
    50
    5
    55
    “非网购达人”
    30
    15
    45
    合计
    80
    20
    100

    χ2=≈9.091,
    因为9.091>7.879,
    所以能在犯错误的概率不超过0.005的前提下认为“是否为‘网购达人’与性别有关”.

    13.(2019·福州四校联考)某汽车的使用年数x与所支出的维修总费用y的统计数据如表:
    使用年数x/年
    1
    2
    3
    4
    5
    维修总费用y/万元
    0.5
    1.2
    2.2
    3.3
    4.5

    根据上表可得y关于x的线性回归方程=x-0.69,若该汽车维修总费用超过10万元就不再维修,直接报废,据此模型预测该汽车最多可使用(不足1年按1年计算)(  )
    A.8年 B.9年 C.10年 D.11年
    答案 D
    解析 由y关于x的线性回归直线=x-0.69过样本点的中心(3,2.34),得=1.01,即线性回归方程为=1.01x-0.69,由=1.01x-0.69=10得x≈10.6,所以预测该汽车最多可使用11年,故选D.
    14.某工厂为了对一种新研究的产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
    单价x(元)
    4
    5
    6
    7
    8
    9
    销量y(件)
    90
    84
    83
    80
    75
    68

    由表中数据,求得线性回归方程为=-4x+.若在这些样本点中任取一点,则它在回归直线左下方的概率为________.
    答案 
    解析 由表中数据得=6.5,=80,由=-4+,得=106,故线性回归方程为=-4x+106.将(4,90),(5,84),(6,83),(7,80),(8,75),(9,68)分别代入回归方程,可知有6个基本事件,因84<-4×5+106=86,68<-4×9+106=70,故(5,84)和(9,68)在回归直线的左下方,满足条件的只有2个,故所求概率为=.

    15.在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2-附近波动.经计算xi=12,yi=14,x=23,则实数b的值为________.
    答案 
    解析 令t=x2,则曲线的回归方程变为线性的回归方程,即y=bt-,此时==,==,代入y=bt-,得=b×-,解得b=.
    16.为研究某种图书每册的成本费y(元)与印刷数x(千册)的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值.





    (xi-)2
    (xi-)
    ·(yi-)
    (ui-)2
    (ui-)
    ·(yi-)
    15.25
    3.63
    0.269
    2 085.5
    -230.3
    0.787
    7.049

    表中ui=,=i.
    (1)根据散点图判断:y=a+bx与y=c+哪一个更适宜作为每册成本费y(元)与印刷数x(千册)的回归方程类型?(只要求给出判断,不必说明理由)
    (2)根据(1)的判断结果及表中数据建立y关于x的回归方程;(回归系数的结果精确到0.01)
    (3)若每册书定价为10元,则至少应该印刷多少千册才能使销售利润不低于78 840元?(假设能够全部售出,结果精确到1)
    (附:对于一组数据(ω1,v1),(ω2,v2),…,(ωn,vn),其回归直线=+ω的斜率和截距的最小二乘估计分别为=,=- )
    解 (1)由散点图判断,y=c+适宜作为每册成本费y与印刷数x的回归方程.
    (2)令u=,先建立y关于u的线性回归方程,
    由于==≈8.957.
    ∴=-·=3.63-8.957×0.269≈1.22,
    ∴y关于u的线性回归方程为=1.22+8.96u,
    从而y关于x的线性回归方程为=1.22+.
    (3)假设印刷x千册,由题意,得10x-·x≥78.840.
    即8.78x≥87.8,∴x≥10,∴至少印刷10千册.

    • 精品推荐
    • 所属专辑

    免费资料下载额度不足,请先充值

    每充值一元即可获得5份免费资料下载额度

    今日免费资料下载份数已用完,请明天再来。

    充值学贝或者加入云校通,全网资料任意下。

    提示

    您所在的“深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载 10 份资料 (今日还可下载 0 份),请取消部分资料后重试或选择从个人账户扣费下载。

    您所在的“深深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载10份资料,您的当日额度已用完,请明天再来,或选择从个人账户扣费下载。

    您所在的“深圳市第一中学”云校通余额已不足,请提醒校管理员续费或选择从个人账户扣费下载。

    重新选择
    明天再来
    个人账户下载
    下载确认
    您当前为教习网VIP用户,下载已享8.5折优惠
    您当前为云校通用户,下载免费
    下载需要:
    本次下载:免费
    账户余额:0 学贝
    首次下载后60天内可免费重复下载
    立即下载
    即将下载:资料
    资料售价:学贝 账户剩余:学贝
    选择教习网的4大理由
    • 更专业
      地区版本全覆盖, 同步最新教材, 公开课⾸选;1200+名校合作, 5600+⼀线名师供稿
    • 更丰富
      涵盖课件/教案/试卷/素材等各种教学资源;900万+优选资源 ⽇更新5000+
    • 更便捷
      课件/教案/试卷配套, 打包下载;手机/电脑随时随地浏览;⽆⽔印, 下载即可⽤
    • 真低价
      超⾼性价⽐, 让优质资源普惠更多师⽣
    VIP权益介绍
    • 充值学贝下载 本单免费 90%的用户选择
    • 扫码直接下载
    元开通VIP,立享充值加送10%学贝及全站85折下载
    您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      充值到账1学贝=0.1元
      0学贝
      本次充值学贝
      0学贝
      VIP充值赠送
      0学贝
      下载消耗
      0学贝
      资料原价
      100学贝
      VIP下载优惠
      0学贝
      0学贝
      下载后剩余学贝永久有效
      0学贝
      • 微信
      • 支付宝
      支付:¥
      元开通VIP,立享充值加送10%学贝及全站85折下载
      您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      扫码支付0直接下载
      • 微信
      • 支付宝
      微信扫码支付
      充值学贝下载,立省60% 充值学贝下载,本次下载免费
        下载成功

        Ctrl + Shift + J 查看文件保存位置

        若下载不成功,可重新下载,或查看 资料下载帮助

        本资源来自成套资源

        更多精品资料

        正在打包资料,请稍候…

        预计需要约10秒钟,请勿关闭页面

        服务器繁忙,打包失败

        请联系右侧的在线客服解决

        单次下载文件已超2GB,请分批下载

        请单份下载或分批下载

        支付后60天内可免费重复下载

        我知道了
        正在提交订单

        欢迎来到教习网

        • 900万优选资源,让备课更轻松
        • 600万优选试题,支持自由组卷
        • 高质量可编辑,日均更新2000+
        • 百万教师选择,专业更值得信赖
        微信扫码注册
        qrcode
        二维码已过期
        刷新

        微信扫码,快速注册

        还可免费领教师专享福利「樊登读书VIP」

        手机号注册
        手机号码

        手机号格式错误

        手机验证码 获取验证码

        手机验证码已经成功发送,5分钟内有效

        设置密码

        6-20个字符,数字、字母或符号

        注册即视为同意教习网「注册协议」「隐私条款」
        QQ注册
        手机号注册
        微信注册

        注册成功

        下载确认

        下载需要:0 张下载券

        账户可用:0 张下载券

        立即下载
        账户可用下载券不足,请取消部分资料或者使用学贝继续下载 学贝支付

        如何免费获得下载券?

        加入教习网教师福利群,群内会不定期免费赠送下载券及各种教学资源, 立即入群

        即将下载

        2021高考数学一轮复习学案:第九章9.3变量间的相关关系、统计案例
        该资料来自成套资源,打包下载更省心 该专辑正在参与特惠活动,低至4折起
        [共10份]
        浏览全套
          立即下载(共1份)
          返回
          顶部
          Baidu
          map