年终活动
搜索
    上传资料 赚现金
    英语朗读宝

    变量间相关性专题训练

    变量间相关性专题训练第1页
    变量间相关性专题训练第2页
    变量间相关性专题训练第3页
    还剩20页未读, 继续阅读
    下载需要5学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    变量间相关性专题训练

    展开

    这是一份变量间相关性专题训练,共23页。
    ( )
    ①正方体的体积与棱长之间的关系;
    ②一块农田的水稻产量与施肥量之间的关系;
    ③商品销售收入与其广告费支出之间的关系;
    ④人体内的脂肪含量与年龄之间的关系.
    A.①②③ B.②③④
    C.①②④ D.①③④
    解:①由正方体的棱长和体积的公式可知,正方体的体积等于棱长的立方,所以①是确定的函数关系(此时可排除A、C、D,选B).易知②③④中变量间的关系均为不确定的相关关系.故选B.
    点 拨:
    要注意函数关系与相关关系的区别:函数关系是确定性关系,而相关关系是随机的、不确定的.
    变式1 (eq \a\vs4\al(2018春·红岗校级月考))儿子的身高和父亲的身高是 ( )
    A.确定性关系 B.相关关系
    C.函数关系 D.无任何关系
    解:由于儿子的身高和父亲的身高是不确定的关系,所以是相关关系.故选B.
    例2 (eq \a\vs4\al(2018春·镇安校级期中))下列说法中正确的是 .(填序号)
    ①相关关系是一种确定性关系;
    ②变量间的线性相关系数r的取值范围为[-1,1];
    ③变量间的线性相关系数r的绝对值越近接0,则变量间的线性相关程度越低;
    ④相关系数r与回归系数始终同号.
    解:根据题意,依次分析四个说法:
    对于①,在回归分析中,变量间的相关关系非函数关系,是一种不确定的关系,①错误;
    对于②,相关系数r满足|r|≤1,②正确;
    对于③,根据相关系数的性质:|r|≤1,且|r|越接近1,相关程度越大;|r|越接近0,相关程度越小,③正确;
    对于④,由r与b的计算公式知相关系数r与回归系数始终同号,④正确.故填②③④.
    点 拨:用相关系数r可以衡量两个变量之间的相关关系的强弱,r的绝对值越接近于1,表示两个变量的线性相关性越强,且r的正负即表示两个变量相关性的正负.相关系数的取值范围是[-1,1].
    变式2 (eq \a\vs4\al(2016·全国卷Ⅲ改编))下图是我国2008年至2014年生活垃圾无害化处理量的折线图.


    注:年份代码1~7分别对应年份2008~2014.,由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明.
    附注:
    参考数据:=9.32,=40.17,
    =0.55,eq \r(7)≈2.646.
    参考公式:
    相关系数r=.
    解:由折线图中数据和附注中参考数据得
    =4,=28,=0.55,
    =40.17-4×9.32=2.89,
    r≈eq \f(2.89,0.55×2×2.646)≈0.99.
    因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.
    考点二 散点图
    例3 (2018·四川模拟)某中学的兴趣小组在某座山上测得海拔高度(km)、气压(kPa)和沸点(℃)的六组数据绘制成的散点图如图所示,则下列说法错误的是 ( )



    A.沸点与海拔高度呈正相关
    B.沸点与气压呈正相关
    C.沸点与海拔高度呈负相关
    D.沸点与海拔高度、沸点与气压的相关性都很强
    解:由图1知气压随海拔高度的增加而减小,由图2知沸点随气压的升高而升高,所以沸点与气压呈正相关,B正确;沸点与海拔高度呈负相关,C正确,A错误;由于两个散点图中的点都成线性分布,所以沸点与海拔高度、沸点与气压的相关性都很强,D正确.故选A.
    点拨 除了相关系数外,散点图也可以判断两个变量的相关关系.点分布在从左下角到右上角的区域时,两个变量呈现正相关;点分布在从左上角到右下角的区域时,两个变量呈负相关.
    变式3 某次考试,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理分数对应如下表.
    绘出散点图如下.


    根据以上信息,判断下列结论:
    ①根据此散点图,可以判断数学成绩与物理成绩具有线性相关关系;
    ②根据此散点图,可以判断数学成绩与物理成绩具有一次函数关系;
    ③甲同学数学考了80分,那么,他的物理成绩一定比数学只考了60分的乙同学的物理成绩要高.
    其中正确的个数为( )
    A.0 B.1 C.2 D.3
    解:对于①,根据此散点图知,各点都分布在一条直线附近,可以判断数学成绩与物理成绩具有较强的线性相关关系,①正确;
    对于②,根据此散点图,可以判断数学成绩与物理成绩具有较强的线性相关关系,不是一次函数关系,②错误;
    对于③,甲同学数学考了80分,他的物理成绩可能比数学只考了60分的乙同学的物理成绩低,所以③错误.
    综上,正确的结论是①,只有1个.故选B.
    考点三 线性回归方程
    例4 (2018·湖南三模)已知变量x,y之间的线性回归方程为eq \(y,\s\up6(^))=-0.7x+10.3,且变量x,y之间的一组相关数据如表所示,则下列说法错误的是
    ( )
    A.变量x,y之间呈现负相关关系
    B.可以预测,当x=20时,y=-3.7
    C.m=4
    D.由表格数据可知,该回归直线必过点(9,4)
    解:对于A,根据b的正负即可判断正负相关关系,b=-0.7<0,负相关.
    对于B,当x=20时,代入可得y=-3.7.
    对于C,根据表中数据:x=eq \f(1,4)(6+8+10+12)=9,可得y=-0.7×9+10.3=4,即eq \f(1,4)(6+m+3+2)=4,解得m=5.
    对于D,线性回归方程一定过点(,),即(9,4).故选C.
    点拨 回归直线一定通过样本点的中心(,);中心相同的样本点的回归方程不一定相同.
    变式4 (2019·宜宾期末)《普通高中课程标准》指出,学科核心素养是育人价值的集中体现,并提出了数学学科的六个核心素养.某机构为了解学生核心素养现状,对某地高中学生数学运算素养x和数据分析素养y进行量化统计分析,得到如下统计数据.
    由表中数据,求得线性回归方程为eq \(y,\s\up6(^))=1.3x+eq \(a,\s\up6(^)),若该地区某中学生的数学运算能力为8,估计该中学生的数据分析能力为 ( )
    A.6 B.6.3 C.10.2 D.10.6
    解:=eq \f(2+3+4+5+6,5)=4,
    =eq \f(1.5+4.5+5.5+6.5+7,5)=5,
    则样本点的中心坐标为(4,5),
    代入eq \(y,\s\up6(^))=1.3x+eq \(a,\s\up6(^)),即5=1.3×4+eq \(a,\s\up6(^)),解得eq \(a,\s\up6(^))=-0.2,
    所以线性回归方程为eq \(y,\s\up6(^))=1.3x-0.2,
    把x=8代入线性回归方程eq \(y,\s\up6(^))=1.3x-0.2,得eq \(y,\s\up6(^))=10.2.
    故选C.
    例5 (2018·德阳模拟)某商家欲将购进的一批成本价为4元/件的商品卖出,为了对这种产品制定合理售价,将该产品按事先拟定的价格进行试销,得到如下6组数据.
    (1)若90≤x+y<100,就说产品“定价合理”,现从这6组数据中任意抽取2组数据,求这2组数据均为“定价合理”的概率;
    (2)求出y关于x的线性回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),预计在今后的销售中,销量与单价仍服从此关系,为了获得最大利润,该产品的销售单价应定为多少元?(利润=销售收入-成本,精确到0.1元)
    参考公式:
    ==,=-.
    解:(1)从这6组数据中任意抽取2组数据有15种情况,“定价合理”的有:8+90=98,8.2+84=92.2,8.4+83=91.4,从中任取2组有3种情况,
    则所求概率P=eq \f(3,15)=eq \f(1,5).
    (2)因为x=8.5,y=80,
    =0.7,=-14,
    则=eq \f(-14,0.7)=-20,=-=250.
    则y关于x的线性回归方程是y=-20x+250,
    利润函数L(x)=x(-20x+250)-4(-20x+250)=-20x2+330x-1 000,
    当x=-eq \f(330,2×(-20))=8.25时,L(x)取得最大值361.25,
    故当单价定为8.2元或8.3元时,可获得最大利润.
    评析 牢记求线性回归方程的步骤:第一步,列表;第二步,计算x,y,,或,;第三步,代入公式求,再利用=-求;第四步,写出回归方程.
    变式5 (2019·哈尔滨道里区校级三模) 某市出台了政策:自2020年1月1日起,在该市新登记并取得房屋不动产权证书的住房用于申请入学的,将不再对应一所学校,实施多校划片.有关部门调查了该市某名校对应学区内建筑面积不同的户型,得到了以下数据.
    (1)试建立房屋价格y关于房屋建筑面积x的线性回归方程;
    (2)若某人计划消费不超过100万元购置学区房,根据你得到的回归方程估计此人选房时建筑面积最大为多少?(保留到小数点后一位数字)
    参考公式:
    =,=-.
    解:(1)x=eq \f(1,4)×(80+100+120+140)=110,
    y=eq \f(1,4)×(120+150+170+200)=160,
    =eq \f(1 200+100+100+1 200,900+100+100+900)=1.3,
    =y-x=160-1.3×110=17,
    所以回归直线方程为eq \(y,\s\up6(^))=1.3x+17.
    (2)由题意令1.3x+17≤100,
    解得x≤63.8,
    所以估计此人选房时建筑面积最大为63.8平方米.
    考点四 回归分析
    例6 (2018·济宁高二下期末) 某种农作物可以生长在滩涂和盐碱地,它的灌溉是将海水稀释后进行灌溉.某实验基地为了研究海水浓度x(%)对亩产量y(吨)的影响,通过在试验田的种植实验,测得了该农作物的亩产量与海水浓度的数据如下表.
    绘制散点图发现,可以用线性回归模型拟合亩产量y(吨)与海水浓度x(%)之间的相关关系,用最小二乘法计算得y与x之间的线性回归方程为eq \(y,\s\up6(^))=-0.07x+eq \(a,\s\up6(^)).
    (1)求,m,n的值;
    (2)统计学中常用相关指数R2来刻画回归效果,R2越大,回归效果越好,如假设R2=0.85,就说明预报变量y的差异有85%是解释变量x引起的.请计算相关指数R2(精确到0.01),并指出亩产量的变化多大程度上是由浇灌海水浓度引起的?
    附:残差eq \(e,\s\up6(^))i=yi-i,相关指数R2=1-,其中=0.051.
    解:(1)因为=eq \f(1,5)(3+4+5+6+7)=5.
    =eq \f(1,5)(0.57+0.53+0.44+0.36+0.30)=0.44.
    所以0.44=-0.07×5+eq \(a,\s\up6(^)),即eq \(a,\s\up6(^))=0.79.
    所以线性回归方程为eq \(y,\s\up6(^))=-0.07x+0.79,
    所以eq \(y,\s\up6(^))3=-0.07×5+0.79=0.44,
    m=y3-eq \(y,\s\up6(^))3=0.44-0.44=0.
    eq \(y,\s\up6(^))4=-0.07×6+0.79=0.37,
    n=y4-eq \(y,\s\up6(^))4=0.36-0.37=-0.01.
    (2) =(-0.01)2+0.022+02+(-0.01)2+02=0.000 6.
    所以相关指数R2=1-eq \f(0.000 6,0.051)≈0.99.
    故亩产量的变化有99%是由海水浓度引起的.
    评析 用相关指数R2来刻画回归效果,R2越大,说明模型拟合的效果越好.另外,计算也不能出错.
    变式6 某工厂为研究某种产品产量x(吨)与所需某种原材料y(吨)的相关性,在生产过程中收集4组对应数据(x,y)如下表所示.(残差=真实值-预测值)
    根据表中数据,得出y关于x的线性回归方程为:=0.7x+a.据此计算出在样本(4,3)处的残差为-0.15,则表中m的值为 .
    解:由题意可得=3.15,则在(4,3)处3.15=0.7×4+a,所以a=0.35.
    产量x的平均值x=eq \f(1,4)(3+4+5+6)=4.5,
    则y=0.7 x+0.35,即eq \f(1,4)(9.5+m)=0.7×4.5+0.35,
    解得m=4.5.故填4.5.
    考点五 独立性检验
    例7 下列说法中正确的是 ( )
    ①独立性检验的基本思想是带有概率性质的反证法;
    ②独立性检验就是选取一个假设H0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H0的推断;
    ③独立性检验一定能给出明确的结论.
    A.①② B.①③ C.②③ D.①②③
    解:假设检验的基本思想是:“在一次试验中,小概率事件不可能发生”,若小概率事件发生了,则有理由认为原假设不成立,故①②正确,当小概率事件没有发生,则不能拒绝原假设但也不能够肯定原假设,此时结论不明确,③不正确.故选A.
    点拨 独立性检验的思想来自统计上的假设检验思想,它与反证法类似,它们都是先假设结论不成立,然后根据是否能推出“矛盾”来判定结论是否成立.但二者“矛盾”的含义不同,反证法中的“矛盾”是指不符合逻辑的事件发生;而假设检验中的“矛盾”是指不符合逻辑的小概率事件发生,即在结论不成立的假设下推出有利于结论成立的小概率事件的发生.
    变式7 (2019·海珠区期末)近年来随着我国在教育科研上的投入不断加大,科学技术得到迅猛发展,国内企业的国际竞争力得到大幅提升.某品牌公司一直默默拓展海外市场,在海外设了多个分支机构,现需要国内公司外派大量中青年员工.该企业为了解这两个年龄层员工是否愿意被外派工作的态度,按分层抽样的方式从中青年员工中随机调查了100位,得到数据如表:
    由K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))并参照附表,得到的正确结论是 ( )
    附表:
    A.在犯错误的概率不超过10%的前提下,认为“是否愿意外派与年龄有关”
    B.在犯错误的概率不超过10%的前提下,认为“是否愿意外派与年龄无关”
    C.有99%以上的把握认为“是否愿意外派与年龄有关”
    D.有99%以上的把握认为“是否愿意外派与年龄无关”
    解:根据列联表中的数据,计算
    K2=eq \f(100×(20×20-20×40)2,60×40×60×40)=eq \f(25,9)≈2.778>2.706,
    所以在犯错误的概率不超过10%的前提下,认为“是否愿意外派与年龄有关”.故选A.
    例8 (2018·贵州黔东南州联考)近年来我国电子商务行业迎来发展的新机遇,与此同时,相关管理部门推出了针对电商商品和服务的评价体系.现从评价系统中选出200次成功的交易,并对其评价进行统计,对商品好评率为eq \f(3,5),对服务好评率为eq \f(3,4),其中对商品和服务都做出好评的交易为80次.
    (1)是否可以在犯错误概率不超过0.1%的前提下,认为商品好评与服务好评有关?
    (2)若针对商品的好评率,采用分层抽样的方式从这200次交易中取出5次交易,并从中选择2次交易进行客户回访,求只有1次好评的概率.
    附:
    参考公式:
    K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),n=a+b+c+d.
    解:(1)由题意可得关于商品评价和服务评价的2×2列联表:
    所以K2=eq \f(200×(80×10-40×70)2,150×50×120×80)≈11.111>10.828,
    所以可以在犯错误概率不超过0.1%的前提下,认为商品好评与服务好评有关.
    (2)若针对商品的好评率,采用分层抽样的方式从这200次交易中取出5次交易,则好评的交易次数为3,不满意的次数为2.
    因此,只有1次好评的概率为eq \f(Ceq \\al(1,3)Ceq \\al(1,2),Ceq \\al(2,5))=eq \f(6,10)=eq \f(3,5).
    点拨 本题重点考查独立性检验、分层抽样及古典概型,这类题型在近年各地模拟题中出现频次较高.解独立性检验相关的应用题的关注点:
    ①两个明确:明确两类主体;明确研究的问题.
    ②两个准确:准确列出2×2列联表;准确理解K2.
    变式8 (2019·玉林期末)新高考的一大特点就是取消文理分科,除语文、数学、外语之外,从物理、化学、生物、政治、历史、地理这6科中自由选择三门科目作为选考科目.某研究机构为了了解学生对全理(选择物理、化学、生物)的选择是否与性别有关,决定从某学校高一年级的650名学生中随机抽取男生、女生各25人进行模拟选科.经统计,选择全理的人数比不选全理的人数多10人.
    (1)请完成下面的2×2列联表:
    (2)估计有多大把握认为“选择全理与性别有关”,并说明理由.
    附:K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),其中n=a+b+c+d.
    解:(1)设不选择全理的女生为x人,则选择全理的女生为(25-x)人,则有20+(25-x)=5+x+10.解得x=15.
    则可得列联表如下:
    (2)K2=eq \f(50×(20×15-10×5)2,30×20×25×25)=eq \f(25,3)≈8.333>7.879,
    所以有99.5%的把握认为“选择全理与性别有关”.

    课后作业
    1.(2018·内蒙古北京八中乌兰察布分校高二下期末)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是 ( )


    A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3
    C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3
    解:由给出的四组数据的散点图可以看出,图①和图③是正相关,相关系数大于0,图②和图④是负相关,相关系数小于0,图①和图②的点相对更加集中,所以相关性要强,所以r1接近于1,r2接近于-1,由此可得r2<r4<0<r3<r1.故选A.
    2.(2019·湖北期末)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为eq \(y,\s\up6(^))=0.85x-85.71,则下列结论中不正确的是 ( )
    A.y与x具有正的线性相关关系
    B.回归直线过样本点的中心(,)
    C.若该大学某女生身高增加2 cm,则其体重约增加1.70 kg
    D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
    解:根据y关于x的线性回归方程eq \(y,\s\up6(^))=0.85x-85.71,其中0.85>0,说明y与x具有正的线性相关关系,故A正确;
    回归直线过样本点的中心(,),故B正确;
    由线性回归方程知,若该大学某女生身高增加1 cm,则其体重约增加0.85 kg,那么,若该大学某女生身高增加2 cm,则其体重约增加1.70 kg,故C正确;
    若该大学某女生身高为170 cm,则可预测其体重约为58.79 kg,不可断定其体重必为58.79 kg,故D错误.故选D.
    3.(2018·兰州一中高二下期末)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:吨)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.

    有下列5个曲线类型:①y=bx+a;②y=ceq \r(x)+d;③y=p+qlnx;④y=k1+ek2x;⑤y=c1x2+c2,则较适宜作为年销售量y关于年宣传费x的回归方程的是 ( )
    A.①② B.②③ C.②④ D.③⑤
    解:从散点图知,样本点分布在开口向右的抛物线(上支)附近或对数曲线(在x轴上方部分)的附近,所以y=ceq \r(x)+d或y=p+qlnx较适宜.故选B.
    4.(长沙市一中2020届高三月考)假设有两个分类变量X和Y的2×2列联表:
    注:K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
    对同一样本,以下数据能说明X和Y有关系的可能性最大的一组为 ( )
    A.a=45,c=15 B.a=40,c=20
    C.a=35,c=25 D.a=30,c=30
    解:根据2×2列联表与独立性检验的应用问题,当eq \f(a,a+10)与eq \f(c,c+30)相差越大时,X与Y有关的可能性越大,逐一代入,知选项A符合.故选A.
    5.(2019·河南高二期末)下列说法:
    ①对于独立性检验,K2的观测值越大,说明两事件相关程度越大;
    ②以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=lny,将其变换后得到线性方程z=0.3x+4,则c,k的值分别是e4和0.3;
    ③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程y=a+bx中,b=2,=1,=3,则a=1;
    ④通过回归直线y=bx+a及回归系数b,可以精确反映变量的取值和变化趋势.
    上述结论正确的所有编号为 ( )
    A.①② B.②③ C.①②③ D.①②④
    解:对于①,根据独立性检验的性质知,K2的观测值越大,说明两个分类变量相关程度越大,①正确;
    对于②,由y=cekx,两边取自然对数,可得lny=lnc+kx,
    令z=lny,得z=kx+lnc,因为z=0.3x+4,所以eq \b\lc\{(\a\vs4\al\c1(lnc=4,,k=0.3,))则eq \b\lc\{(\a\vs4\al\c1(c=e4,,k=0.3,))②正确;
    对于③,回归直线方程y=a+bx中,a=-=3-2×1=1,③正确;
    对于④,通过回归直线y=bx+a及回归系数b,可估计和预测变量的取值和变化趋势,④错误.故选C.
    6.(2018·石家庄四县七校高二下期末)某同学用收集到的6组数据对(xi,yi)(i=1,2,3,4,5,6)制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线l1的方程:eq \(y,\s\up6(^))=
    eq \(b,\s\up6(^))1x+eq \(a,\s\up6(^))1,相关系数为r1,相关指数为Req \\al(2,1);经过残差分析确定点E为“离群点”(对应残差过大的点),把它去掉后,再用剩下的5组数据计算得到回归直线l2的方程:eq \(y,\s\up6(^))=eq \(b,\s\up6(^))2x+eq \(a,\s\up6(^))2,相关系数为r2,相关指数为Req \\al(2,2).则以下结论中,不正确的是 ( )


    A.r1>0,r2>0 B. eq \(b,\s\up6(^))1>0,eq \(b,\s\up6(^))2>0
    C. eq \(b,\s\up6(^))1>eq \(b,\s\up6(^))2 D.Req \\al(2,1)>Req \\al(2,2)
    解:从散点图中可以看出,两个变量是正相关,所以选项A是正确的;从图中可以看出,回归直线的斜率是正数,所以选项B和C是正确的;R2值越大,说明残差的平方和越小,也就是说模型的拟合效果越好,所以选项D是错误的.故选D.
    7.(2020·陕西高三月考)陕西关中的秦腔表演朴实、粗犷、细腻、深刻,再有电子布景的独有特效,深得观众喜爱.戏曲相关部门特意进行了“喜爱看秦腔”调查,发现年龄段与爱看秦腔的人数比存在较好的线性相关关系,年龄在[40,44],[45,49],[50,54],[55,59]的爱看人数比分别是0.10,0.18,0.20,0.30.现用各年龄段的中间值代表年龄段,如42代表[40,44].由此求得爱看人数比y关于年龄段x的线性回归方程为y=kx-0.418 8.那么,估计年龄在[60,64]的爱看人数比为( )

    解:由题,对数据进行处理,得出如下表格:
    求得=49.5,=0.195,因样本中心(,)过线性回归方程,将(,)代入y=kx-0.418 8,得k=0.012 4,即y=0.012 4x-0.418 8,年龄在[60,64]对应的x为62,将x=62代入y=0.012 4x-0.418 8得:y=0.012 4×62-0.418 8=0.35,估计爱看人数比为0.35.故选D.
    8.【多选题】(2020·山东高二期末)在统计中,由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)利用最小二乘法得到两个变量的回归直线方程为eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),那么下面说法正确的是 ( )
    A.直线eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点
    B.直线eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))必经过点(,)
    C.直线eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))表示最接近y与x之间真实关系的一条直线
    D.|r|≤1,且|r|越接近于1,x与y的相关程度越大;|r|越接近于0,x与y的相关程度越小
    解:A.直线eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))由点拟合而成,可以不经过任何样本点,故A错;
    B.直线eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))必过样本点中心即点(,),故B正确;
    C.直线eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))是采用最小二乘法求解出的直线方程,接近真实关系,故C正确;
    D.相关系数r的绝对值越接近于1,表示x与y的相关程度越大,越接近于0,x与y的相关程度越小,故D正确.故选BCD.
    9.为了搞好对外宣传工作,某国际峰会会务组选聘了50名记者担任对外翻译工作,则在下面“性别与会俄语”的2×2列联表中,a-b+d= .
    解:由2×2列联表得a+6=18,所以a=12,因为a+b=20,所以b=8,因为6+d=30,所以d=24,所以a-b+d=12-8+24=28.故填28.
    10.(2018·大观区校级模拟)已知一组数据确定的回归直线方程为eq \(y,\s\up6(^))=-1.5x+1,且y=4,发现两组数据(-1.7,2.9),(-2.3,5.1)误差较大,去掉这两组数据后,重新求得回归直线的斜率为-1,则此时,当x=-3,eq \(y,\s\up6(^))= .
    解:数据的样本中心点为(-2,4),
    去掉(-1.7,2.9),(-2.3,5.1)后,样本中心不变,
    重新求得的回归直线的斜率为-1,
    回归直线方程设为eq \(y,\s\up6(^))=-x+eq \(a,\s\up6(^)),代入(-2,4),求得eq \(a,\s\up6(^))=2,
    所以回归直线的方程为eq \(y,\s\up6(^))=-x+2,
    将x=-3代入回归直线方程求得eq \(y,\s\up6(^))=5.故填5.
    11.(2019·全国卷Ⅰ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
    (1)分别估计男、女顾客对该商场服务满意的概率;
    (2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?
    附:K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
    解:(1)由调查数据,男顾客中对该商场服务满意的比率为eq \f(40,50)=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.
    女顾客中对该商场服务满意的比率为eq \f(30,50)=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.
    (2)K2=eq \f(100×(40×20-30×10)2,50×50×70×30)=eq \f(100,21)≈4.762.
    由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.
    12.(2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.


    为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:eq \(y,\s\up6(^))=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:eq \(y,\s\up6(^))=99+17.5t.
    (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
    (2)你认为用哪个模型得到的预测值更可靠?并说明理由.
    解:利用模型①,该地区2018年的环境基础设施投资额的预测值为eq \(y,\s\up6(^))=-30.4+13.5×19=226.1(亿元).
    利用模型②,该地区2018年的环境基础设施投资额的预测值为eq \(y,\s\up6(^))=99+17.5×9=256.5(亿元).
    (2)利用模型②得到的预测值更可靠.
    理由如下:
    (Ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型eq \(y,\s\up6(^))=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
    (Ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
    以上给出了两种理由,写出其中任意一种或其他合理理由均可.
    13.(2019·河北模拟)全国两会召开前夕,许多人大代表关心雾霾治理,倡导绿色发展,击碎十面“霾伏”.通过不懈努力,近两年某市空气质量逐步改善,居民享受着在蓝天白云下出行和锻炼.PM2.5值是表示空气中某种颗粒物的浓度,通常用来代表空气的污染情况,这个值越高空气污染就越严重,下表是某人朋友圈内室外锻炼的人数与PM2.5值的一组数据.
    (1)请用相关系数r(精确到0.01)说明y与x之间具有线性相关关系;
    (2)若室外锻炼人数与PM2.5值存在线性关系,请根据上表提供的数据,估计PM2.5值为40时,室外锻炼人数(四舍五入).
    参考公式:
    ==,=-.
    参考数据: xi yi=39 200,x2i=34 600, y2i=50 250,eq \r(26)≈5.10,eq \r(250)≈15.81.
    解:(1)x=eq \f(1,5)×(110+100+80+60+50)=80,y=eq \f(1,5)×(90+95+100+105+110)=100,
    =eq \f(39 200-5×80×100,\r((34 600-5×802)×(50 250-5×1002)))
    =eq \f(-800,\r(2 600×250))≈eq \f(-80,5.1×15.81)≈-0.99.
    所以y与x之间具有较强的负线性相关关系.

    (2) = =eq \f(39 200-5×80×100,34 600-5×802)
    =eq \f(-800,2 600)=-eq \f(4,13)≈-0.31,
    =y-x=100+0.31×80=124.8.
    所以y关于x的线性回归方程为eq \(y,\s\up6(^))=-0.31x+124.8.
    当x=40时,eq \(y,\s\up6(^))=-0.31×40+124.8≈112.
    当PM2.5值为40时,室外锻炼人数估计为112人.
    附加题 (eq \a\vs4\al(2018·贵州模拟))某共享单车企业在A城市就“一天中一辆单车的平均成本与租用单车数量之间的关系”进行了调查,并将相关数据统计如下表.
    根据以上数据,研究人员设计了两种不同的回归分析模型,得到两个拟合函数:
    模型甲:(1)=eq \f(4.8,x)+0.8,模型乙:(2)=eq \f(6.4,x2)+1.6.
    (1)为了评价两种模型的拟合效果,完成以下任务:
    (Ⅰ)完成下表(计算结果精确到0.1元)[备注:=yi-yi^,称为相应于点(xi,yi)的残差];
    (Ⅱ)分别计算模型甲与模型乙的残差平方和Q1及Q2,并通过比较Q1,Q2的大小,判断哪个模型拟合效果更好.
    (2)这家企业在A城市投放共享单车后,受到广大市民的热烈欢迎并供不应求,于是该企业决定增加单车投放量.根据市场调查,市场投放量达到1万辆时,平均每辆单车一天能收入8元,6元的概率分别为0.6,0.4;市场投放量达到1.2万辆时,平均每辆单车一天能收入8元,6元的概率分别为0.4,0.6.若按(1)中拟合效果较好的模型计算一天中一辆单车的平均成本,问该企业投放量选择1万辆还是1.2万辆能获得更多利润?请说明理由.(利润=收入-成本)
    解:(1)(Ⅰ)经计算,可得下表:
    (Ⅱ)计算残差平方和Q1=0.12+0.12=0.02,Q2=0.12+(-0.2)2=0.05,
    因为Q1<Q2,故模型甲的拟合效果更好.
    (2)若投放量为1万辆,由(1)模型甲可知,
    每辆车的成本为eq \f(4.8,10)+0.8=1.28(元),
    这样一天获得的总利润为(8×0.6+6×0.4-1.28)×10 000=59 200(元),
    若投放量为1.2万辆,由(1)模型甲可知,
    每辆车的成本为eq \f(4.8,12)+0.8=1.2(元),
    这样一天获得的总利润为(8×0.4+6×0.6-1.2)×12 000=67 200(元),
    因为67 200>59 200,所以选择投放1.2万辆能获得更多利润.学生编号
    1
    2
    3
    4
    5
    6
    7
    8
    数学分数x
    60
    65
    70
    75
    80
    85
    90
    95
    物理分数y
    72
    77
    80
    84
    88
    90
    93
    95
    x
    6
    8
    10
    12
    y
    6
    m
    3
    2
    数学运算素养x
    2
    3
    4
    5
    6
    数据分析素养y
    1.5
    4.5
    5.5
    6.5
    7
    单价x/元
    8
    8.2
    8.4
    8.6
    8.8
    9
    销量y/件
    90
    84
    83
    80
    75
    68
    建筑面积/平方米
    80
    100
    120
    140
    价格/万元
    120
    150
    170
    200
    海水浓度x/%
    3
    4
    5
    6
    7
    亩产量y/吨
    0.57
    0.53
    0.44
    0.36
    0.30
    残差eq \(e,\s\up6(^))i
    -0.01
    0.02
    m
    n
    0
    x
    3
    4
    5
    6
    y
    2.5
    3
    4
    m
    类别
    愿意被外派
    不愿意被外派
    合计
    中年员工
    20
    20
    40
    青年员工
    40
    20
    60
    合计
    60
    40
    100
    P(K2≥k0)
    0.10
    0.01
    0.001
    k0
    2.706
    6.635
    10.828
    P(K2≥k0)
    0.10
    0.05
    0.025
    0.010
    0.005
    0.001
    k0
    2.706
    3.841
    5.024
    6.635
    7.879
    10.828
    满意度
    对服务好评
    对服务不满意
    合计
    对商品好评
    80
    40
    120
    对商品不满意
    70
    10
    80
    合计
    150
    50
    200
    类别
    选择全理
    不选择全理
    合计
    男生
    5
    女生
    合计
    P(K2≥k)
    0.15
    0.10
    0.05
    0.025
    0.010
    0.005
    0.001
    k
    2.072
    2.706
    3.841
    5.024
    6.635
    7.879
    10.828
    类别
    选择全理
    不选择全理
    合计
    男生
    20
    5
    25
    女生
    10
    15
    25
    合计
    30
    20
    50
    变量
    y1
    y2
    总计
    x1
    a
    10
    a+10
    x2
    c
    30
    c+30
    总计
    60
    40
    100
    年龄段x
    42
    47
    52
    57
    爱看人数比y
    0.10
    0.18
    0.20
    0.30
    类别
    会俄语
    不会俄语
    总计

    a
    b
    20

    6
    d
    总计
    18
    50
    满意度
    满意
    不满意
    男顾客
    40
    10
    女顾客
    30
    20
    P(K2≥k)
    0.050
    0.010
    0.001
    k
    3.841
    6.635
    10.828
    PM2.5值x
    110
    100
    80
    60
    50
    室外锻炼人数y(人)
    90
    95
    100
    105
    110
    一天中租用单车数量x(千辆)
    2
    3
    4
    5
    8
    一天中一辆单车平均成本y(元)
    3.2
    2.4
    2
    1.9
    1.5
    一天中租用单车数量x(千辆)
    2
    3
    4
    5
    8
    一天中一辆单车平均成本y(元)
    3.2
    2.4
    2
    1.9
    1.5
    模型甲
    估计值eq \(y,\s\up6(^))eq \\al((1),i)
    2.4
    2
    1.8
    1.4
    残差eq \\al((1),i)
    0
    0
    0.1
    0.1
    模型乙
    估计值
    eq \\al((2),i)
    2.3
    2
    1.9
    残差eq \\al((2),i)
    0.1
    0
    0
    一天中租用单车数量x(千辆)
    2
    3
    4
    5
    8
    一天中一辆单车平均成本y(元)
    3.2
    2.4
    2
    1.9
    1.5
    模型甲
    估计值
    eq \\al((1),i)
    3.2
    2.4
    2
    1.8
    1.4
    残差eq \\al((1),i)
    0
    0
    0
    0.1
    0.1
    模型乙
    估计值
    eq \\al((2),i)
    3.2
    2.3
    2
    1.9
    1.7
    残差eq \\al((2),i)
    0
    0.1
    0
    0
    -0.2

    相关其他

    直线方程专题训练:

    这是一份直线方程专题训练,共25页。

    数列求和专题训练:

    这是一份数列求和专题训练,共17页。

    椭圆专题训练:

    这是一份椭圆专题训练,共27页。

    欢迎来到教习网
    • 900万优选资源,让备课更轻松
    • 600万优选试题,支持自由组卷
    • 高质量可编辑,日均更新2000+
    • 百万教师选择,专业更值得信赖
    微信扫码注册
    qrcode
    二维码已过期
    刷新

    微信扫码,快速注册

    手机号注册
    手机号码

    手机号格式错误

    手机验证码 获取验证码

    手机验证码已经成功发送,5分钟内有效

    设置密码

    6-20个字符,数字、字母或符号

    注册即视为同意教习网「注册协议」「隐私条款」
    QQ注册
    手机号注册
    微信注册

    注册成功

    返回
    顶部
    Baidu
    map