终身会员
搜索
    上传资料 赚现金
    英语朗读宝

    艺术生高考数学专题讲义:考点51 变量间的相关关系与统计案例

    立即下载
    加入资料篮
    艺术生高考数学专题讲义:考点51 变量间的相关关系与统计案例第1页
    艺术生高考数学专题讲义:考点51 变量间的相关关系与统计案例第2页
    艺术生高考数学专题讲义:考点51 变量间的相关关系与统计案例第3页
    还剩10页未读, 继续阅读
    下载需要10学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    艺术生高考数学专题讲义:考点51 变量间的相关关系与统计案例

    展开

    这是一份艺术生高考数学专题讲义:考点51 变量间的相关关系与统计案例,共13页。试卷主要包含了相关关系,散点图,正相关与负相关,回归直线方程,相关系数,独立性检验等内容,欢迎下载使用。
    考点五十一  变量间的相关关系与统计案例知识梳理1相关关系常见的两变量之间的关系有两类:一类是函数关系另一类是相关关系.两者的区别是函数关系是一种确定的关系而相关关系是一种非确定的关系函数关系是一种因果关系而相关关系不一定是因果关系也可能是伴随关系.2散点图通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.3正相关与负相关从散点图上看点分布在从左下角到右上角的区域内两个变量的这种相关关系称为正相关点分布在左上角到右下角的区域内两个变量的相关关系为负相关.4回归直线方程(1)曲线拟合从散点图上,如果变量之间存在某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样的近似过程称为曲线拟合.(2)线性相关在两个变量xy的散点图中,若所有点看上去都在一条直线附近波动,则称变量间是线性相关,这条直线叫回归直线.若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是非线性相关.如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.(3)最小二乘法如果有n个点(x1y1)(x2y2)(xnyn),可以用[y1(abx1)]2[y2(abx2)]2[yn(abxn)]2来刻画这些点与直线yabx的接近程度,使得上式达到最小值的直线yabx就是所要求的直线,这种方法称为最小二乘法.(4)回归方程方程ybxa是两个具有线性相关关系的变量的一组数据(x1y1)(x2y2)(xnyn)的回归方程,其中ab是待定参数.说明:回归直线必过样本中心()但是样本数据不一定在回归直线上甚至可能所有的样本数据点都不在直线上.5相关系数相关系数r    r>0表明两个变量正相关r<0表明两个变量负相关r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.6独立性检验AB为两个变量,每一个变量都可以取两个值,变量AA1A21;变量BB1B212×2列联表:B1B2总计A1ababA2cdcd总计acbdnabcd构造一个随机变量χ2.利用随机变量χ2来判断两个分类变量有关系的方法称为独立性检验.χ22.706时,没有充分的证据判定变量AB有关联;χ2>2.706时,有90%的把握判定变量AB有关联;χ>3.841时,有95%的把握判定变量AB有关联;χ>6.635时,有99%的把握判定变量AB有关联.典例剖析题型 相关关系判断1 变量XY相对应的一组数据为(10,1)(11.3,2)(11.8,3)(12.5,4)(13,5);变量UV相对应的一组数据为(10,5)(11.3,4)(11.8,3)(12.5,2)(13,1)r1表示变量YX之间的线性相关系数,r2表示变量VU之间的线性相关系数,则________r2<r1<0      0<r2<r1       r2<0<r1      r2r1答案 解析 对于变量YX而言,YX的增大而增大,故YX正相关,即r1>0;对于变量VU而言,VU的增大而减小,故VU负相关,即r2<0,所以有r2<0<r1变式训练  四名同学根据各自的样本数据研究变量xy之间的相关关系并求得回归直线方程分别得到以下四个结论:yx负相关且2.347x6.423   yx负相关且=-3.476x5.648yx正相关且5.437x8.493   yx正相关且=-4.326x4.578.其中一定不正确的结论的序号是________答案 ①④解析  由回归直线方程x知当>0xy正相关<0xy负相关所以①④一定错误.解题要点  判断变量之间有无相关关系一种简便可行的方法就是绘制散点图根据散点图很容易看出两个变量之间是否具有相关性是不是存在线性相关关系是正相关还是负相关相关关系是强还是弱.题型二  回归分析2 已知xy取值如下表: x014568y1.31.85.66.17.49.3从所得的散点图分析可知:yx线性相关,且0.95xa,则a________答案  1.45解析  45.250.95xa()5.250.95×4a,得a1.45.变式训练  已知xy之间的一组数据:x0123ym35.57已求得关于yx的线性回归方程2.1x0.85,则m的值为________答案  0.5解析  ,把()代入线性回归方程,2.1×0.85m0.5.解题要点  回归直线方程x必过样本点中心().利用这一结论可以快速求出回归方程中的参数3 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x()与相应的生产能耗y(吨标准煤)的几组对照数据.x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程x(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:3×2.54×35×46×4.566.5)解析  (1)由题意,作散点图如图.(2)由对照数据,计算得iyi66.532425262864.53.50.73.50.7×4.50.35所以回归方程为0.7x0.35.(3)x100时,y100×0.70.3570.35(吨标准煤),预测生产100吨甲产品的生产能耗比技改前降低9070.3519.65(吨标准煤)变式训练  (2015新课标)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量(单位:t)和年利润z(单位:千元)的影响,对近8年的宣传费和年销售量数据作了初步处理,得到下面的散点图及一些统计量的值.(xi)2(wi)2(xi(yi)(wi(yi)46.65636.8289.81.61 469108.8表中wii.(I)根据散点图判断,yabxycd哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)(II)根据(I)的判断结果及表中数据,建立y关于x的回归方程;(III)已知这种产品的年利润zxy的关系为z0.2yx.根据(II)的结果回答下列问题:(i)当年宣传费时,年销售量及年利润的预报值时多少?(ii)当年宣传费为何值时,年利润的预报值最大?附:对于一组数据(u1v1)(u2v2)(unvn),其回归直线vαβu的斜率和截距的最小二乘估计分别为 .解析  (I)由散点图可以判断,ycd适宜作为年销售量y关于年宣传费x的回归方程类型.(II)w,先建立y关于w的线性回归方程,由于6856368×6.8100.6所以y关于w的线性回归方程为100.668w,因此y关于x的回归方程为100.668.(III)(i)(II)知,当x49时,年销售量y的预报值100.668576.6年利润z的预报值576.6×0.24966.32.(ii)根据(II)的结果知,年利润z的预报值0.2(100.668)x=-x13.620.12.所以当6.8,即x46.24时, 取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.解题要点  (1)正确运用计算ba的公式和准确的计算,是求线性回归方程的关键.(2)分析两变量的相关关系,可由散点图作出判断,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.(3) 求解回归方程关键是确定回归系数因求解的公式计算量太大一般题目中给出相关的量xxiyi便可直接代入求解.充分利用回归直线过样本中心点()即有y可确定.题型  相关分析4 有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表: 优秀非优秀总计甲班10b 乙班c30 总计  105已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是________                                                                                                                                                       列联表中c的值为30b的值为35                                                                                                                                                       列联表中c的值为15b的值为50                                                                                                                                                       根据列联表中的数据,若按95%的可靠性要求,能认为成绩与班级有关系                                                                                                                                                       根据列联表中的数据,若按95%的可靠性要求,不能认为成绩与班级有关系答案  解析  由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c20b45,选项AB错误.根据列联表中的数据,得到χ2≈6.1093.841,因此有95%的把握认为成绩与班级有关系变式训练  在研究色盲与性别的关系调查中,调查了男性480人,其中有38人患色盲,调查的520名女性中,有6人患色盲.(1)根据以上数据建立一个2×2列联表;(2)若认为性别与患色盲有关系,求出错的概率.解析  (1)2×2列联表如下: 患色盲不患色盲总计384424806514520总计449561 000(2)假设H0性别与患色盲没有关系,根据(1)2×2列联表中数据,可求得χ227.14P(χ210.828)0.001,即H0成立的概率不超过0.001,故若认为性别与患色盲有关系,则出错的概率为0.1%.解题要点  (1)独立性检验的关键是正确列出2×2列联表,并计算出χ2的值.(2)弄清判断两变量有关的把握性与犯错误概率的关系,根据题目要求作出正确的回答.当堂练习1(2015湖北文)已知变量xy满足关系y=-0.1x1,变量yz正相关.下列结论中正确的是________xy正相关,xz负相关    xy正相关,xz正相关xy负相关,xz负相关    xy负相关,xz正相关答案 解析 因为y=-0.1x1,-0.1<0,所以xy负相关.又yz正相关,故可设zayb(a>0),所以z=-0.1axab,-0.1a<0,所以xz负相关.2(2014·湖北卷) 根据如下样本数据 x345678y4.02.50.50.52.03.0得到的回归方程为bxa,则________a0b0      a0b0    a0b0    a0b0答案  解析  作出散点图如下:由图象不难得出,回归直线bxa的斜率b<0,截距a>0,所以a>0b<03. 通过随机询问110名大学生是否爱好某项运动,得到如下列联表: 总计爱好402060不爱好203050总计6050110K2,得K27.8.附表:P(K2k)0.0500.0100.001k3.8416.63510.828参照附表,得到的正确结论是________       99%以上的把握认为爱好该项运动与性别有关       99%以上的把握认为爱好该项运动与性别无关       在犯错误的概率不超过0.1%的前提下,认为爱好该项运动与性别有关     在犯错误的概率不超过0.1%的前提下,认为爱好该项运动与性别无关答案  解析  因为7.8>6.635,所以选项正确.4.下列有关样本相关系数的说法不正确的是________相关系数用来衡量变量xy之间的线性相关程度|r|1,且|r|越接近于1,相关程度越大|r|1,且|r|越接近0,相关程度越小|r|1,且|r|越接近1,相关程度越小答案 5.两个相关变量满足如下关系:x1015202530y1 0031 0051 0101 0111 014则两变量的回归方程为________答案 0.56x997.4解析 回归直线经过样本中心点(20,1 008.6),经检验只有选项A符合题意.课后作业一、    填空1.在一组样本数据(x1y1)(x2y2)(xnyn)(n2x1,x2,…,xn不全相等)的散点图中,若所有样本点(xiyi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为_____答案  1解析  根据相关系数的定义可知,当所有样本点都在直线上时,相关系数为12设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xiyi)(i=12n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是______yx具有正的线性相关关系回归直线过样本点的中心()若该大学某女生身高增加1cm,则其体重约增加0.85kg若该大学某女生身高为170cm,则可断定其体重必为58.79kg答案  解析  由回归方程为=0.85x-85.71的增大而增大,所以yx具有正的线性相关关系,由最小二乘法建立的回归方程得过程知,所以回归直线过样本点的中心(),利用回归方程可以预测估计总体,所以不正确.3(2015新课标II)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是________     逐年比较,2008年减少二氧化硫排放量的效果最显著     2007年我国治理二氧化硫排放显现成效2006年以来我国二氧化硫年排放量呈减少趋势2006年以来我国二氧化硫年排放量与年份正相关答案 解析 2006年,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,选项正确;2007年二氧化硫排放量较2006年降低了很多,选项正确;虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减趋势,即选项正确;自2006年以来我国二氧化硫年排放量与年份负相关,选项错误,故选4下面是一个2×2列联表 y1y2总计x1a2173x2222547合计b46120其中ab处填的值分别为________答案 52 74解析 由a2173,得a52a22b,得b745为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算K28.01,则认为喜欢乡村音乐与性别有关系的把握性约为________ P(K2k0)0.1000.0500.0250.0100.001k02.7063.8415.0246.63510.828答案  99%解析  因为K28.01>6.635,所以有99%以上的把握认为喜欢乡村音乐与性别有关系”.6.下表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x()与相应的生产能耗y()的几组对应数据:x3456y2.5t44.5根据上表提供的数据,求出y关于x的线性回归方程为0.7x0.35,那么表中t的值为________答案  3 解析  0.70.350.7×0.353.5t3.7(2014·江西卷)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是________             1                            表2     成绩性别 不及格及格总计61420102232总计163652   视力性别 总计41620122032总计163652                 3                             表4    智商性别 偏高正常总计8122082432总计163652   阅读量性别 丰富不丰富总计1462023032总计163652答案  阅读量解析  通过计算可得,表1中的χ20.009,表2中的χ21.769,表3中的χ21.300,表4中的χ223.4818已知某车间加工零件的个数x与所花费时间y(h)之间的线性回归方程为0.01x0.5,则加工600个零件大约需要的时间为________答案  6.5 h解析  600代入线性回归方程0.01x0.5中得需要的时间为6.5 h.9.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表: 理科文科合计13102372027合计203050已知P(K23.841)0.05P(K25.024)0.025.根据表中数据,得到K2的观测值k4.844,则认为选修文科与性别有关系出错的可能性约为________答案 5%解析 由K2的观测值k4.844>3.841,故认为选修文科与性别有关系出错的可能性约为5%.10.考古学家通过始祖鸟化石标本发现:其股骨长度x(cm)与肱骨长度y(cm)的线性回归方程为1.197x3.660,由此估计,当股骨长度为50 cm时,肱骨长度的估计值为________cm.答案  56.19解析  根据回归方程1.197x3.660,将x50代入,得y56.19,则肱骨长度的估计值为56.19 cm.11.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线的回归方程为________答案  1.23x0.08解析  设回归直线方程为1.23xa,由题意得:51.23×4a,得a0.08,故回归方程为1.23x0.08.二、解答题12 (2013·重庆文)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i80i20iyi184720.(1)求家庭的月储蓄y对月收入x的线性回归方程ybxa(2)判断变量xy之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程ybxa中,bab,其中为样本平均值,线性回归方程也可写为x.解析  (1)由题意知n10i8i2n272010×8280iyin 18410×8×224由此得b0.3ab20.3×8=-0.4故所求回归方程为0.3x0.4.(2)由于变量y的值随x的值增加而增加(b0.3>0),故xy之间是正相关.(3)x7代入回归方程可以预测该家庭的月储蓄约为y0.3×70.41.7千元.13.近年空气质量逐步恶化,雾霾天气现象出现增多,大气污染危害加重,大气污染可引起心悸,呼吸困难等心肺疾病,为了解某市心肺疾病是否与性别有关,在某医院随机对入院50人进行了问卷调查,得到了如下的列联表. 患心肺疾病不患心肺疾病合计20525101525合计302050(1)用分层抽样的方法在患心肺疾病的人群中抽6人,其中男性抽多少人?(2)为了研究心肺疾病是否与性别有关,请计算出统计量K2,并回答有多大把握认为心肺疾病与性别有关?P(K2k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828参考公式:K2,其中nabcd.解析  (1)在患心肺疾病人群中抽6人,则抽取比例为男性应该抽取20×4人.(2)K28.333,且P(K27.879)0.0050.5%,所以有99.5%的把握认为患心肺疾病与性别有关系.

    相关试卷

    艺术生高考数学专题讲义:考点48 事件与概率:

    这是一份艺术生高考数学专题讲义:考点48 事件与概率,共10页。试卷主要包含了随机事件和确定事件,频率与概率,事件的关系与运算,概率的几个基本性质,互斥事件与对立事件的区别与联系等内容,欢迎下载使用。

    艺术生高考数学专题讲义:考点42 椭圆:

    这是一份艺术生高考数学专题讲义:考点42 椭圆,共10页。试卷主要包含了椭圆的概念,椭圆的标准方程和几何性质,点P和椭圆的关系,椭圆中的弦长公式,椭圆中点弦有关的结论,设F1,F2分别是椭圆C,已知椭圆E等内容,欢迎下载使用。

    艺术生高考数学专题讲义:考点40 圆的方程:

    这是一份艺术生高考数学专题讲义:考点40 圆的方程,共7页。试卷主要包含了圆的定义等内容,欢迎下载使用。

    欢迎来到教习网
    • 900万优选资源,让备课更轻松
    • 600万优选试题,支持自由组卷
    • 高质量可编辑,日均更新2000+
    • 百万教师选择,专业更值得信赖
    微信扫码注册
    qrcode
    二维码已过期
    刷新

    微信扫码,快速注册

    手机号注册
    手机号码

    手机号格式错误

    手机验证码 获取验证码

    手机验证码已经成功发送,5分钟内有效

    设置密码

    6-20个字符,数字、字母或符号

    注册即视为同意教习网「注册协议」「隐私条款」
    QQ注册
    手机号注册
    微信注册

    注册成功

    返回
    顶部
    Baidu
    map