![考点32 线性回归方程与列联表(练习) (解析版)第1页](http://m.enxinlong.com/img-preview/3/3/12279972/0/0.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![考点32 线性回归方程与列联表(练习) (解析版)第2页](http://m.enxinlong.com/img-preview/3/3/12279972/0/1.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![考点32 线性回归方程与列联表(练习) (解析版)第3页](http://m.enxinlong.com/img-preview/3/3/12279972/0/2.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
考点32 线性回归方程与列联表(练习) (解析版)
展开
这是一份考点32 线性回归方程与列联表(练习) (解析版),共17页。
考点32 回归方程与独立性检验【题组一 回归方程】1.为了比较甲、乙、丙三组数据的线性相关性的强弱,小郑分别计算了甲、乙、丙三组数据的线性相关系数,其数值分别为0.939,0.937,0.948,则( ).A.甲组数据的线性相关性最强,乙组数据的线性相关性最弱B.乙组数据的线性相关性最强,丙组数据的线性相关性最弱C.丙组数据的线性相关性最强,甲组数据的线性相关性最弱D.丙组数据的线性相关性最强,乙组数据的线性相关性最弱【答案】D【解析】因为线性相关系数越大则线性相关性越强,所以丙组数据的线性相关性最强,乙组数据的线性相关性最弱.故选:D2.下列命题正确的有( )①用相关指数来刻画回归效果,越小,说明模型的拟合效果越好;②若一组数据8,12,x,11,9的平均数是10,则其方差是2;③回归直线一定过样本点的中心();④若相关系数,则两个变量之间线性关系性强.A.1个 B.2个 C.3个 D.4个【答案】C【解析】用相关指数来刻画回归效果,越大,说明模型的拟合效果越好;所以①错误;若一组数据8,12,x,11,9的平均数是10,则,其方差是,所以②正确;回归直线方程一定过样本点的中心(),所以③正确;因为相关系数越大,两个变量之间线性关系性越强,因此若相关系数,则两个变量之间线性关系性强.即④正确故选:C3.有下列说法:①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适.②相关指数来刻画回归的效果,值越大,说明模型的拟合效果越好.③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.其中正确命题的个数是( )A.0 B.1 C.2 D.3【答案】D【解析】①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适,①正确.②相关指数来刻画回归的效果,值越大,说明模型的拟合效果越好,因此②正确.③比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好,③正确.综上可知:其中正确命题的是①②③.故选:D4.在2017年3月15日,某市物价部门对本市的5家商场的某种商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示:价格99.51010.511销售量1110865 由散点图可知,销售量与价格之间有较好的线性相关关系,其线性回归方程是:,则__________.【答案】40【解析】根据题意:,,,5.已知,取值如表: 画散点图分析可知:与线性相关,且求得回归方程为,则__________.【答案】【解析】计算=×(0+1+3+5+6)=3,=×(1+m+3m+5.6+7.4)=,∴这组数据的样本中心点是(3,),又y与x的线性回归方程=x+1过样本中心点,∴=1×3+1,解得m=.故填.6.2019年1月1日,“学习强国”学习平台在全国上线,“学习强国”学习平台是由中宣部主管,以习近平新时代中国特色社会主义思想和党的十九大精神为主要内容,立足全体党员,面向全社会的优质平台,某学校为响应国家号召,组织员工参与学习、答题,员工甲统计了自己学习积分与学习天数的情况:学习时间(第天)345678当天得分172019242427 先从这6组数据中选取4组数据求线性回归方程,再用剩下的2组数据进行检查.检查方法如下:先用求得的线性回归方程计算学习时间(第天)所对应的,再求与实际当天得分的差,若差值的绝对值都不超过1,则称所求方程是“恰当回归方程”.(1)间的6个数据中随机选取2个数据,求这2个数据不相邻的概率;(2)若选取的是前面4组数据,求关于的线性回归方程,并判断是否是“恰当回归方程”;附:回归直线的斜率和截距的最小二乘估计分别为:,,前四组数据的.【答案】(1)(2),是恰当回归方程.【解析】(1)设“从学习时间的6个数据中随机选取2个数据,求这2个数据不相邻”为事件,这6个数据为3,4,5,6,7,8.抽取2个数据的基本事件有,,,,,,,,,,,,,,,共15种,其中相邻的有,,,,,共5种,所以(2)前四组数据为:学习时间(第天)3456当天得分17201924,,,.当时,,此时成立,当时,,此时成立为恰当回归方程.7.某通信公司为了更好地满足消费者对5G流量的需求,准备推出一款流量包.该通信公司选了5个城市(总人数、经济发展情况、消费能力等方面比较接近)采用不同的定价方案作为试点,经过一个月的统计,发现该流量包的定价x:(单位:元/月)和购买人数y(单位:万人)的关系如表:流量包的定价(元/月)3035404550购买人数(万人)18141085 (1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模型拟合y与x的关系?(2)①求出y关于x的回归方程;②若该通信公司在一个类似于试点的城市中将这款流量包的价格定位25元/月,请用所求回归方程预测该市一个月内购买该流量包的人数能否超过20万人.参考数据:,,.参考公式:相关系数,回归直线方程,其中,【答案】(1),可以用线性回归方程模型拟合与的关系;(2)①②能.【解析】(1)根据题意,得,,可列表如下, 12345 -10-50510 73-1-3-6 -70-150-15-60 根据表格和参考数据,得,因而相关系数,由于很接近1,因而可以用线性回归方程模型拟合与的关系;(2)①,,因而关于的回归方程为,②由①可知,若,则,故若将流量包的价格定为25元/月,可预测该城市一个月内购买该流量包的人数会超过20万人.【题组二 非线性回归方程】1.已知某种农产品的日销量y与上市天数x之间满足的关系如下图所示.(I)根据散点图判断与哪一个更适合作为日销量y与上市天数x的回归方程类型;(给出判断即可,不必说明理由)(II)根据(I)中的结果,求日销量y与上市天数x的回归方程.参考公式:回归直线方程中的斜率和截距的最小二乘估计公式分别为:,.参考数据:55 其中.【答案】(I)更适合;(II)【解析】(I)更适合.(II)令,则.,,,所以.故y关于t的回归方程为,即日销量y与上市天数x的回归方程为.2.为了研究一种昆虫的产卵数y和温度x是否有关,现收集了7组观测数据列于下表中,并做出了散点图,发现样本点并没有分布在某个带状区域内,两个变量并不呈现线性相关关系,现分别用模型①与模型;②作为产卵数y和温度x的回归方程来建立两个变量之间的关系.温度x/℃20222426283032产卵数y/个61021246411332240048457667678490010241.792.303.043.184.164.735.77 26692803.571157.540.430.320.00012 其中,,,.附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,.(1)根据表中数据,模型①、②的相关指数计算分别为,,请根据相关指数判断哪个模型的拟合效果更好.(2)根据(1)中的判断,在拟合效果更好的模型下求y关于x的回归方程;并估计温度为30℃时的产卵数.(,,,与估计值均精确到小数点后两位)(参考数据:,,)【答案】(1)模型②的拟合效果更好;(2),当时,估计产卵数为.【解析】(1)因为,所以模型②的拟合效果更好.(2)由(1)知模型②的拟合效果更好,对于模型②:设,则,其中,.所以y关于x的回归方程为,当时,估计产卵数为.3.从年底开始,非洲东部的肯尼亚等国家爆发出了一场严重的蝗虫灾情.目前,蝗虫已抵达乌干达和坦桑尼亚,并向西亚和南亚等地区蔓延.蝗虫危害大,主要危害禾本科植物,能对农作物造成严重伤害,每只蝗虫的平均产卵数和平均温度有关,现收集了以往某地的组数据,得到下面的散点图及一些统计量的值.平均温度平均产卵数个 表中,.(1)根据散点图判断,与(其中为自然对数的底数)哪一个更适宜作为平均产卵数关于平均温度的回归方程类型?(给出判断即可,不必说明理由)并由判断结果及表中数据,求出关于的回归方程.(结果精确到小数点后第三位)(2)根据以往统计,该地每年平均温度达到以上时蝗虫会造成严重伤害,需要人工防治,其他情况均不需要人工防治,记该地每年平均温度达到以上的概率为.①记该地今后年中,恰好需要次人工防治的概率为,求取得最大值时相应的概率;②根据①中的结论,当取最大值时,记该地今后年中,需要人工防治的次数为,求的数学期望和方差.附:对于一组数据、、、,其回归直线的斜率和截距的最小二乘法估计分别为:,.【答案】(1)更适宜;;(2)①;②,.【解析】(1)由散点图可以判断,更适宜作为平均产卵数关于平均温度的回归类型,对两边取自然对数得,令,,,则.因为,,所以,关于的回归方程为,所以,关于的回归方程为;(2)①由,,且,当时,;当时,.所以,函数在区间上单调递增,在区间上单调递减,所以,函数在处取得极大值,亦即最大值,;②由①可知,当时,取最大值,又,则,由题意可知,,. 【题组三 独立性检验】1.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表: 优秀非优秀总计甲班10b 乙班c30 总计105 已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )参考公式:附表:P(K2≥k)0.0500.0100.001k3.8416.63510.828A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”【答案】C【解析】由题意知,成绩优秀的学生数是,成绩非优秀的学生数是,所以c=20,b=45,选项A,B错误;根据列联表中的数据,得到=≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C正确.故选:C.2.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,计算得,则认为“喜欢乡村音乐与性别有关系”的把握约为( )P()0.100.050.0250.0100.0050.0012.7063.8415.0246.6357.87910.828A.0.1% B.1% C.99.5% D.99.9%【答案】C【解析】∵K2=8.01>7.879,观测值同临界值进行比较可知,有99.5%的把握认为“喜欢乡村音乐与性别有关系”.故选C.3.下列说法中正确的有( )A.将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;B.设有一个线性回归方程,变量增加1个单位时,平均增加5个单位;C.设具有相关关系的两个变量,的相关系数为,则越接近于0,和之间的线性相关程度越弱;D.在一个列联表中,由计算得的值,在的前提下,的值越大,判断两个变量间有关联的把握就越大.【答案】ACD【解析】根据方差公式,可知将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变.故A正确; 变量增加一个单位时,平均减小5个单位,故B不正确; 设具有相关关系的两个变量,的相关系数为,则越接近于,和之间的线性相关程度越弱,故C正确; 在一个列联表中,由计算得的值,若,则有95%的把握判断两个变量间有相关关系,因此在的前提下,的值越大,判断两个变量间有关联的把握就越大,故D正确. 故选:ACD.4.为了研究昼夜温差与引发感冒的情况,医务人员对某高中在同一时间段相同温差下的学生感冒情况进行抽样调研,所得数据统计如表1所示,并将男生感冒的人数与温差情况统计如表2所示. 患感冒人数不患感冒人数合计男生3070100女生4258合计200 表1温差x678910男生感冒的人数y810142023 表2(1)写出的值; (2)判断是否有95%的把握认为在相同的温差下认为“性别”与“患感冒的情况”具有相关性;(3)根据表2数据,计算与的相关系数,并说明与的线性相关性强弱(若,则认为与线性相关性很强;,则认为与线性相关性一般;,则认为与线性相关性较弱).附:参考公式:,.0.250.150.100.0500.0250.0101.3232.0722.7063.8415.0246.635 ,,,.【答案】(1);(2)没有95%的把握认为在相同的温差下认为“性别”与“患感冒的情况”具有相关性;(3),与的线性相关性很强.【解析】(1)根据表中数据可得:.(2)依题意,所以没有95%的把握认为在相同的温差下认为“性别”与“患感冒的情况”具有相关性.(3)依题意,,所以,则故说明与的线性相关性很强.
相关试卷
这是一份高中人教A版 (2019)第八章 成对数据的统计分析8.3 分类变量与列联表课后复习题,共10页。试卷主要包含了3 列联表与独立性检验,013,,841<4等内容,欢迎下载使用。
这是一份人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.3 分类变量与列联表优秀综合训练题,文件包含专题37分类变量与列联表解析版doc、专题37分类变量与列联表原卷版doc等2份试卷配套教学资源,其中试卷共36页, 欢迎下载使用。
这是一份高端精品高中数学一轮专题-线性回归方程、相关系数、2x2列联表(练)(带答案)试卷,共8页。