专题30 回归分析(解答题)(新高考地区专用)(原卷版)
展开
这是一份专题30 回归分析(解答题)(新高考地区专用)(原卷版),共19页。
专题30 回归分析(解答题)1.2020年春节前后,一场突如其来的新冠肺炎疫情在武汉出现并很快地传染开来(已有证据表明2019年10月、11月国外已经存在新冠肺炎病毒),人传人,传播快,传播广,病亡率高,对人类生命形成巨大危害.在中华人民共和国,在中共中央、国务院强有力的组织领导下,全国人民万众一心抗击、防控新冠肺炎,疫情早在3月底已经得到了非常好的控制(累计病亡人数3869人).然而,国外因国家体制、思想观念与中国的不同,防控不力,新冠肺炎疫情越来越严重.据美国约翰斯·霍普金斯大学每日下午6时公布的统计数据,选取5月6日至5月10日的美国的新冠肺炎病亡人数如下表(其中t表示时间变量,日期“5月6日”、“5月7日”对应于“t=6"、“t=7",依次下去),由下表求得累计病亡人数与时间的相关系数r=0.98.(1)在5月6日~10日,美国新冠肺炎病亡人数与时间(日期)是否呈现线性相关性?(2)选择对累计病亡人数四舍五入后个位、十位均为0的近似数,求每日累计病亡人数y随时间t变化的线性回归方程;(3)请估计美国5月11日新冠肺炎病亡累计人数,请初步预测病亡人数达到9万的日期.附:回归方程中斜率和截距最小二乘估计公式分别为2.某湿地公园经过近十年的规划和治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的300个地块,并设计两种抽样方案,方案一:在该地区应用简单随机抽样的方法抽取30个作为样本区;依据抽样数据计算得到相应的相关系数;方案二:在该地区应用分层抽样的方法抽取30个作为样本区,调查得到样本数据(,2,…,30),其中和分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求方案二抽取的样本(,2,…,30)的相关系数(精确到0.01);并判定哪种抽样方法更能准确的估计.附:相关系数,;相关系数,则相关性很强,的值越大,相关性越强.3.根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图,如图所示.(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若,则线性相关程度很高,可用线性回归模型拟合);(2)求y关于x的回归方程,并预测当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少?附:相关系数公式.参考数据:,.回归方程中斜率和截距的最小二乘估计公式分别为,.4.垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化、减量化处理.某市为调查产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据,其中和分别表示第个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得,,,,.(1)请用相关系数说明该组数据中与之间的关系可用线性回归模型进行拟合;(2)求关于的线性回归方程,用所求回归方程预测该市10万人口的县城年垃圾产生总量约为多少吨?参考公式:相关系数,对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计分别为,.5.某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每件产品的非原料成本y(元)与生产该产品的数量x(千件)有关,经统计得到如下数据:x12345678y1126144.53530.5282524根据以上数据,绘制了散点图.观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型和指数函数模型分别对两个变量的关系进行拟合,(反比例函数模型可用转化为线性回归模型;指数函数模型可转化为和x的线性回归模型)现已求得用指数函数模型拟合的回归方程为,与x的相关系数;(1)用反比例函数模型求y关于x的回归方程;(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到0.01),并用其估计产量为10千件时每件产品的非原料成本.参考数据:,,,,,,(其中,参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘法估计分别为,相关系数6.某公司为了了解年研发资金投人量(单位:亿元)对年销售额(单位:亿元)的影响.对公司近年的年研发资金投入量和年销售额的数据,进行了对比分析,建立了两个函数模型:①,②,其中、、、均为常数,为自然对数的底数.并得到一些统计量的值.令,,经计算得如下数据: (1)请从相关系数的角度,分析哪一个模型拟合程度更好?(2)(ⅰ)根据(1)的选择及表中数据,建立关于的回归方程;(ⅱ)若下一年销售额需达到亿元,预测下一年的研发资金投入量是多少亿元?附:①相关系数,回归直线中公式分别为,;②参考数据:,,.7.经验表明,在室温下,开水冷至到(温水)饮用对身体更有益.某研究人员每隔测量一次开水温度(如下表),经过后的温度为.现给出以下2个函数模型:①;②,其中a为温度衰减比例,计算公式为.开水温度变化时间012345水温857975716865(1)请选择一个恰当的函数模型描述之间的关系,并求出k;(2)求a值(a保留0.01);(3)在室温下,开水至少大约放置多长时间(单位:,保留整数)才能冷至到对身体有益温度?(参考数据:,)8.年上半年,随着新冠肺炎疫情在全球蔓延,全球超过个国家或地区宣布进人紧急状态,部分国家或地区直接宣布“封国”或“封城”,随着国外部分活动进入停摆,全球经济缺乏活力,一些企业开始倒闭,下表为年第一季度企业成立年限与倒闭分布情况统计表:企业成立年份20192018201720162015企业成立年限12345倒闭企业数量(万家)5.284.723.582.702.15倒闭企业所占比例21.4%19.1%14.5%10.9%8.7%(1)由所给数据可用线性回归模型拟合与的关系,请用相关系数加以说明;(2)建立关于的回归方程,预测年成立的企业中倒闭企业所占比例.参考数据:,,,,相关系数,样本的最小二乘估计公式为,.9.个人所得税是国家对本国公民、居住在本国境内的个人的所得和境外个人来源于本国的所得征收的一种所得税我国在年月日,第五届全国人民代表大会第三次会议通过并公布了《中华人民共和国个人所得税法》公民依法诚信纳税是义务,更是责任现将自年至年的个人所得税收入统计如下:年份时间代号个税收入(千亿元)并制作了时间代号与个人所得税收入的如如图所示的散点图:根据散点图判断,可用①与②作为年个人所得税收入关于时间代号的回归方程,经过数据运算和处理,得到如下数据:表中,,,,参考数据:,.以下计算过程中四舍五入保留两位小数.(1)根据所给数据,分别求出①、②中关于的回归方程;(2)已知年个人所得税收人为千亿元,用年的数据验证(1)中所得两个回归方程,哪个更适宜作为关于时间代号的回归方程?(3)你还能从统计学哪些角度来进一步确认哪个回归方程更适宜?(只需叙述,不必计算)附:对于一组数据、、、,其回归直线的斜率和截距的最小二乘估计分别为,.10.2019年的“金九银十”变成“铜九铁十”,国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.如图是该地某小区2018年11月至2019年1月间,当月在售二手房均价(单位:万元平方米)的散点图.(图中月份代码1~13分别对应2018年11月~2019年11月)根据散点图选择和两个模型进行拟合,经过数据处理得到两个回归方程分别为和,并得到以下一些统计量的值: 0.0005910.0001640.006050(1)请利用相关指数判断哪个模型的拟合效果更好;(2)某位购房者拟于2020年4月购买这个小区平方米的二手房(欲购房为其家庭首套房).若购房时该小区所有住房的房产证均已满2但未满5年,请你利用(1)中拟合效果更好的模型解决以下问题:(1)估算该购房者应支付的购房金额;(购房金额房款税费,房屋均价精确到0.001万元平方米)(2)若该购房者拟用不超过100万元的资金购买该小区一套二手房,试估算其可购买的最大面积.(精确到1平方米)附注:根据有关规定,二手房交易需要缴纳若干项税费,税费是按房屋的计税价格(计税价格房款)进行征收的.房产证满2年但未满5年的征收方式如下:首套面积90平方米以内(含90平方米)为;首套面积90平方米以上且140平方米以内(含140平方米);首套面积140平方米以上或非首套为.参考数据:,,,,,,,.参考公式:相关指数.11.2020年初,武汉出现新型冠状病毒肺炎疫情,并快速席卷我国其他地区,口罩成了重要的防疫物资.某口罩生产厂不断加大投入,高速生产,现对其2月1日~2月9日连续9天的日生产量(单位:十万只,)数据作了初步处理,得到如图所示的散点图及一些统计量的值:2.7219139.091095注:图中日期代码1~9分别对应2月1日~2月9日;表中,.(1)从9个样本点中任意选取2个,在2个点的日生产量都不高于三十万只的条件下,求2个都高于二十万只的概率;(2)由散点图分析,样本点都集中在曲线的附近,请求y关于t的方程,并估计该厂从什么时候开始日生产量超过四十万只.参考公式:回归直线方程是,,.参考数据:.12.近年来,随着互联网的发展,诸如“滴滴打车”“神州专车”等网约车服务在我国各:城市迅猛发展,为人们出行提供了便利,但也给城市交通管理带来了一些困难.为掌握网约车在省的发展情况,省某调查机构从该省抽取了个城市,分别收集和分析了网约车的两项指标数,数据如下表所示: 城市1城市2城市3城市4城市5指标数指标数经计算得(1)试求与间的相关系数,并利用说明与是否具有较强的线性相关关系(若,则线性相关程度很高,可用线性回归模型拟合);(2)立关于的回归方程,并预测当指标数为时,指标数的估计值.附:相关公式:,参考数据:13.某省电视台为了解该省卫视一档成语类节目的收视情况,抽查东西两部各个城市,得到观看该节目的人数(单位:千人)如下茎叶图所示:其中一个数字被污损.(1)求东部各城市观看该节目观众平均人数超过西部各城市观看该节目观众平均人数的概率;(2)随着节目的播出,极大激发了观众对成语知识的学习积累的热情,从中获益匪浅.现从观看该节目的观众中随机统计了位观众的周均学习成语知识的时间(单位:小时)与年龄(单位:岁),并制作了对照表(如下表所示)年龄x(岁)周均学习成语知识时间y(小时)由表中数据,试求线性回归方程,并预测年龄为岁观众周均学习成语知识时间.参考公式:,.14.年月日,国家统计局公布全国规模以上工业企业月累计营业收入利润率数据如表:月份累计月月月月月月月月月月月份累计代码营业收入利润率(1)根据表中有关数据请在下图中补充完整与的折线图,判断与哪一个更适宜作为关于的回归方程类型,并说明理由;(2)根据(1)的判断结果及表中数据,建立关于的回归方程(系数精确到);(3)根据(2)得出的回归方程,预测月月累计营业收入利润率的值为多少?参考公式:对于一组数据、、、,其回归直线的斜率和截距的最小二乘估计分别为,.参考数据:表中,,.15.近年来,随着互联网的发展,“共享汽车”在我国各城市迅猛发展,为人们出行提供了便利,但也给城市交通管理带来了一些困难.为掌握“共享汽车”在省的发展情况,省某调查机构从该省抽取了5个城市,分别收集和分析了“共享汽车”的,两项指标数,,数据如下表所示: 城市1城市2城市3城市4城市5指标数46285指标数44354经计算得,.(1)试求与间的相关系数,并利用说明与是否具有较强的线性相关关系(若,则线性相关程度很高,可用线性回归模型拟合);(2)建立关于的回归方程,并预测当指标数为7时,指标数的估计值.附:相关公式:,,.参考数据:,.16.某项科研活动共进行了5次试验,其数据如下表所示:特征量第1次第2次第3次第4次第5次x258911y1210887(1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模型拟合y与x的关系?并指出是正相关还是负相关;(2)求特征量y关于x的回归方程,并预测当特征量x为12时特征量y的值.附:参考公式:相关系数,,.参考数据:.17.近年来,“双11”网购的观念逐渐深入人心.某人统计了近年某网站“双11”当天的交易额,统计结果如下表:年份20152016201720182019年份代码x12345交易额y/百亿元912172126(1)请根据上表提供的数据,用相关系数说明与的线性相关程度,线性相关系数保留三位小数.(统计中用相关系数来衡量两个变量之间线性关系的强弱.若相应于变量的取值,变量的观测值为(),则两个变量的相关系数的计算公式为.统计学认为,对于变量,如果,那么负相关很强;如果,那么正相关很强;如果或,那么相关性一般;如果,那么相关性较弱);(2)求出关于x的线性回归方程,并预测年该网站“双11”当天的交易额.参考公式:,;参考数据:.18.打好脱贫攻坚战,稳步实施乡村振兴,离不开农村基层党组织的坚强战斗堡垒作用的发挥.某村村党支部书记为改良盐碱地土壤,从省城请来专家进行技术指导,并从某农业大学引进富硒草莓.功夫不负有心人,富硒草莓种植成功,村里建起了草莓采摘园,到了年底,种植草莓的收入连同合作社的其他经营项目一起,成了贫困户的主要经济来源.该村对近几年草莓的采摘价格和采摘人数情况进行了统计,发现草莓的采摘价格(元/斤)和采摘人数(千人)的关系如下表:草莓采摘价格(元/斤)2025303540采摘人数(千人)5852453228(1)试根据上表中的数据求出与的相关系数,并判断与线性相关性的强弱().(2)(i)求出关于的线性回归方程;(ii)该村根据2020年草莓的产量,估计约需37千人采摘,那么2020年草莓的采摘价格应定为多少元/斤?(结果保留整数)参考公式:相关系数;回归直线方程中斜率和截距的最小二乘估计公式分别为,.19.我国为全面建设社会主义现代化国家,制定了从2021年到2025年的“十四五”规划.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备增加研发资金.现该企业为了了解年研发资金投入额(单位:亿元)对年盈利额(单位:亿元)的影响,研究了“十二五”和“十三五”规划发展期间近10年年研发资金投入额和年盈利额的数据.通过对比分析,建立了两个函数模型:①,②,其中,,,均为常数,为自然对数的底数.令,,经计算得如下数据:262156526805.36112501302.612(1)请从相关系数的角度,分析哪一个模型拟合程度更好?(2)(ⅰ)根据(1)的选择及表中数据,建立关于的回归方程;(系数精确到0.01)(ⅱ)若希望2021年盈利额为250亿元,请预测2021年的研发资金投入额为多少亿元?(结果精确到0.01)附:①相关系数,回归直线中:,②参考数据:,.20.近年来,共享单车进驻城市,绿色出行引领时尚.某公司计划对未开通共享单车的县城进行车辆投放,为了确定车辆投放量,对过去在其他县城的投放量情况以及年使用人次进行了统计,得到了投放量(单位:千辆)与年使用人次(单位:千次)的数据如下表所示,根据数据绘制投放量与年使用人次的散点图如图所示.(1)观察散点图,可知两个变量不具有线性相关关系,拟用对数函数模型或指数函数模型对两个变量的关系进行拟合,请问哪个模型更适宜作为投放量与年使用人次的回归方程类型(给出判断即可,不必说明理由),并求出关于的回归方程;(2)已知每辆单车的购入成本为元,年调度费以及维修等的使用成本为每人次元,按用户每使用一次,收费元计算,若投入辆单车,则几年后可实现盈利?参考数据:其中,.参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为,.21.某房产中介公司对2018年成都市前几个月的二手房成交量进行统计,表示2018年月该中介公司的二手房成交量,得到统计表格如下:123456781214202224202630(1)通过散点图初步分析可用线性回归模型拟合与的关系,请用相关系数加以说明;(计算结果精确到0.01);(2)该房产中介为增加业绩,决定针对二手房成交客户开展抽奖活动,若抽中“一等奖”获5千元奖金;抽中“二等奖”获3千元奖金;抽中“祝您平安”,则没有奖金.已知一次抽奖活动中获得“一等奖”的概率为,获得“二等奖”的概率为,现有甲、乙两个客户参与抽奖活动,假设他们是否中奖相互独立,求此二人所获奖金总额(千元)的分布列及数学期望.参考数据:,,,,.参考公式:相关系数.22.某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每批产品的非原料总成本(元)与生产该产品的数量(千件)有关,经统计得到如下数据:1234567611213466101196根据以上数据,绘制如图所示的散点图.观察散点图,两个变量不具有线性相关关系,现考虑用对数函数模型和指数函数模型分别对两个变量的关系进行拟合.(1)根据散点图判断,与(,均为大于零的常数)哪一个适宜作为非原料总成本关于生产该产品的数量的回归方程类型;(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表1中的数据,建立关于的回归方程;(3)已知每件产品的原料成本为10元,若该产品的总成本不得高于123470元,请估计最多能生产多少千件产品.参考数据:62.141.54253550.123.47其中,.参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为,.
相关试卷
这是一份专题28 导数及其应用(解答题)(新高考地区专用)(原卷版),共7页。试卷主要包含了已知函数,,已知函数,设函数,已知函数,其中等内容,欢迎下载使用。
这是一份专题31 独立性检验(解答题)(新高考地区专用)(原卷版),共12页。
这是一份专题26 双曲线(解答题)(新高考地区专用)(原卷版),共6页。试卷主要包含了已知双曲线等内容,欢迎下载使用。