搜索
      上传资料 赚现金

      (艺考基础)新高考数学一轮复习精讲精练第03讲 成对数据的统计分析 (高频考点,精讲)(2份,原卷版+解析版)

      • 2.18 MB
      • 2025-03-04 23:59:59
      • 67
      • 0
      • M.T.杨
      加入资料篮
      立即下载
      查看完整配套(共2份)
      包含资料(2份) 收起列表
      原卷
      (艺考基础)新高考数学一轮复习精讲精练第03讲 成对数据的统计分析 (高频考点,精讲)(原卷版).doc
      预览
      解析
      (艺考基础)新高考数学一轮复习精讲精练第03讲 成对数据的统计分析 (高频考点,精讲)(解析版).doc
      预览
      正在预览:(艺考基础)新高考数学一轮复习精讲精练第03讲 成对数据的统计分析 (高频考点,精讲)(原卷版).doc
      (艺考基础)新高考数学一轮复习精讲精练第03讲 成对数据的统计分析 (高频考点,精讲)(原卷版)第1页
      高清全屏预览
      1/28
      (艺考基础)新高考数学一轮复习精讲精练第03讲 成对数据的统计分析 (高频考点,精讲)(原卷版)第2页
      高清全屏预览
      2/28
      (艺考基础)新高考数学一轮复习精讲精练第03讲 成对数据的统计分析 (高频考点,精讲)(原卷版)第3页
      高清全屏预览
      3/28
      (艺考基础)新高考数学一轮复习精讲精练第03讲 成对数据的统计分析 (高频考点,精讲)(解析版)第1页
      高清全屏预览
      1/40
      (艺考基础)新高考数学一轮复习精讲精练第03讲 成对数据的统计分析 (高频考点,精讲)(解析版)第2页
      高清全屏预览
      2/40
      (艺考基础)新高考数学一轮复习精讲精练第03讲 成对数据的统计分析 (高频考点,精讲)(解析版)第3页
      高清全屏预览
      3/40
      还剩25页未读, 继续阅读

      (艺考基础)新高考数学一轮复习精讲精练第03讲 成对数据的统计分析 (高频考点,精讲)(2份,原卷版+解析版)

      展开

      这是一份(艺考基础)新高考数学一轮复习精讲精练第03讲 成对数据的统计分析 (高频考点,精讲)(2份,原卷版+解析版),文件包含艺考基础新高考数学一轮复习精讲精练第03讲成对数据的统计分析高频考点精讲原卷版doc、艺考基础新高考数学一轮复习精讲精练第03讲成对数据的统计分析高频考点精讲解析版doc等2份试卷配套教学资源,其中试卷共68页, 欢迎下载使用。
      第一部分:知识点精准记忆
      第二部分:典型例题剖析
      题型一:成对数据的相关性
      题型二:回归分析
      角度1:经验回归方程及应用
      角度2:非线性经验回归方程及应用
      角度3:相关系数
      角度4:残差分析
      题型三:列联表与独立性检验
      第一部分:知 识 点 精 准 记 忆
      知识点一:变量的相关关系
      (1)两个变量有关系,但又没有确切到可由其中一个去精确地决定另一个的程度,这种关系称为相关关系.
      (2)正相关、负相关
      从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.
      (3)线性相关、非线性相关
      一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
      一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
      知识点二:样本相关系数
      (1)相关系数的计算
      变量与变量的样本相关系数的计算公式如下:
      (2)相关系数的性质
      ①当时,称成对样本数据正相关;当时,称成对样本数据负相关.
      当时,成对样本数据间没有线性相关关系.
      ②样本相关系数的取值范围为,当越接近1时,成对样本数据的线性相关程度越强;当越接近0时,成对样本数据的线性相关程度越弱.
      知识点三:一元线性回归模型
      (1)数学表述式:如果两个变量之间的关系可以表示为
      我们称该式为关于的一元线性回归模型.
      其中,称为因变量或响应变量,称为自变量或解释变量;和为模型的未知参数,称为截距参数,称为斜率参数;是与之间的随机误差.
      (2)经验回归方程
      我们将称为关于的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,其中
      (3)利用刻画回归效果
      的计算公式为,其意义是越大,残差平方和越小,即模型的拟合效果越好;越小,残差平方和越大,即模型的拟合效果越差.
      知识点四:列联表与独立性检验
      (1)2×2列联表
      如图,给出成对分类变量数据的交叉分类频数的数据统计表称为2×2列联表.
      (2)独立性检验
      依据上述列联表构造统计量
      利用的取值推断分类变量和是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验.
      常用的小概率值和临界值表
      第二部分:典 型 例 题 剖 析
      题型一:成对数据的相关性
      典型例题
      例题1.(2022·全国·高三专题练习)某统计部门对四组数据进行统计分析后,获得如图所示的散点图.
      下面关于相关系数的比较,正确的是( )
      A.B.C.D.
      【答案】C
      【详解】由图可知:所对应的图中的散点呈现正相关 ,而且对应的相关性比对应的相关性要强,故,所对应的图中的散点呈现负相关,且根据散点的分布情况可知,因此,
      故选:C
      例题2.(2022·北京·高二期末)对变量、由观测数据得散点图,对变量、由观测数据得散点图.由这两个散点图可以判断( )
      A.变量与负相关,与正相关
      B.变量与负相关,与负相关
      C.变量与正相关,与正相关
      D.变量与正相关,与负相关
      【答案】B
      【详解】由散点图可知,变量与负相关,变量与正相关,所以,与负相关.
      故选:B.
      例题3.(2022·全国·高三专题练习)对于,两变量,有四组样本数据,分别算出它们的线性相关系数(如下),则线性相关性最强的是( )
      A.-0.82B.0.78C.-0.69D.0.87
      【答案】D
      【详解】由相关系数的绝对值越大,变量间的线性相关性越强知:各选项中的绝对值最大.
      故选:D
      同类题型归类练
      1.(2022·全国·高三专题练习)在下列4组样本数据的散点图中,样本相关系数最小的是( )
      A.B.C.D.
      【答案】B
      【详解】由散点图变化趋势可知,,,,,
      又第2组散点图中的散点更为集中,更接近于一条直线,
      所以,
      故样本相关系数最小的是.
      故选:B.
      2.(多选)(2022·福建三明·高二期末)已知5个成对数据(x,y)的散点图如下,若去掉点D(4,3),则下列说法正确的是( )
      A.变量x与变量y呈负相关B.变量x与变量y的相关性变强
      C.残差平方和变小D.样本相关系数r变大
      【答案】ABC
      【详解】由散点图可知,去掉点D后,与的线性相关加强,且为负相关,所以AB正确,
      由于与的线性相关加强,所以残差平方和变小,所以C正确,
      由于与的线性相关加强,且为负相关,所以相关系数的绝对值变大,而相关系数为负的,所以样本相关系数r变小,所以D错误,
      故选:ABC
      3.(2022·全国·高一课时练习)下列散点图中,两个变量之间存在正相关的散点图的序号为______.
      【答案】(2)(4)
      【详解】由散点图可知:(1)(3)的散点呈左上到右下分布,故为负相关,
      (2)(4)的散点呈左下到右上,故为正相关.
      故答案为:(2)(4)
      题型二:回归分析
      角度1:经验回归方程及应用
      典型例题
      例题1.(2022·四川成都·高三期中(文))某单位为了了解办公楼用电量(度)与气温之间的关系,随机统计了四个工作日用电量与当天平均气温,如下表:
      由表中数据得到线性回归方程为,当气温为时,预测用电量为( )
      A.68度B.67度C.66度D.52度
      【答案】A
      【详解】由表中数据可知:,,
      因为回归方程为过样本中心,所以,
      所以当时,.
      故选:A.
      例题2.(2022·贵州·高三阶段练习(文))某农科所调研得出农作物近五年的销售单价(单位:元/公斤)如下表.
      经计算,关于的回归直线方程为,则估计2025年该农作物的单价为___________元/公斤.
      【答案】
      【详解】因为据线性回归方程过样本中心点,
      所以有,即,
      把代入,得,
      故答案为:
      例题3.(2022·河南·高二期末(文))2021年是中国加入世界贸易组织20周年,“入世”是中国对外开放的一个里程碑,中国已经连续11年成为货物贸易出口第一大国,经济全球化是历史潮流,大势所趋.“入世”20年,中国的发展证明,世界经济离不开中国,中国发展也离不开世界.下表是中国2016~2020这5年来的国内生产总值(GDP)数据,已知年份代码和国内生产总值呈线性相关关系.
      (1)求年份代码和国内生产总值的回归直线方程
      (2)预测2022年的国内生产总值.
      参考数据:.参考公式:线性回归方程中,.
      【答案】(1)
      (2)16.88万亿美元
      (1)



      所以,

      所以年份代码x和国内生产总值y的回归直线方程
      (2)
      令,得,
      所以2022年的国内生产总值大约为16.88万亿美元.
      例题4.(2022·吉林·长春市第二实验中学高二期中)郑州是一个缺水的城市,人均水资源占有量仅为全国的十分之一,政府部门提出“节约用水,我们共同的责任”倡议,某用水量较大的企业积极响应政府号召对生产设备进行技术改造,以达到节约用水的目的,下表提供了该企业节约用水技术改造后生产甲产品过程中记录的产量(吨)与相应的生产用水(吨)的几组对照数据:
      (1)请根据下表提供的数据,若,之间是线性相关,求关于的线性回归方程;
      (2)已知该厂技术改造前吨甲产品的生产用水为吨,试根据(1)求出的线性回归方程,预测技术改造后生产吨甲产品的用水量比技术改造前减少多少吨水?
      【参考公式】

      【答案】(1)
      (2)
      (1)
      根据题意得:,,
      所以,
      所以,所以.
      (2)
      当时,,
      所以改造后生产吨甲产品减少的用水量为:吨.
      例题5.(2022·山西·模拟预测(文))机动车辆保险即汽车保险(简称车险),是指对机动车辆由于自然灾害或意外事故所造成的人身伤亡或财产损失负赔偿责任的一种商业保险.机动车辆保险一般包括交强险和商业险,商业险包括基本险和附加险两部分.经验表明新车商业险保费与购车价格有较强的线性相关关系,下面是随机采集的相关数据:
      (1)根据表中数据,求y关于x的线性回归方程(精确到0.01);
      (2)某保险公司规定:上一年的出险次数决定了下一年的保费倍率,上一年没有出险,则下一年保费倍率为85%,上一年出险一次,则下一年保费倍率为100%,上一年出险两次,则下一年保费倍率为125%.太原王女士2022年1月购买了一辆价值32万元的新车.若该车2022年2月已出过一次险,4月又发生事故,王女士到汽车维修店询价,预计修车费用为800元,理赔人员建议王女士自费维修(即不出险),你认为王女士是否应该接受该建议?请说明理由.(假设车辆2022年与2023年都购买相同的商业险产品)
      参考数据:.
      参考公式:.
      【答案】(1)
      (2)王女士应接受理赔专员的建议;理由见解析
      (1)
      (万元),
      所以
      (2)
      价值为32万元的车辆的商业车险保费预报值为元.
      由于该车已出险一次,若再出险一次,则保费要增加25%,
      即保费增加元.
      因为,若出险,2023年增加的保费大于800元,
      所以王女士应接受理赔专员的建议.
      同类题型归类练
      1.(2022·四川成都·高三期中(理))某单位为了解办公楼用电量y(度)与气温x(℃)之间的关系,随机统计了四个工作日用电量与当天平均气温,如下表:
      由表中数据得到线性回归方程为,当气温为-4℃时,预测用电量为( )
      A.69度B.68度C.66度D.52度
      【答案】B
      【详解】由表中数据可知,,
      根据满足线性回归方程,得,∴,
      则回归方程为,
      当时,,
      故选:B.
      2.(2022·青海·海东市教育研究室高二期末(文))已知某商品的广告费(万元)与销售额(万元)之间的数据如下:
      根据上表数据可得线性回归方程为,则当投入8万元广告费时,销售额约为_______万元.
      【答案】8.64
      【详解】解:由题意可得,,
      则,解得,
      故.
      当时,.
      故答案为: 8.64
      3.(2022·内蒙古·满洲里远方中学高一期末)某种产品的广告费用支出(万元)与销售额(万元)之间有如下的对应数据:
      (1)作出销售额关于广告费用支出的散点图;
      (2)求出关于的线性回归方程;
      (3)据此估计估计广告费用为10万元时,销售收入的值.
      参考公式:,.
      【答案】(1)答案见详解
      (2)
      (3)82.5万元
      (1)
      画出坐标系,把所给的五组点的坐标描到坐标系中,作出散点图如图所示:
      (2)
      设所求线性回归直线方程为,,
      ,,,
      ,,
      因此,所求线性回归方程为.
      (3)
      当时,的预报值为(万元),
      答:当广告费用为10万元时,销售收入约为82.5万元.
      4.(2022·四川省通江中学高二开学考试(理))某车间为了确定合理的工时定额,需要确定加工零件所花费的时间,为此作了五次试验,得到数据如下:
      (1)求出 y 关于 x 的回归方程;
      (2)试预测加工 9 个零件需要多少时间?
      参考公式:,
      【答案】(1);
      (2).
      (1)
      由表中数据得:,,

      根据公式知:=0.75,

      回归直线方程为:.
      (2)
      将代入回归直线方程得,,
      预测加工9个零件需要小时.
      5.(2022·全国·高二期中)“十一五”规划提出单位国内生产总值(GDP)能耗降低20%左右的目标,“节能降耗”需要长期推行,这既有利于改善环境、可持续发展,又有利于民众生活福祉的改善.下表提供了某厂节能降耗技术改造后生产过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:
      (1)请根据上表提供的数据,求出y关于x的线性回归方程;
      (2)当该厂产量提升到10吨时,预测生产能耗为多少.
      参考公式:回归方程中斜率和截距的最小二乘估计公式分别为,.
      【答案】(1)
      (2)当产量提升到10吨时,预测生产能耗为6.9吨标准煤
      (1)
      解:因为,,
      ,.
      所以,
      所以,
      所以y关于x的线性回归肪程为.
      (2)
      解:当时,,
      所以当产量提升到10吨时,预测生产能耗为6.9吨标准煤.
      角度2:非线性经验回归方程及应用
      典型例题
      例题1.(2022·云南昆明·高三开学考试)根据中国海洋生态环境状况公报,从2017年到2021年全国直排海污染物中各年份的氨氮总量(单位:千吨)与年份的散点图如下:
      记年份代码为,,对数据处理后得:
      (1)根据散点图判断,模型①与模型②哪一个适宜作为关于的回归方程?(给出判断即可,不必说明理由)
      (2)根据(1)的判断结果,建立关于的回归方程,并预测2022年全国直排海污染物中的氨氮总量(计算结果精确到0.01).
      参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:,.
      【答案】(1)模型②适宜作为y关于x的回归方程.
      (2),3.97千吨.
      (1)
      由散点图得模型②适宜作为y关于x的回归方程.
      (2)
      由题知:


      所以y关于t的回归方程为,
      即y关于x的回归方程为,
      2022年对应的年份代码为,得,
      所以,预计2022年全国直排海污染物中的氨氮总量约为3.97千吨.
      例题2.(2022·湖北·高三开学考试)设某种植物幼苗从观察之日起,第天的高度为(cm),测得的一些数据如下表所示:
      (1)根据以上数据判断与哪一个更适宜作为关于的经验回归方程(给出判断即可,不需说明理由)?
      (2)根据(1)的判断,建立关于的经验回归方程,估计第100天幼苗的高度(估计的高度精确到小数点后第二位);
      (3)在作出的这组数据的散点图中,甲同学随机选取其中的4个点,记这4个点中幼苗的高度大于的点的个数为,其中为表格中所给的幼苗高度的平均数,试求随机变量的分布列和数学期望.
      附:对于一组数据,其经验回归直线方程的斜率的最小二乘估计为.
      【答案】(1)
      (2),
      (3)分布列答案见解析,数学期望为
      (1)
      根据表中数据可得更适宜作为关于的经验回归方程;
      (2)
      令,则,根据已知数据表得到如下表:
      故关于的经验回归方程
      令;
      (3)
      这7天中幼苗高度大于的有4天,服从超几何分布,其中
      所以随机变量的分布列为:
      随机变量的期望值.
      例题3.(2022·全国·高二课时练习)为研究如何合理施用化肥,使其最大限度地促进粮食增产,减少对周围环境的污染,某研究团队收集了组化肥施用量和粮食亩产量的数据,并对这些数据进行了初步处理,得到如图所示的散点图及如表所示的一些统计量的值,其中,化肥施用量为(单位:千克),粮食亩产量为(单位:百千克).令,.
      (1)根据散点图判断,与哪一个更适宜作为粮食亩产量关于化肥施用量的回归方程模型(给出判断即可,不必说明理由);
      (2)根据(1)的判断结果及表中数据,建立关于的回归方程,并估计化肥施用量为千克时,粮食亩产量的值;
      附:①在回归直线方程中,,;
      【答案】(1)更适宜作为关于的回归方程模型
      (2);千克.
      (1)
      由散点图可知:随的变化呈现非线性的变化趋势,
      更适宜作为关于的回归方程模型.
      (2)
      由得:,即,
      ,,
      ,关于的回归方程为:;
      当时,,即当当化肥施用量为千克时,粮食亩产量为千克.
      例题4.(2022·广东佛山·高三阶段练习)国庆期间,某市文旅部门在落实防控举措的同时,推出了多款套票文旅产品,得到消费者的积极回应.下面是文旅部门在某地区推出六款不同价位的旅游套票,每款的套票价格(单位:元)与购买人数(单位:万人)的数据如下表:
      在分析数据、描点绘图中,发现散点集中在一条直线附近,其中,.
      (1)根据所给数据,求关于的回归方程;
      附:①可能用到的数据:,,,.
      ②对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计值分别为,.
      【答案】(1)
      【详解】(1)因为散点集中在一条直线附近,设回归直线方程为,
      由,,
      则,,
      所以变量关于的回归方程为,
      因为,,所以,故,
      综上,关于的回归方程为;
      同类题型归类练
      1.(2022·福建省福州延安中学高二期末)某公司对某产品进行市场调研,获得了该产品的定价x(单位:万元/吨)和一天的销售量y(单位:吨)的一组数据,制作了如下的数据统计表,并作出了散点图.
      表中,,.
      (1)根据散点图判断,与哪一个更适合作为y关于x的经验回归方程模型:(给出判断即可,不必说明理由)
      (2)根据(1)的判断结果,试建立y关于x的经验回归方程;
      (3)若生产1吨该产品的成本为0.20万元,依据(2)的经验回归方程,预计定价为多少时,该产品一天的利润最大,并求此时的月利润.(每月按30天计算,计算结果保留两位小数)
      参考公式:经验回归方程,其中,.
      【答案】(1);
      (2);
      (3)定价为0.45万元/吨时,一天的利润最大,月利润最大为45.00万元.
      (1)
      根据散点图知更适合作为y关于x的回归方程.
      (2)
      令,则,
      则,
      ,,
      关于x的回归方程为.
      (3)
      一天利润为.
      (当且仅当即时取等号)
      每月的利润为(万元)
      预计定价为0.45万元/吨时,该产品一天的利润最大,此时的月利润为45.00万元.
      2.(2022·全国·高二课时练习)某保险公司根据官方公布的2011—2020年的营业收入,制成表格如下:
      表1
      由表1,得到下面的散点图:
      根据已有的函数知识,某同学选用二次函数模型(b和a均为常数)来拟合y和x的关系,这时,
      可以令,得,由表1可得t与y的相关数据如表2.表2
      (1)根据表2中数据,建立y关于t的回归直线方程(系数精确到个位数);
      (2)根据(1)中得到的回归直线方程估计2023年的营业收入以及营业收入首次超过4000亿元的年份.
      参考公式;回归直线方程中,,.
      参考数据:,,,.
      【答案】(1)
      (2)3574亿元,2024年
      (1)
      解:易得,

      故y关于t的回归直线方程为.
      (2)
      解:2023年对应的t的值为169,故该年的营业收入为(亿元),
      所以估计2023年的营业收入为3574亿元.
      依题意,有.解得,即.
      因为,
      所以估计营业收入首次超过4000亿元的年份序号为14.即2024年.
      3.(2022·吉林·长春吉大附中实验学校高二期末)某市统计了该市近五年的环保投资额(万元)得下表:
      以为解释变量,为响应变量,若用作为经验回归方程,则决定系数,若用作为经验回归方程,则决定系数.
      (1)判断与哪一个更适合作为年环保投资额关于年份代号的经验回归方程,并说明理由;
      (2)根据(1)的判断结果及表中数据,求出关于年份代号的经验回归方程.
      参考公式:对于一组数据,,…,,其经验回归直线的斜率和截距的最小二乘估计分别为,.
      参考数据:,,.
      【答案】(1)更适合作为年环保投资额关于年份代号的经验回归方程,理由见解析
      (2)
      【详解】(1)由,可知的拟合效果更好,所以更适合作为年环保投资额关于年份代号的经验回归方程.
      (2)由表格数据,得,

      ,,
      由公式,得,

      所以关于的经验回归方程为.
      角度3:相关系数
      典型例题
      例题1.(2022·福建省福州格致中学高三期中)近年来,随着社会对教育的重视,家庭的平均教育支出增长较快,某机构随机调查了某市2015-2021年的家庭教育支出(单位:万元),得到如下折线图.(附:年份代码1-7分别对应2015-2021年).经计算得,.
      (1)用一元线性回归模型拟合与的关系,求出相关系数(精确到0.01),并说明与相关性的强弱;
      (2)建立关于的回归直线方程;
      (3)若2023年该市某家庭总支出为10万元,预测2023年该家庭的教育支出.
      附:①相关系数;
      ②在回归直线方程中,.
      【答案】(1),相关性很强;
      (2);
      (3)万元.
      【详解】(1)由题意得,,
      则,故,
      故,
      ∵,
      ∴y与t高度相关,即y与t的相关性很强.
      (2)根据题意,得,

      ∴y关于t的回归直线方程为.
      (3)2023年对应的年份代码,当时,,
      故预测2023年该家庭的教育支出为(万元).
      例题2.(2022·陕西·宝鸡市金台区教育体育局教研室高三阶段练习(理))应对严重威胁人类生存与发展的气候变化,其关键在于“控碳”,其必由之路是先实现“碳达峰”,而后实现“碳中和”,2020年第七十五届联合国大会一般性辩论上,习近平总书记向世界郑重承诺:力争在2030年前实现“碳达峰”,努力争取在2060年前实现“碳中和”.近年来,国家积极发展新能源汽车,某品牌的新能源汽车宝鸡地区销售在2022年5月至2022年9月这5个月的销售量(单位:辆)的数据如下表:
      (1)依据表中的统计数据,请判断月份代码与该品牌的新能源汽车宝鸡地区销售量(单位:辆)是否具有较高的线性相关程度?(参考:若,则线性相关程度一般,若,则线性相关程度较高,计算时精确度为0.01.)
      (2)求销售量与月份代码之间的线性回归方程,并预测2022年11月份宝鸡地区的销售量(单位:辆).(结果保留整数)
      参考数据:,,,
      参考公式:相关系数,
      线性回归方程中,,,其中,为样本平均值.
      【答案】(1)具有较高的线性相关程度
      (2),87辆
      【详解】(1)由表中数据可得 ,
      所以 ,又,,
      所以.
      所以月份代码与销售量(单位: 辆)具有较高的线性相关程度,可用线性回归模型拟合销售量与月份代码之间的关系;
      (2)由表中数据可得,
      则,所以,
      令,可得(辆),
      故可预测2022年10月该品牌的新能源汽车该区域的销售量为辆.
      同类题型归类练
      1.(2022·全国·高二专题练习)某数学小组从气象局和医院分别获得了年月至年月每月日的昼夜温差(单位:℃,)和患感冒人数的数据,并根据所得数据画出如图所示的折线图.
      (1)求与之间的相关系数,并判断与的相关性的强弱(时,认为与高度相关,即认为与的相关性很强);
      (2)建立关于的回归直线方程(回归系数的结果精确到),并预测昼夜温差为时患感冒的人数.
      参考数据:,,,.
      参考公式:相关系数.
      在回归直线方程,,.
      【答案】(1);与的相关性很强
      (2);昼夜温差为时患感冒的人数约为
      (1)由已知得,

      ∴.
      ∵,
      ∴与高度相关,即与的相关性很强.
      (2)
      由已知得,


      ∴关于的回归直线方程为.
      当时,.
      ∴昼夜温差为时患感冒的人数约为.
      2.(2022·内蒙古赤峰·高三开学考试(文))2022年6月某一周,“东方甄选”直播间的交易额共计3.5亿元,数据统计如下表:
      (1)通过分析,发现可用线性回归模型拟合交易额y与t的关系,请用相关系数(系数精确到0.01)加以说明;
      (2)利用最小二乘法建立y关于t的经验回归方程(系数精确到0.1),并预测下一周的第一天(即第8天)的交易额.
      参考数据:,,.参考公式:相关系数.在回归方程中,斜率和截距的最小二乘法估计公式分别为,.
      【答案】(1)答案见解析
      (2),1.1亿元
      (1)
      因为,,,,
      所以.
      因为交易额y与t的相关系数近似为0.98,说明交易额y与t具有很强的正线性相关,
      从而可用线性回归模型拟合交易额y与t的关系.
      (2)
      因为,,所以,
      ,所以y关于t的回归方程为,
      将代入回归方程得(千万元)亿元,
      所以预测下一周的第一天的交易额为1.1亿元.
      角度4:残差分析
      典型例题
      例题1.(2022·山东淄博·高二期末)随机选取变量和变量的对观测数据,选取的第对观测数据记为,其数值对应如下表所示:
      计算得:,,,,.
      (1)求变量和变量的样本相关系数(小数点后保留位),判断这两个变量是正相关还是负相关,并推断它们的线性相关程度;
      (2)假设变量关于的一元线性回归模型为.
      (ⅰ)求关于的经验回归方程,并预测当时的值;
      (ⅱ)设为时该回归模型的残差,求、、、、的方差.
      参考公式:,,.
      【答案】(1)答案见解析
      (2)①答案见解析;②
      (1)
      解:,
      所以,这两个变量负相关,且具有较强的线性相关性.
      (2)
      解:①,则,
      所以,关于的经验回归方程为,
      当时,则,
      所以,当时,的预测值为;
      ②由,计算得该回归模型的残差如下表所示:
      所以,残差的方差为.
      例题2.(2022·福建·莆田一中高二期末) 甲、乙两名同学在对具有相关关系的两个变量进行回归分析时,得到如下数据.
      甲发现表中散点集中在曲线附近(其中,是参数,且).他先设,将表中数据进行转换,得到新的成对数据,再用一元线性回归模型拟合;乙根据数据得到线性回归方程为.
      (1)列出新的数据表,并求;
      (2)在统计学中,我们通常计算不同回归模型的残差平方和(残差平方和用表示)来判断拟合效果,越小,拟合效果越好.乙同学计算出其模型的残差平方和为143.6,请你计算甲同学模型的残差平方和,并比较拟合效果.
      (参考公式:,.)
      【答案】(1)数据表见解析,;
      (2)20.24,拟合效果好.
      (1)
      新数据对如下表:
      因此,
      则,

      所以.
      (2)
      由(1)得:,当时,,
      当时,,当时,,
      当时,,当时,,
      对应值表为:
      因此,显然
      所以模型拟合效果好.
      例题3.(2022·广西·南宁二中高三阶段练习(文))某高科技公司对其产品研发年投资额x(单位:百万元)与其年销售量y(单位:千件)的数据进行统计,整理后得到如下统计表1和散点图.
      表1
      (1)求年销售量关于年投资额的线性回归方程;
      (2)该公司科研团队通过进一步分析散点图的特征后,计算得年销售关于年投资额的非线性回归方程,根据,及表2数据,请用残差平方和比较(1)和(2)中回归方程的拟合效果哪个更好?
      表2
      参考公式:,.
      【答案】(1)
      (2)第二种非线性回归方程拟合效果更好
      (1)
      由题意,


      所以线性回归方程为.
      (2)
      按(1)可得

      按(2)可得

      显然,第二种非线性回归方程拟合效果更好.
      同类题型归类练
      1.(2022·四川·蓬溪绿然学校二模(文))为弘扬劳动精神,树立学生“劳动最美,劳动最光荣”的观念,某校持续开展“家庭劳动大比拼”活动某班统计了本班同学月份的人均月劳动时间单位:小时,并建立了人均月劳动时间关于月份的线性回归方程,与的原始数据如表所示:
      由于某些原因导致部分数据丢失,但已知.
      (1)求,的值;
      (2)求该班月份人均月劳动时间数据的残差值残差即样本数据与预测值之差.
      参考公式:在线性回归方程中,.
      【答案】(1),;
      (2).
      (1)
      由表知,,,
      所以,
      所以,即,
      因为回归直线方程恒过样本中心点,
      所以,即,由,得,,
      因为,所以,
      由,得,.
      (2)
      由(1)知,线性回归方程为,
      所以当时,预测值,
      此时残差为.
      2.(2022·福建·福州三中高二期末)现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本和企业利润的数据(单位:万元)如表所示:
      根据最小二乘法公式求得线性回归方程为.
      (1)求m的值,并利用已知的线性回归方程求出八月份的残差值
      (2)通过残差分析,怀疑残差绝对值最大的那组数据有误,经再次核实后发现其真正利润应该为116万元.请重新根据最小二乘法的思想与公式,求出新的线性回归方程.
      附1
      附2
      附3
      【答案】(1);;
      (2)线性回归方程模型为.
      【解析】(1)
      由已知数据可得:,
      因为点在回归直线上,所以,
      所以,
      所以,
      所以八月份的残差值;
      (2)
      由已知可得,,,,,,,
      又由(1)知
      所以8月份的残差绝对值最大,所以8月份的真正利润应该为116万元,
      此时,
      又,
      所以,

      所以数据核实后的新的线性回归方程为.
      题型三:列联表与独立性检验
      典型例题
      例题1.(多选)(2022·浙江衢州·高三阶段练习)当下新能源汽车备受关注,某校“绿源”社团对“学生性别和喜欢新能源汽车是否有关”做了一次调查,其中被调查的男女生人数相同,男生喜欢新能源汽车的人数占男生人数的,女生喜欢新能源汽车的人数占女生人数的,若有的把握认为是否喜欢新能源汽车和性别有关,则调查人数中男生有可能的人数为( )
      附:
      A.68B.C.70D.71
      【答案】CD
      【详解】设男女生总人数为,则男生喜欢新能源汽车的人数,女生喜欢新能源汽车的人数占女生人数的.则列出联表如下:
      所以,即,所以,
      故选:CD
      例题2.(2022·四川·宜宾市叙州区第二中学校模拟预测(理))年四川持续出现高温天气,导致电力供应紧张.某市电力局在保证居民生活用电的前提下,尽量合理利用资源,保障企业生产.为了解电力资源分配情况,在8月初,分别对该市区和区各10个企业7月的供电量与需求量的比值进行统计,结果用茎叶图表示如图.
      (1)求区企业7月的供电量与需求量的比值的中位数;
      (2)当供电量与需求量的比值小于时,生产要受到影响,统计茎叶图中的数据,填写2×2列联表,并根据列联表,判断是否有95%的把握认为生产受到影响与企业所在区有关?
      附:
      【答案】(1)0.86;
      (2)2×2列联表见解析,没有95%的把握.
      【详解】(1)A区供电量与需求量的比值由小到大排列,第5个数,第6个数分别为,
      所以所求中位数为;
      (2)2×2列联表:
      没有95%的把握认为生产有影响与企业所在区有关.
      例题3.(2022·全国·高三阶段练习(文))为了了解某植物植株得枯萎病是否与感染红叶螨有关,随机抽取了该植物植株100株,得到下面列联表:
      (1)随机抽取该植物中的一株,根据上表,分别估计该株植物感染红叶螨和得枯萎病的概率;
      (2)能否有95%的把握认为该植物植株得枯萎病与感染红叶螨有关?
      附:
      【答案】(1);;
      (2)有95%的把握认为该植物植株得枯萎病与感染红叶螨有关
      【详解】(1)共100株,感染红叶螨的有株,得枯萎病的有株,
      所以随机抽取该植物的一株,感染红叶螨的概率估值为,得枯萎病的概率估值为;
      (2),
      因为,
      所以有95%的把握认为该植物植株得枯萎病与感染红叶螨有关
      同类题型归类练
      1.(2022·全国·高三专题练习)根据表中的数据,及观测值则在犯错误的概率不超过___________前提下,认为选择舞蹈与性别有关.
      其中的参考数据:
      【答案】0.025
      【详解】解:由列联表中的数据可得,

      所以在犯错误的概率不超过0.025的前提下,认为选择舞蹈与性别有关.
      故答案为:0.025.
      2.(2022·青海·海东市教育研究室高二期末(文))“双十一”发展至今,已经从一个单纯的网络促销活动变成社会经济重大现象级事件.为了了解市民“双十一”期间网购情况,某统计小组从网购的消费者中,随机抽取了当天100名消费者,其中男女各半.若消费者当天消费金额不低于1000元,则称其为网购达人.已知抽取的100名消费者中,网购达人中女性消费者人数是男性消费者人数的2倍,且女性消费者中,网购达人占.
      (1)请完成答题卡上的列联表;
      (2)能否有99%的把握认为是否为网购达人与性别有关?
      参考公式:,其中
      参考数据:
      【答案】(1)表格见解析
      (2)有99%的把握认为是否为网购达人与性别有关联.
      【详解】(1)解:由题意可得女性消费者中,网购达人有人,
      非网购达人有人,
      则男性消费者中,网购达人有人,
      非网购达人有人,
      故得列联表如下:
      (2)由(1)可得,
      则有99%的把握认为是否为网购达人与性别有关联.
      3.(2022·浙江台州·模拟预测)为考察某种药物对预防疾病的效果,进行了动物试验,根据100个有放回简单随机样本的数据,得到如下列联表:
      (1)若从总体中任取一个样本,试估计该动物未服用药物且未患疾病的概率;
      (2)能否有的把握认为药物对疾病有效?
      附:
      【答案】(1)
      (2)没有
      【详解】(1)由样本估计总体,估计该动物末服用药物且末患疾病的概率为:;
      (2)假设药物A服用与患疾病无关,由

      因为,所以没有的把握认为药物A对疾病B有效;
      综上,该动物末服用药物且末患疾病的概率为: ,没有的把握认为药物A对疾病B有效.
      4.(2022·广东佛山·高三期中)体育运动是强身健体的重要途径,《中国儿童青少年体育健康促进行动方案(2020-2030)》(下面简称“体育健康促进行动方案”)中明确提出青少年学生每天在校内参与不少于60分钟的中高强度身体活动的要求.随着“体育健康促进行动方案”的发布,体育运动受到各地中小学的高度重视,众多青少年的体质健康得到很大的改善.某中学教师为了了解体育运动对学生的数学成绩的影响情况,现从该中学高三年级的一次月考中随机抽取1000名学生,调查他们平均每天的体育运动情况以及本次月考的数学成绩情况,得到下表数据:
      约定:平均每天进行体育运动的时间不少于60分钟的为“运动达标”,数学成绩排在年级前以内(含)的为“数学成绩达标”.
      (1)求该中学高三年级本次月考数学成绩的分位数;
      (2)请估计该中学高三年级本次月考数学成绩的平均分(同一组中的数据用该组区间的中点值作代表);
      (3)请根据已知数据完成下列列联表,并根据小概率值的独立性检验,分析“数学成绩达标”是否与“运动达标”相关;
      附:
      【答案】(1)100;
      (2)91.50;
      (3)列联表见解析;在犯错的概率不大于的前提下认为“数学成绩达标”与“运动达标”相关.
      【详解】(1)每组的频率依次为,
      ∵,且,
      高三年级本次月考数学成绩的分位数位于,且为的中点100,
      该中学高三年级本次月考数学成绩的分位数100;
      (2)该中学高三年级本次月考数学成绩的平均分,
      估计该中学高三年级本次月考数学成绩的平均分91.50.
      (3)
      零假设为:“数学成绩达标”与“运动达标”无关,
      ∴零假设不成立,根据独立性检验可得:在犯错的概率不大于的前提下认为“数学成绩达标”与“运动达标”相关.
      合计
      合计
      0.1
      0.05
      0.01
      0.005
      0.001
      2.706
      3.841
      6.635
      7.879
      10.828
      气温
      18
      13
      10
      用电量(度)
      24
      34
      38
      64
      年份
      2017
      2018
      2019
      2020
      2021
      年份编号
      1
      2
      3
      4
      5
      单价
      19
      21
      26
      29
      35
      年份
      2016
      2017
      2018
      2019
      2020
      年份代码
      1
      2
      3
      4
      5
      国内生产总值/万亿美元
      11.2
      12.3
      13.9
      14.3
      14.7
      1
      2
      3
      4
      5
      2
      2.5
      3.7
      4.3
      6.5
      购车价格x(万元)
      5
      10
      15
      20
      25
      30
      35
      商业险保费y(元)
      1737
      2077
      2417
      2757
      3097
      3622
      3962
      气温x(℃)
      18
      13
      10
      -1
      用电量y(度)
      24
      34
      38
      64
      3
      4
      5
      6
      7
      5.2
      5.9
      6.8
      7.1
      8
      2
      4
      5
      6
      8
      30
      40
      60
      50
      70
      零件的个数x(个)
      1
      2
      3
      4
      5
      加工的时间y(小时)
      1.5
      2.4
      3.2
      3.9
      4.5
      x
      3
      4
      5
      6
      7
      y
      2.7
      3.5
      4.1
      4.7
      5
      6
      0.45
      1.5
      210
      76
      17
      第天
      1
      4
      9
      16
      25
      36
      49
      高度(cm)
      0
      4
      7
      9
      11
      12
      13
      1
      4
      9
      16
      25
      36
      49
      1
      2
      3
      4
      5
      6
      7
      0
      4
      7
      9
      11
      12
      13
      1
      2
      3
      4
      旅游类别
      城市展馆科技游
      乡村特色游
      红色景点游
      登山套票
      游园套票
      观海套票
      套票价格(元)
      39
      49
      58
      67
      77
      86
      购买数量(万人)
      16.7
      18.7
      20.6
      22.5
      24.1
      25.6
      0.33
      10
      3
      0.164
      100
      68
      350
      年份
      2011
      2012
      2013
      2014
      2015
      年份序号x
      1
      2
      3
      4
      5
      营业收入y(亿元)
      0.52
      0.36
      33.6
      132
      352
      年份
      2016
      2017
      2018
      2019
      2020
      年份序号x
      6
      7
      8
      9
      10
      营业收入y(亿元)
      571
      912
      1207
      1682
      2135
      t
      1
      4
      9
      16
      25
      y
      0.52
      9.36
      33.6
      132
      352
      t
      36
      49
      64
      81
      100
      y
      571
      912
      1207
      1682
      2135
      年份
      2017
      20l8
      20l9
      2020
      2021
      年份代号
      1
      2
      3
      4
      5
      年环保投资额(万元)
      12
      20
      35
      48
      55
      月份
      2022年5月
      2022年6月
      2022年7月
      2022年8月
      2022年9月
      月份代码:
      1
      2
      3
      4
      5
      销售量:
      45
      56
      64
      68
      72
      第t天
      1
      2
      3
      4
      5
      6
      7
      交易额y/千万元
      编号
      4
      6
      8
      10
      12
      4
      12
      24
      50
      72
      4
      6
      8
      10
      12
      1
      2
      3
      5
      6
      4
      12
      24
      50
      72
      3.2
      12.6
      27.2
      47
      72
      x
      1
      2
      3
      4
      5
      y
      0.5
      1
      1.5
      3
      5.5
      2
      3
      4
      5
      的近似值
      3.2
      5.8
      10.5
      18.9
      x
      1
      2
      3
      4
      5
      y
      0.5
      1
      1.5
      3
      5.5
      1.1
      2.3
      3.5
      4.7
      x
      1
      2
      3
      4
      5
      y
      0.5
      1
      1.5
      3
      5.5
      0.54
      0.96
      1.74
      3.15
      5.67
      月份
      人均月劳动时间
      月份
      1
      2
      3
      4
      5
      6
      7
      8
      物流成本x
      83
      83.5
      80
      86.5
      89
      84.5
      79
      86.5
      利润y
      114
      116
      106
      122
      132
      114
      m
      132
      残差
      0.2
      0.6
      1.8
      -3
      -1
      -4.6
      -1
      类别
      喜欢新能源汽车
      不喜欢新能源汽车
      小计
      男生
      女生
      小计
      .
      .
      .
      不受影响
      受影响
      合计
      A区
      B区
      合计
      不受影响
      受影响
      合计

      7
      3
      10

      4
      6
      10
      合计
      11
      9
      20
      得枯萎病
      无枯萎病
      感染红叶螨
      32
      16
      未感染红叶螨
      24
      28
      0.100
      0.050
      0.010
      2.706
      3.841
      6.635
      篮球
      舞蹈
      合计

      13
      7
      20

      2
      8
      10
      合计
      15
      15
      30
      0.05
      0.025
      0.010
      3.841
      5.024
      6.635
      0.10
      0.05
      0.010
      0.001
      2.706
      3.841
      6.635
      10.828
      性别
      网购达人
      非网购达人
      合计
      男性
      15
      35
      50
      女性
      30
      20
      50
      合计
      45
      55
      100
      药物
      疾病
      合计
      未患病
      患病
      未服用
      30
      15
      45
      服用
      45
      10
      55
      合计
      75
      25
      100
      数学成绩(分)
      人数(人)
      25
      125
      350
      300
      150
      50
      运动达标的人数(人)
      10
      45
      145
      200
      107
      43
      数学成绩达标人数
      数学成绩不达标人数
      合计
      运动达标人数
      运动不达标人数
      合计
      数学成绩达标人数
      数学成绩不达标人数
      合计
      运动达标人数
      350
      200
      550
      运动不达标人数
      150
      300
      450
      合计
      500
      500
      1000

      相关试卷 更多

      资料下载及使用帮助
      版权申诉
      • 1.电子资料成功下载后不支持退换,如发现资料有内容错误问题请联系客服,如若属实,我们会补偿您的损失
      • 2.压缩包下载后请先用软件解压,再使用对应软件打开;软件版本较低时请及时更新
      • 3.资料下载成功后可在60天以内免费重复下载
      版权申诉
      若您为此资料的原创作者,认为该资料内容侵犯了您的知识产权,请扫码添加我们的相关工作人员,我们尽可能的保护您的合法权益。
      入驻教习网,可获得资源免费推广曝光,还可获得多重现金奖励,申请 精品资源制作, 工作室入驻。
      版权申诉二维码
      高考专区
      • 精品推荐
      • 所属专辑118份
      欢迎来到教习网
      • 900万优选资源,让备课更轻松
      • 600万优选试题,支持自由组卷
      • 高质量可编辑,日均更新2000+
      • 百万教师选择,专业更值得信赖
      微信扫码注册
      手机号注册
      手机号码

      手机号格式错误

      手机验证码 获取验证码 获取验证码

      手机验证码已经成功发送,5分钟内有效

      设置密码

      6-20个字符,数字、字母或符号

      注册即视为同意教习网「注册协议」「隐私条款」
      QQ注册
      手机号注册
      微信注册

      注册成功

      返回
      顶部
      学业水平 高考一轮 高考二轮 高考真题 精选专题 初中月考 教师福利
      添加客服微信 获取1对1服务
      微信扫描添加客服
      Baidu
      map