搜索
      点击图片退出全屏预览

      2026年高考数学一轮复习重点难点题练习(新高考)专题9.3成对数据的统计分析(五类重难点题型精练)原卷版+解析

      • 3.2 MB
      • 2026-05-29 01:28:10
      • 7
      • 0
      • 专著中小学教育资源
      加入资料篮
      立即下载
      18398463第1页
      点击全屏预览
      1/73
      18398463第2页
      点击全屏预览
      2/73
      18398463第3页
      点击全屏预览
      3/73
      还剩70页未读, 继续阅读

      2026年高考数学一轮复习重点难点题练习(新高考)专题9.3成对数据的统计分析(五类重难点题型精练)原卷版+解析

      展开

      这是一份2026年高考数学一轮复习重点难点题练习(新高考)专题9.3成对数据的统计分析(五类重难点题型精练)原卷版+解析,共75页。试卷主要包含了与温度的部分数据如下表等内容,欢迎下载使用。

      重难点题型1 变量间的相关关系的判断
      1.(2025·安徽蚌埠·三模)医疗研究者会创建散点图来显示少女的体重指数(BMI)和身体脂肪百分比之间的相关关系,如图,下列说法正确的是( )
      A.BMI越大,脂肪百分比越大
      B.BMI越大,脂肪百分比越小
      C.BMI与脂肪百分比正相关
      D.BMI与脂肪百分比负相关
      2.(2025·甘肃庆阳·三模)下列说法正确的是( )
      A.数据7,5,3,10,2的第40百分位数是3
      B.已知随机变量,σ越小,表示随机变量X的分布越分散
      C.已知一组数据的方差为3,则的方差为3
      D.根据一组样本数据的散点图判断出两个变量线性相关,由最小二乘法求得其经验回归方程为,若其中一个点为,则实数
      3.(24-25高三下·云南昆明·阶段练习)下列残差图满足一元线性回归模型中对随机误差的假定的是( )
      A.B.
      C.D.
      4.(2024·四川攀枝花·一模)为了判断某地超市的销售额与广告支出之间的相关关系,现随机抽取6家超市,得到其广告支出与销售额数据如下表,则下列说法中正确的是( )
      A.广告支出数据的极差为9
      B.销售额数据的第80百分位数为43
      C.若销售额y与广告支出c之间的经验回归方程为,则
      D.若去掉超市A这一组数据,则销售额y与广告支出x之间的线性相关程度会减弱
      5.(2025·广西柳州·模拟预测)(多选题)某人工智能公司近5年的利润情况如下表所示:
      已知变量与之间具有线性相关关系,设用最小二乘法建立的回归直线方程为,则下列说法正确的是( )
      A.B.变量与之间的线性相关系数
      C.预测该人工智能公司第6年的利润约为7.8亿元D.残差绝对值的最大值为0.4
      6.(2025·山东泰安·模拟预测)(多选题)下列命题正确的是( )
      A.样本相关系数的绝对值越接近,成对样本数据的线性相关程度越强
      B.在经验回归方程=中,当解释变量每增加时,响应变量平均增加
      C.若,,则事件、相互独立与、互斥不可能同时成立
      D.若,,…,这个数据的平均数为,方差为,则,,…,,这个数据的方差为
      7.(2025·天津红桥·二模)由表格数据得到的线性回归方程为,则表格中的m值为 .
      8.(2023·四川德阳·一模)某科学兴趣小组的同学认为生物都是由蛋白质构成的,高温可以使蛋白质变性失活,于是想初步探究某微生物的成活率与温度的关系,微生物数量(个)与温度的部分数据如下表:
      由表中数据算得回归方程为,预测当温度为时,微生物数量为 个.
      重难点题型2 相关系数
      1.(2025·上海浦东新·二模)研究变量x,y得到一组成对数据,,先进行一次线性回归分析,接着增加一个数据,其中,,再重新进行一次线性回归分析,则下列说法正确的是( )
      A.变量与变量的相关性变强B.相关系数的绝对值变小
      C.线性回归方程不变D.拟合误差Q变大
      2.(2025·辽宁鞍山·一模)下列选项中,相关系数最小的是( )
      A.B.C.D.
      3.(2025·天津·二模)为研究某奶茶店每日的热奶茶销售量和气温之间是否具有线性相关关系,统计该店(2025年2月6日至3月24日)每天的热奶茶销售量及当天气温得到如图所示的散点图(轴表示气温,轴表示热奶茶销售量),由散点图可知与的相关关系为( )
      A.正相关,相关系数的值为0.8B.负相关,相关系数的值为0.8
      C.正相关,相关系数的值为D.负相关,相关系数的值为
      4.对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
      A.B.
      C.D.
      5.(2025·湖北黄冈·二模)(多选题)为研究光照时长(小时)和种子发芽数量(颗)之间的关系,某课题研究小组采集了10组数据,绘制散点图如图所示,并进行线性回归分析,若去掉点后,下列说法正确的是( )
      A.决定系数变大
      B.相关系数变小
      C.残差平方和变小
      D.这些数据中的x的平均值变小,的平均值变大
      6.(2025·内蒙古包头·二模)(多选题)一组样本数据.其中,,求得其经验回归方程为:,残差为.对样本数据进行处理:,得到新的数据,求得其经验回归方程为,其残差为分布如图所示,且,,则( )
      A.样本正相关B.
      C.D.处理后的决定系数变大
      重难点题型3 线性回归模型
      1.为了解温度对物质参与的某种化学反应的影响,研究小组在不同温度条件下做了四次实验,实验中测得的温度x(单位:°C)与的转化率y% (转化率=)的数据如下表所示:
      (1)求y与x的相关系数(结果精确到0.01);
      (2)该研究小组随后又进行了一次该实验,其中的起始量为50 g,反应结束时还剩余2.5 g,若已知y关于x的线性回归方程为,估计这次实验是在多少摄氏度的温度条件下进行的..
      参考数据: ,,,.
      参考公式:相关系数
      2.防疫抗疫,人人有责,随着奥密克戎的全球肆虐,防疫形势越来越严峻,防疫物资需求量急增.下表是某口罩厂今年的月份与订单(单位:万元)的几组对应数据:
      (1)求关于的线性回归方程,并估计6月份该厂的订单数;
      (2)求相关系数(精确到0.01),说明与之间具有怎样的相关关系.
      参考数据:,,.,.参考公式:相关系数;回归直线的方程是,其中.
      3.(2024·甘肃·二模)人工智能教育是将人工智能与传统教育相结合,借助人工智能和大数据技术打造的智能化教育生态.为了解我国人工智能教育发展状况,通过中国互联网数据平台得到我国2015年-2020年人工智能教育市场规模统计图.如图所示,若用x表示年份代码(2015年用1表示,2016年用2表示,依次类推),用y表示市场规模(单位:亿元),试回答:
      (1)根据条形统计图中数据,计算变量y与x的相关系数r,并用r判断两个变量y与x相关关系的强弱(精确到小数点后2位);
      (2)若y与x的相关关系拟用线性回归模型表示,试求y关于x的线性回归方程,并据此预测2022年中国人工智能教育市场规模(精确到1亿元).
      附:线性回归方程,其中;
      相关系数;
      参考数据:.
      4.(2024·河南焦作·二模)小李准备在某商场租一间商铺开服装店,为了解市场行情,在该商场调查了20家服装店,统计得到了它们的面积x(单位:)和日均客流量y(单位:百人)的数据,并计算得,,,.
      (1)求y关于x的回归直线方程;
      (2)已知服装店每天的经济效益,该商场现有的商铺出租,根据(1)的结果进行预测,要使单位面积的经济效益Z最高,小李应该租多大面积的商铺?
      附:回归直线的斜率和截距的最小二乘估计分别为:,.
      5.(23-24高二下·山东潍坊·期中)为实施乡村振兴,科技兴农,某村建起了田园综合体,并从省城请来专家进行技术指导.根据统计,该田园综合体西红柿亩产量的增加量(千克)与某种液体肥料每亩使用量(千克)之间的对应数据如下.
      (1)由上表数据可知,可用线性回归模型拟合与的关系,请计算相关系数并加以说明(若,则线性相关程度很高,可用线性回归模型拟合);
      (2)求关于的回归方程,并预测当液体肥料每亩使用量为15千克时,西红柿亩产量的增加量约为多少千克?
      附:相关系数公式,参考数据:.
      回归方程中斜率和截距的最小二乘估计公式分别为,.
      6.(2024全国·三模)年月日,习近平总书记在减贫与发展高层论坛上强调,中国扶贫工作要实施精准扶贫方略,坚持中国制度优势,坚持分类施策.当年月日,中共中央政治局召开会议,审议通过了《关于打赢脱贫攻坚战的决定》等有关文件,会议确定了通过产业扶持、转移就业、教育支持和医疗救助等措施帮助万左右贫困人口脱贫的目标.下表为某贫困县在实施扶贫政策过程中贫困户的统计数据:
      (1)从这六组数据的贫困户数中任意抽取两个值,(百户),设为四舍五入后的整数值,求随机变量的分布列及期望值;
      (2)以年五组数据进行相关性分析发现,贫困户数(百户)与年份的序号存在较强的线性相关性,试用最小二乘法求相应的回归方程,并利用2020年的数据对该回归方程进行检验.若实际数与预测值的差值的绝对值不超过户,则认为回归方程可靠.请问该回归方程是否可靠?
      附:回归方程中斜率和截距的最小二乘法公式为:,.
      重难点题型4 非线性经验回归模型
      1.(2025·云南·模拟预测)自2020年以来,某地区人工智能核心产值规模呈快速增长态势,下表给出了近5年该地区的人工智能核心产值规模(单位:亿元).
      (1)若用作为回归模型,并已求得,,,求此模型下的决定系数(精确到0.01).
      (2)若用作为回归模型,
      ①求的值;
      ②已知该模型下的决定系数,请说明哪种回归模型拟合效果更好,并用拟合效果好的模型预测2025年该地区的人工智能核心产值规模.
      参考数据:
      附:(1)上表中;
      (2)一组数据,其经验回归直线的斜率和截距的最小二乘估计公式分别为,,决定系数.
      2.(2025·海南省直辖县级单位·模拟预测)蝗虫能对农作物造成严重伤害,每只蝗虫的平均产卵数(单位:个)和平均温度(单位:)有关.现收集到一只蝗虫的产卵数(个)和温度的8组观测数据,制成图1所示的散点图.现用两种模型①,②分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
      根据收集到的数据,计算得到如下值:
      表中,,,;
      (1)根据残差图,比较模型①、②的拟合效果,模型_____比较合适?根据所选择的模型,利用上表中的参考数据,求出关于的回归方程.
      (2)根据以往统计,该地每年平均温度达到以上时蝗虫会对农作物造成严重伤害,需要人工防治,其他情况均不需要人工防治.设该地每年平均温度达到以上的概率为,该地今后年恰好需要2次人工防治的概率为.
      ①求取得最大值时对应的概率;
      ②当取最大值时,设该地今后5年需要人工防治的次数为,求的均值和方差.
      附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,.
      3.(2025·福建泉州·模拟预测)泉州少年郎团队从2024年10月份以来,通过深度整合AI算法、大数据分析和自动化技术,不断优化产品与服务,显著提升了运营效率和市场竞争力,推动团队收入持续攀升.该团队在近7个月的经济收入(单位:百万元)的数据如下表:
      (1)根据以上数据绘制散点图,并根据散点图判断,与(均为大于零的常数)哪一个适宜作为该团队经济收入y关于月份x的回归方程模型?(给出判断即可,不必说明理由)并根据你的判断结果及表中的数据,求出y关于x的回归方程;
      (2)请你根据所求的回归方程,预测该团队下一个月的经济收入;
      (3)试从统计学角度分析,如果用所求的回归方程预测该团队接下来1年的经济收入情况是否合理?
      参考数据:
      其中设,
      参考公式:,.
      4.年初,哈尔滨利用冰雪资源成功吸引了大批游客前来旅游.年底,第二十六届哈尔滨冰雪大世界以“冰雪同梦,亚洲同心”为主题,再次邀请广大游客共赴冰雪之约.统计年这年月份来哈尔滨的游客数量(单位:万),并绘制散点图,如图所示(年份代码对应).
      (1)经计算得出下表中的数据,根据散点图,在模型①:与模型②:(均为常数)中,选择一个更适合作为每年月份来哈尔滨的游客数量关于年份代码的回归直线方程类型,并求出关于的回归直线方程.
      其中,.
      附:对于一组数据、、、,其回归直线的斜率和截距的最小二乘估计分别为,.参考数据:.
      (2)根据所求的回归直线方程预测年月份来哈尔滨的游客数量.
      5.(2023·江苏镇江·三模)经观测,长江中某鱼类的产卵数与温度有关,现将收集到的温度(单位:)和产卵数的10组观测数据作了初步处理,得到如图所示的散点图及一些统计量表.
      表中,,.
      (1)根据散点图判断,,与哪一个适宜作为与之间的回归方程模型(给出判断即可,不必说明理由),并求出关于的回归方程;
      (2)某兴趣小组抽取两批鱼卵,已知第一批中共有5个鱼卵,其中“死卵”有2个;第二批中共有6个鱼卵,其中“死卵”有3个.现随机挑选一批,然后从该批次中随机取出2个鱼卵,求取出“死卵”个数的分布列及数学期望.
      附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为,.
      6.(24-25高二上·黑龙江哈尔滨·期末)2024年初,哈尔滨利用得天独厚的冰雪资源,成功火出圈,吸引了大批游客前来旅游.2024年底,第26届哈尔滨冰雪大世界以“冰雪同梦,亚洲同心”为主题,再次邀请广大游客共赴冰雪之约.超级冰滑梯作为园区最具人气的娱乐项目,每年冬天都会吸引众多游客慕名前来体验,坐上专用爬犁,上演冰雪版的速度与激情,让游客大呼过瘾.为了提升游客的游玩体验,园区决定增加超级冰滑梯的滑道数量.现有开放滑道数量和游客平均排队等待时间的数据如下:
      (1)通过回归分析,可以利用模型对与的关系进行拟合.利用表中数据,求出关于的回归方程,并依据该模型预测,为了让游客的平均等待时间不超过40分钟,至少应开放多少条滑道?
      (2)园区内超级冰滑梯和雪花摩天轮2个项目每个项目的平均排队时间为60分钟,冰雪世界等4个体验项目每个项目的平均排队时间为40分钟,梦想大舞台等3个演出活动每个项目的平均排队时间为30分钟.由于天气原因,小红决定选择其中的3个项目进行游玩,求小红排队时间总和恰为120分钟的概率;
      (3)为吸引游客,园区开展了抽奖活动.现有一家三口参加该抽奖活动,有两种抽奖方式可供选择:
      方式①:三人独立抽奖,每人抽奖一次,每人中奖的概率为30%;
      方式②:三人组队抽奖,共抽奖三次,第一次中奖的概率为20%,若某次抽奖不中,那么下一次中奖的概率会增加10%,若已中奖,那么下一次中奖的概率恢复到20%.为使三人中奖次数的期望更大,应选择哪种抽奖方式?
      附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,.
      参考数据:设,,,,,,,,,,.
      7.(2023·四川·模拟预测)下表是某工厂记录的一个反应器投料后,连续8天每天某种气体的生成量(L):
      为了分析该气体生成量变化趋势、工厂分别用两种模型:①,②对变量x和y的关系进行拟合,得到相应的回归方程并进行残差分析,残差图如下:
      注:残差:经计算得,,,,其中,
      (1)根据残差图、比较模型①,模型②的拟合效果,应该选择哪个模型?并简要说明理由;
      (2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);
      (3)若在第8天要根据(2)问求出的回归方程来对该气体生成量做出预测,那么估计第9天该气体生成量是多少?(精确到个位)
      附:回归直线的斜率和截距的最小二乘估计公式分别为:,.
      8.某研发团队实现了从单点光谱仪到超光谱成像芯片的跨越.为制定下一年的研发投入计划,该研发团队需要了解年研发资金投入量(单位:亿元)对年销售额(单位:亿元)的影响.结合近12年的年研发资金投入量和年销售额,该团队建立了两个函数模型:①,②,其中均为常数,为自然对数的底数.经对历史数据的初步处理,得到散点图如图.令,计算得到如下数据.

      (1)设变量和变量的样本相关系数为,变量和变量的样本相关系数为,请从样本相关系数的角度,选择一个与相关性较强的模型.
      (2)(i)根据(1)的选择及表中数据,建立关于的经验回归方程(系数精确到0.01);
      (ii)若下一年销售额需达到80亿元,预测下一年的研发资金投入量.
      附:;样本相关系数;经验回归方程,其中.
      重难点题型5 独立性检验的应用
      1.(2025·浙江宁波·模拟预测)某校在2024年开展了两次劳动基地除草耕地活动,首次活动有800名学生参加.活动结束后,经评估发现有70%的学生的劳动技能得到了提升.为进一步增强劳动教育效果,学校汲取首次活动的经验并进行改进,第二次活动面向未参加第一次活动的学生开展.不仅增加了辨别杂草种类、合理使用农具等具有挑战性的任务,还特邀农业专家进行现场指导.已知第二次活动吸引了1200名学生参加,且活动结束后,有960名学生的劳动技能得到了提升.
      (1)补充完整下面的列联表;
      (2)依据小概率值的独立性检验,能否认为该校第二次除草耕地活动中学生的劳动技能提升与活动改进有关?
      (3)从参加第二次除草耕地活动的学生中按照劳动技能是否提升进行分层,用分层随机抽样的方法抽取20名学生进行意见调查,再从这20名学生中随机抽取3名进行深度访谈,求其中恰好有2名学生的劳动技能提升的概率.
      附:,.
      2.(2025·四川达州·模拟预测)为了让学生感受文学名著的语言魅力,品味文学名著的博大精深,某中学规定了包含中国四大名著在内的20本中外名著作为该校学生的必读书目.为了了解活动进行的情况,学校在高三年级男生、女生中按分层抽样的方式随机抽取了100名学生进行阅读书目数的调查.根据调查结果将阅读书目数分组为,,,,,得到这100名学生阅读书目数的频率分布直方图(左图)和其中男生阅读书目数的频数分布表(右表).已知该校高三年级男生、女生人数比例为3:2.
      (1)求右表中a的值并估计出该校高三年级女生的阅读书目数的众数.
      (2)学校规定阅读书目数不低于12的同学获优秀奖.完成下列列联表,并判断是否有95%的把握认为该中学高三年级学生获优秀奖与性别有关.
      附:,其中.
      3.某地区农户在推动农业机械化升级后,记录了某作物在接下来()年的增长数据(万吨),如下表所示:
      (1)经探究与之间具有相关关系,求关于的经验回归方程;
      (2)为了检验,两款机械设备的投放对某农作物的增收情况,在,两地区分别选取了两块相同面积的试验田来记录某年的增收情况,得到的数据如下表:
      根据小概率值的独立性检验,能否认为增收情况与使用,两种不同设备有关?
      参考公式:①,;
      ②(其中为样本容量).
      参考数据:
      4.(2025·云南玉溪·模拟预测)某个景点自从取消门票实行免费开放后,迅速成为网红打卡点,不仅带动了淡季的旅游,而且优化了旅游产业的结构.下表是该景点免费开放后前五个月的打卡人y数(万人)与第个月的数据:
      (1)根据表中数据可用一元线性回归模型刻画变量y与变量x之间的线性相关关系,且回归方程中的,请计算相关系数r(精确到0.01),并判断是否可以认为y与x的线性相关性很强;
      (2)为更好地改进服务,景点对每位游客进行了满意度调查,已知评分X近似服从正态分布,评分低于m的游客约占15.865%,求m的值;
      (3)为进一步了解游客性别与满意度的关系,随机抽查200名游客,得到如下列联表,请填写下面的2×2列联表,根据小概率值的独立性检验,能否推断游客是否满意与性别有关?
      参考公式:
      相关系数:若,则认为与有较强的线性相关性.
      回归方程中斜率的最小二乘法估计公式为:
      ,其中.
      临界值表:
      参考数据:,
      若,则,
      5.(2025·海南·模拟预测)交通强国,铁路先行,每年我国铁路部门都会根据运输需求进行铁路调图,一铁路线l上有自东向西依次编号为1,2,…,21的21个车站.
      (1)为调查乘客对调图的满意度,在编号为10和11两个站点多次乘坐列车的旅客中,随机抽取100名旅客,得出数据(不完整)如下表所示:
      完善表格数据并计算分析:依据小概率值的独立性检验,在这两个车站中,能否认为旅客满意程度与车站编号有关联?
      (2)根据以往调图经验,列车在编号为8至14的终到站每次调图时有的概率改为当前终到站的西侧一站,有的概率改为当前终到站的东侧一站,每次调图之间相互独立.已知原定终到站编号为11的列车经历了3次调图,第3次调图后的终到站编号记为,求的分布列及均值.
      附,其中.
      6.(2025·江苏盐城·模拟预测)智能驾驶是近年来人工智能、传感器、高精度地图等领域融合发展的产物,正在逐步改变着传统交通方式.智驾的安全性是目前公众和行业关注的焦点.某车评中心对智能驾驶系统进行天气场景测试,每次测试相互独立,数据整理如下:
      (1)根据测试数据判断,是否有的把握认为测试结果与天气类型有关?
      (2)用频率估计概率,车评中心在某个雨雪天又进行了数次独立测试,记测试成功的次数为,若,求车评中心测试的次数.
      参考公式:
      7.(2025·甘肃白银·模拟预测)在制造业智能化的趋势下,某企业委托机构随机调查了200名传统质检员,以评估AI质检系统对传统质检员数量的影响,部分数据如下表所示:
      (1)求,,,.
      (2)根据小概率值的独立性检验,能否认为质检系统的应用与传统质检员数量减少有关?
      (3)企业引入质检系统后,将对质检员开展三轮专项培训,已知每轮达到“熟练操作质检系统”水平(视为达标)的概率分别为,,,各轮结果相互独立,且规定两轮及以上达标者,方可操作该系统.某部门有48名质检员,规定培训通过(两轮及以上达标)者可获得500元奖金,求该部门为员工培训需准备的奖金总额的数学期望.
      附:.
      8.(2025·湖南岳阳·三模)在制造业智能化的趋势下,某企业委托机构随机调查了200名传统质检员,以评估质检系统对传统质检员数量的影响,部分数据如下表所示:
      (1)根据以上数据及小概率值的独立性检验,能否认为质检系统的应用与传统质检员数量减少有关?
      (2)该企业引入质检系统后,将对质检员开展三轮专项培训,已知每轮达到“熟练操作质检系统”水平(视为达标)的概率分别为,,,各轮结果相互独立,且规定两轮及以上达标者,方可操作该系统.
      ①某部门有48名质检员,规定培训通过(两轮及以上达标)者可获得500元奖金,求该部门为员工培训需准备的奖金总额的数学期望.
      ②调研发现,能操作质检系统的质检员中,70%的人薪资涨幅超过15%;不能操作质检系统的质检员中,30%的人薪资涨幅超过15%.若在质检员培训后,从中随机选取一人,其薪资涨幅超过15%,求该员工能操作质检系统的概率.
      附:,.
      序号
      题型
      重难点题型1
      变量间的相关关系的判断
      重难点题型2
      相关系数
      重难点题型3
      线性经验回归模型
      重难点题型4
      非线性经验回归模型
      重难点题型5
      独立性检验的应用
      超市
      A
      B
      C
      D
      E
      F
      广告支出x万元
      1
      2
      4
      6
      13
      10
      销售额y万元
      14
      21
      29
      30
      43
      37
      第年
      1
      2
      3
      4
      5
      利润/亿元
      2
      3
      4
      5
      7
      x
      3
      4
      5
      6
      y
      2.5
      m
      4
      4.5
      温度
      4
      8
      10
      18
      微生物数量(个)
      30
      22
      18
      14
      x
      45
      55
      65
      75
      y
      23
      38
      65
      74
      月份
      1
      2
      3
      4
      5
      订单
      20
      24
      43
      52
      (千克)
      2
      4
      5
      6
      8
      (千克)
      300
      400
      400
      400
      500
      年份






      序号
      第年
      第年
      第年
      第年
      第年
      第年
      贫困户数(百户)
      年份
      2020
      2021
      2022
      2023
      2024
      年份编号
      1
      2
      3
      4
      5
      核心产值规模
      1.5
      2.5
      3.4
      4.9
      7.8
      3
      4.02
      16.16
      104.91
      1.24
      22.54
      1.1
      1.5
      11.4
      24
      2.9
      646
      168
      422688
      50.4
      70308
      月份编号
      1
      2
      3
      4
      5
      6
      7
      收入(百万元)
      6
      11
      21
      34
      66
      101
      196
      435
      10.78
      2535
      50.12
      2.82
      3.47
      360
      54.5
      1360
      44
      384
      3
      588
      32
      6430
      滑道数量
      11
      12
      13
      14
      15
      平均等待时间(分钟)
      88
      81
      75
      70
      66
      日期代码x
      1
      2
      3
      4
      5
      6
      7
      8
      生成的气体y(L)
      4
      8
      16
      31
      51
      71
      97
      122
      20
      66
      770
      200
      14
      460
      4.20
      3125000
      0.308
      21500
      劳动技能提升的学生人数
      劳动技能未提升的学生人数
      合计
      首次活动
      第二次活动
      合计
      0.10
      0.05
      0.01
      2.706
      3.841
      6.635
      分组
      频数
      5
      a
      18
      18
      2
      获优秀奖
      未获优秀奖
      男生
      女生
      ()
      0.15
      0.10
      0.05
      0.025
      0.010
      2.072
      2.706
      3.841
      5.024
      6.635
      1
      2
      3
      4
      5
      26
      37
      50
      64
      93
      地区
      用M设备
      用设备
      A
      30
      20
      B
      15
      35
      0.100
      0.050
      0.010
      0.005
      0.001
      2.706
      3.841
      6.635
      7.879
      10.828
      x
      1
      2
      3
      4
      5
      y
      23.1
      37.0
      62.1
      111.6
      150.8
      喜欢
      不喜欢
      总计

      100

      60
      总计
      110
      0.010
      0.005
      0.001
      6.635
      7.879
      10.828
      车站编号
      满意
      不满意
      合计
      10
      35
      50
      11
      30
      合计
      55
      0.1
      0.01
      0.001
      2.706
      6.635
      10.828
      天气类型
      成功次数
      失败次数
      总计
      晴天
      80
      20
      100
      雨雪天
      50
      50
      100
      合计
      130
      70
      200
      0.1
      0.05
      0.01
      0.001
      2.706
      3.841
      6.635
      10.828
      AI质检系统的应用情况
      传统质检员数量
      合计
      减少
      未减少
      应用
      70

      120
      未应用
      50
      合计
      100
      200
      0.050
      0.010
      0.001
      3.841
      6.635
      10.828
      质检系统的应用情况
      传统质检员数量
      合计
      减少
      未减少
      应用
      70
      应用
      未应用
      50
      未应用
      合计
      100
      合计
      0.050
      0.010
      0.001
      3.841
      6.635
      10.828
      专题9.3 成对数据的统计分析
      目录●重难点题型分布
      重难点题型1 变量间的相关关系的判断
      1.(2025·安徽蚌埠·三模)医疗研究者会创建散点图来显示少女的体重指数(BMI)和身体脂肪百分比之间的相关关系,如图,下列说法正确的是( )
      A.BMI越大,脂肪百分比越大
      B.BMI越大,脂肪百分比越小
      C.BMI与脂肪百分比正相关
      D.BMI与脂肪百分比负相关
      【答案】C
      【难度】0.94
      【知识点】判断正、负相关、根据散点图判断是否线性相关
      【分析】根据散点图的特征可得正确的选项.
      【详解】由散点图可得BMI增大时,脂肪百分比或变大或变小,故AB错误;
      根据散点图的分布可得:BMI于脂肪百分正相关,故C正确,D错误;
      故选:C.
      2.(2025·甘肃庆阳·三模)下列说法正确的是( )
      A.数据7,5,3,10,2的第40百分位数是3
      B.已知随机变量,σ越小,表示随机变量X的分布越分散
      C.已知一组数据的方差为3,则的方差为3
      D.根据一组样本数据的散点图判断出两个变量线性相关,由最小二乘法求得其经验回归方程为,若其中一个点为,则实数
      【答案】C
      【难度】0.65
      【知识点】各数据同时加减同一数对方差的影响、用回归直线方程对总体进行估计、正态曲线的性质、总体百分位数的估计
      【分析】求出第40百分位数判断A;利用正态分布性质判断B;利用方差的意义判断C;利用经验回归方程的意义判断D.
      【详解】对于A,将数据从小到大排列为:2,3,5,7,10,,该数据的第40百分位数是=4,A错误;
      对于B,根据正态分布的特点,σ越小,表示随机变量X分布越集中,B错误;
      对于C,由方差的概念知,的方差为3,C正确;
      对于D,散点不一定在经验回归直线上,则不一定成立,D错误.
      故选:C
      3.(24-25高三下·云南昆明·阶段练习)下列残差图满足一元线性回归模型中对随机误差的假定的是( )
      A.B.
      C.D.
      【答案】A
      【难度】0.94
      【知识点】根据散点图判断是否线性相关、解释回归直线方程的意义、残差的计算
      【分析】根据一元线性回归模型中对随机误差的假定:残差应是均值为0、方差为的随机变量的观测值逐项分析即可求解.
      【详解】对于A,残差比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内,故A正确;
      对于B,残差与观测时间有线性关系,故B错误;
      对于C,残差与观测时间有非线性关系,故C错误;
      对于D,残差的方差不是一个常数,随观测时间变大而变大,故D错误.
      故选:A.
      4.(2024·四川攀枝花·一模)为了判断某地超市的销售额与广告支出之间的相关关系,现随机抽取6家超市,得到其广告支出与销售额数据如下表,则下列说法中正确的是( )
      A.广告支出数据的极差为9
      B.销售额数据的第80百分位数为43
      C.若销售额y与广告支出c之间的经验回归方程为,则
      D.若去掉超市A这一组数据,则销售额y与广告支出x之间的线性相关程度会减弱
      【答案】C
      【难度】0.65
      【知识点】计算几个数据的极差、方差、标准差、用回归直线方程对总体进行估计、根据样本中心点求参数、总体百分位数的估计
      【分析】对于A,根据极差的定义即可求解,对于B,根据百分位数的定义即可求解,对于C,求出样本中心点即可求解,对于D,根据相关程度定义即可求解.
      【详解】对于A,极差为,故A错误;
      对于B,销售额数据按照从小到大的顺序排列为共个数据,
      因为,所以销售额数据的第百分位数为,故B错误;
      对于C,,,
      样本中心点恒过线性回归方程,
      因为,所以,
      所以,故C正确;
      对于D,若去掉超市A这一组数据,因为超市的数据偏离其他数据较远,去掉后其他数据更集中,
      所以相关程度会更高,故D错误.
      故选:C.
      5.(2025·广西柳州·模拟预测)(多选题)某人工智能公司近5年的利润情况如下表所示:
      已知变量与之间具有线性相关关系,设用最小二乘法建立的回归直线方程为,则下列说法正确的是( )
      A.B.变量与之间的线性相关系数
      C.预测该人工智能公司第6年的利润约为7.8亿元D.残差绝对值的最大值为0.4
      【答案】ACD
      【难度】0.65
      【知识点】判断正、负相关、残差的计算、根据回归方程进行数据估计、根据样本中心点求参数
      【分析】首先求出、,根据回归直线方程必过,即可求出,即可判断A;从而得到回归直线方程,根据与成正相关,即可得到相关系数,即可判断B;再令求出,即可预测第6年的利润,即可判断C,最后根据残差的定义求解判断D.
      【详解】依题意,,
      因为回归直线方程为必过样本中心点,
      则,解得,故A正确;
      回归直线方程为,则与成正相关,即相关系数,故B错误;
      当时,,即该人工智能公司第6年的利润约为7.8亿元,故C正确;
      当时,,残差绝对值为,
      当时,,残差绝对值为,
      当时,,残差绝对值为,
      当时,,残差绝对值为,
      当时,,残差绝对值为,
      所以残差绝对值的最大值为0.4,故D正确;
      故选:ACD.
      6.(2025·山东泰安·模拟预测)(多选题)下列命题正确的是( )
      A.样本相关系数的绝对值越接近,成对样本数据的线性相关程度越强
      B.在经验回归方程=中,当解释变量每增加时,响应变量平均增加
      C.若,,则事件、相互独立与、互斥不可能同时成立
      D.若,,…,这个数据的平均数为,方差为,则,,…,,这个数据的方差为
      【答案】ACD
      【难度】0.65
      【知识点】计算几个数据的极差、方差、标准差、相关系数的意义及辨析、独立事件的判断、根据回归方程进行数据估计
      【分析】由回归分析与事件的独立性,互斥事件的概念,方差的计算公式逐项判断即可.
      【详解】对于选项A,样本相关系数的绝对值越接近,成对样本数据的线性相关程度越强,故A正确;
      对于选项B, 因为的系数为,所以当解释变量每增加时,响应变量平均减少,故B错误;
      对于选项C,若互斥,则,=0;
      若相互独立,则(因为,),
      所以事件相互独立与互斥不可能同时成立,故C正确;
      对于选项D,,故D正确.
      故选:ACD.
      7.(2025·天津红桥·二模)由表格数据得到的线性回归方程为,则表格中的m值为 .
      【答案】
      【难度】0.85
      【知识点】根据样本中心点求参数
      【分析】计算出样本的中心点坐标,将其代入可求得m的值.
      【详解】,,
      线性回归方程恒过,
      所以,解得:.
      故答案为:.
      8.(2023·四川德阳·一模)某科学兴趣小组的同学认为生物都是由蛋白质构成的,高温可以使蛋白质变性失活,于是想初步探究某微生物的成活率与温度的关系,微生物数量(个)与温度的部分数据如下表:
      由表中数据算得回归方程为,预测当温度为时,微生物数量为 个.
      【答案】9
      【难度】0.85
      【知识点】用回归直线方程对总体进行估计、根据样本中心点求参数
      【分析】求出样本点中心,代入回归方程得到,得回归方程,可进行预测.
      【详解】由表格数据可知,,,
      因为点在直线上,所以,
      即,故当时,,
      即预测当温度为时,微生物数量为9个.
      故答案为:9
      重难点题型2 相关系数
      1.(2025·上海浦东新·二模)研究变量x,y得到一组成对数据,,先进行一次线性回归分析,接着增加一个数据,其中,,再重新进行一次线性回归分析,则下列说法正确的是( )
      A.变量与变量的相关性变强B.相关系数的绝对值变小
      C.线性回归方程不变D.拟合误差Q变大
      【答案】C
      【难度】0.65
      【知识点】相关系数的意义及辨析、残差的计算、根据回归方程进行数据估计
      【分析】由已知可得,,求出相关系数,即可判断A,B选项,再利用回归直线方程过样本中心点可判断C选项,D利用残差平方和进行判断即可.
      【详解】设变量x,y的平均数分别为,,
      则,,即,,
      可知新数据的样本中心点不变,仍为,
      则,


      则相关系数.
      可知相关系数的值不变,变量与变量的相关性不变,故A,B错误;
      对于C,因为,所以不变,
      且线性回归方程过样本中心点,即,均不变,所以线性回归方程不变,故C正确;
      因为即为样本中心点,即,
      可知残差平方和不变,所以拟合误差Q不变,故D错误.
      故选:C.
      2.(2025·辽宁鞍山·一模)下列选项中,相关系数最小的是( )
      A.B.C.D.
      【答案】B
      【难度】0.94
      【知识点】相关系数的意义及辨析
      【分析】利用散点图变化趋势,判断相关系数的正负,由散点的集中程度确定大小,即可得到答案.
      【详解】对于A,该散点图中,散点呈现出一定的上升趋势,两变量之间具有强的线性相关关系,其线性相关系数接近于1;
      对于B,该散点图中,这些点紧密地聚集在一条直线附近.其线性相关系数接近于;
      对于C,该散点图中,散点呈现出一定的上升趋势,变量和之间具有较强的线性相关关系,其线性相关系数为正数;
      对于D,该散点图中,散点比较分散,线性相关程度比选项B要弱,线性相关系数比选项B的大.
      综合比较四个选项,选项B,线性负相关程度最强,所以线性相关系数最小.
      故选:B.
      3.(2025·天津·二模)为研究某奶茶店每日的热奶茶销售量和气温之间是否具有线性相关关系,统计该店(2025年2月6日至3月24日)每天的热奶茶销售量及当天气温得到如图所示的散点图(轴表示气温,轴表示热奶茶销售量),由散点图可知与的相关关系为( )
      A.正相关,相关系数的值为0.8B.负相关,相关系数的值为0.8
      C.正相关,相关系数的值为D.负相关,相关系数的值为
      【答案】D
      【难度】0.94
      【知识点】判断正、负相关、相关系数的意义及辨析
      【分析】根据正负相关的概念判断.
      【详解】由散点图知随着的增大而减小,因此是负相关.相关系数为负.
      故选:D.
      4.对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
      A.B.
      C.D.
      【答案】A
      【难度】0.94
      【知识点】判断正、负相关、相关系数的意义及辨析
      【分析】根据相关系数的概念即可判断.
      【详解】由图可知图(1)和图(3)是正相关,故相关系数为正,又因为图(1)的点较图(3)的点分布密集,故相关性图(1)更好,相关系数较大,即;
      图(2)和图(4)是负相关,故相关系数为负,又因为图(2)的点较图(4)的点分布密集,故相关性图(2)更好,相关系数的绝对值较大,即,故;
      综上可知:,
      故选:A.
      5.(2025·湖北黄冈·二模)(多选题)为研究光照时长(小时)和种子发芽数量(颗)之间的关系,某课题研究小组采集了10组数据,绘制散点图如图所示,并进行线性回归分析,若去掉点后,下列说法正确的是( )
      A.决定系数变大
      B.相关系数变小
      C.残差平方和变小
      D.这些数据中的x的平均值变小,的平均值变大
      【答案】AC
      【难度】0.65
      【知识点】计算几个数的平均数、相关系数的意义及辨析、残差的计算
      【分析】由图可知:点较其他的点偏离直线最大,所以去掉点后,回归效果更好.结合相关系数、决定系数、残差平方和以及点的横纵坐标平均值逐项分析判断.
      【详解】由图可知:较其他的点偏离直线最大,所以去掉点后,回归效果更好.
      对于A,决定系数越接近于1,拟合效果越好,所以去掉点后,决定系数变大,故A正确;
      对于B,相关系数越接近于1,线性相关性越强,因为散点图是递增的趋势,所以去掉点后,相关系数变大,故B错误;
      对于C,残差平方和变大,拟合效果越差,所以去掉点后,残差平方和变小,故C正确;
      对于D,由图可知,点在所有点中,横坐标较小,纵坐标较大,所以去掉点后,x的平均值变大,的平均值变小,故D错误;
      故选:AC.
      6.(2025·内蒙古包头·二模)(多选题)一组样本数据.其中,,求得其经验回归方程为:,残差为.对样本数据进行处理:,得到新的数据,求得其经验回归方程为,其残差为分布如图所示,且,,则( )
      A.样本正相关B.
      C.D.处理后的决定系数变大
      【答案】BD
      【难度】0.85
      【知识点】线性回归、相关系数的意义及辨析、相关指数的计算及分析、根据样本中心点求参数
      【分析】A选项,根据线性回归方程斜率的正负进行判断;B选项,线性回归方程必过样本中心,代入相应值求解;C选项,根据残差分布图中点的离散程度进行判断;D选项,处理后的数据的经验回归方程的斜率绝对值更大,因此决定系数变大.
      【详解】A选项,因为原始数据的经验回归方程为,斜率为负数,
      所以样本负相关,A选项错误;
      B选项,,所以,B选项正确;
      C选项,由图可知处理后的数据的残差分布更集中,说明处理后的数据的残差方差更小,所以,C错误;
      D选项,处理后的数据的经验回归方程的斜率绝对值更大,
      这表明处理后的数据的线性关系更强,因此决定系数变大,D选项正确.
      故选:BD
      重难点题型3 线性回归模型
      1.为了解温度对物质参与的某种化学反应的影响,研究小组在不同温度条件下做了四次实验,实验中测得的温度x(单位:°C)与的转化率y% (转化率=)的数据如下表所示:
      (1)求y与x的相关系数(结果精确到0.01);
      (2)该研究小组随后又进行了一次该实验,其中的起始量为50 g,反应结束时还剩余2.5 g,若已知y关于x的线性回归方程为,估计这次实验是在多少摄氏度的温度条件下进行的..
      参考数据: ,,,.
      参考公式:相关系数
      【答案】(1)
      (2)85°C
      【难度】0.85
      【知识点】线性回归、相关系数的计算
      【分析】(1)计算出,带入相关系数的计算公式,即可算出答案.
      (2)由线性回归方程必过样本中心点,即可算出的值,根据题意算出带入回归方程即可算出答案.
      【详解】(1),
      所以

      (2)根据回归直线的性质,,即,得.
      由条件可知,
      令,得,
      因此估计这次实验是在85°C的温度条件下进行的.
      2.防疫抗疫,人人有责,随着奥密克戎的全球肆虐,防疫形势越来越严峻,防疫物资需求量急增.下表是某口罩厂今年的月份与订单(单位:万元)的几组对应数据:
      (1)求关于的线性回归方程,并估计6月份该厂的订单数;
      (2)求相关系数(精确到0.01),说明与之间具有怎样的相关关系.
      参考数据:,,.,.参考公式:相关系数;回归直线的方程是,其中.
      【答案】(1),6月份该厂的订单数为59.9万元;
      (2),与之间具有很强的正相关关系.
      【难度】0.85
      【知识点】求回归直线方程、线性回归、相关系数的计算、根据回归方程进行数据估计
      【分析】(1)求出与的值,可得关于的线性回归方程,取求得值得答案;
      (2)由已知数据求得值,可得与的相关系数近似为0.99,故与之间的线性相关程度相当高.
      【详解】(1)解:由题可得:,


      关于的线性回归方程为,
      2022年6月对应的变量为6,将代入,
      得,
      估计6月份该厂的订单数为59.9万元.
      (2)相关系数.
      与之间具有很强的正相关关系.
      3.(2024·甘肃·二模)人工智能教育是将人工智能与传统教育相结合,借助人工智能和大数据技术打造的智能化教育生态.为了解我国人工智能教育发展状况,通过中国互联网数据平台得到我国2015年-2020年人工智能教育市场规模统计图.如图所示,若用x表示年份代码(2015年用1表示,2016年用2表示,依次类推),用y表示市场规模(单位:亿元),试回答:
      (1)根据条形统计图中数据,计算变量y与x的相关系数r,并用r判断两个变量y与x相关关系的强弱(精确到小数点后2位);
      (2)若y与x的相关关系拟用线性回归模型表示,试求y关于x的线性回归方程,并据此预测2022年中国人工智能教育市场规模(精确到1亿元).
      附:线性回归方程,其中;
      相关系数;
      参考数据:.
      【答案】(1),正相关很强.
      (2),2677亿元.
      【难度】0.65
      【知识点】线性回归、相关系数的意义及辨析、相关系数的计算
      【分析】(1)根据统计图中数据计算,代入相关系数公式求出相关系数,判断相关系数的绝对值与0.75的关系即可;
      (2)根据统计图中数据结合公式即可求出线性回归方程,将x=8代入线性回归方程即可预测2022年中国人工智能教育市场规模.
      【详解】(1)∵,,,,
      ∴相关系数.
      ∵相关系数,∴y与x具有线性相关关系,且正相关很强.
      (2)设y关于x的线性回归方程为,
      其中;

      ∴y关于x的线性回归方程为,
      把代入得(亿元),
      故据此预测2022年中国人工智能教育市场规模将达到约2677亿元.
      4.(2024·河南焦作·二模)小李准备在某商场租一间商铺开服装店,为了解市场行情,在该商场调查了20家服装店,统计得到了它们的面积x(单位:)和日均客流量y(单位:百人)的数据,并计算得,,,.
      (1)求y关于x的回归直线方程;
      (2)已知服装店每天的经济效益,该商场现有的商铺出租,根据(1)的结果进行预测,要使单位面积的经济效益Z最高,小李应该租多大面积的商铺?
      附:回归直线的斜率和截距的最小二乘估计分别为:,.
      【答案】(1)
      (2)小李应该租的商铺
      【难度】0.65
      【知识点】利用给定函数模型解决实际问题、求回归直线方程、线性回归
      【分析】(1)由已知条件结合回归直线公式可求出回归直线方程,
      (2)根据题意得,,构造函数,利用二次函数的性质可求出其最大值,从而可求出Z的最大值
      【详解】(1)由已知可得,,


      所以回归直线方程为.
      (2)根据题意得,.
      设,令,,
      则,
      当,即时,取最大值,
      又因为k,,所以此时Z也取最大值,
      因此,小李应该租的商铺.
      5.(23-24高二下·山东潍坊·期中)为实施乡村振兴,科技兴农,某村建起了田园综合体,并从省城请来专家进行技术指导.根据统计,该田园综合体西红柿亩产量的增加量(千克)与某种液体肥料每亩使用量(千克)之间的对应数据如下.
      (1)由上表数据可知,可用线性回归模型拟合与的关系,请计算相关系数并加以说明(若,则线性相关程度很高,可用线性回归模型拟合);
      (2)求关于的回归方程,并预测当液体肥料每亩使用量为15千克时,西红柿亩产量的增加量约为多少千克?
      附:相关系数公式,参考数据:.
      回归方程中斜率和截距的最小二乘估计公式分别为,.
      【答案】(1)0.95,答案见解析;(2)700千克.
      【难度】0.85
      【知识点】求回归直线方程、线性回归、相关系数的计算、根据回归方程进行数据估计
      【分析】(1)根据表中的数据先求出,再求,,,然后利用公式求出相关系,再作判断即可,
      (2)根据线性回归方程公式求出回归方程,然后将代入回归方程中可求得西红柿亩产量的增加量
      【详解】解:(1)由已知数据可得,

      所以,


      所以相关系数.
      因为,所以可用线性回归模型拟合与的关系.
      (2),,
      所以回归方程为.
      当时,,
      即当液体肥料每亩使用量为15千克时,西红柿由产量的增加量约为700千克.
      6.(2024全国·三模)年月日,习近平总书记在减贫与发展高层论坛上强调,中国扶贫工作要实施精准扶贫方略,坚持中国制度优势,坚持分类施策.当年月日,中共中央政治局召开会议,审议通过了《关于打赢脱贫攻坚战的决定》等有关文件,会议确定了通过产业扶持、转移就业、教育支持和医疗救助等措施帮助万左右贫困人口脱贫的目标.下表为某贫困县在实施扶贫政策过程中贫困户的统计数据:
      (1)从这六组数据的贫困户数中任意抽取两个值,(百户),设为四舍五入后的整数值,求随机变量的分布列及期望值;
      (2)以年五组数据进行相关性分析发现,贫困户数(百户)与年份的序号存在较强的线性相关性,试用最小二乘法求相应的回归方程,并利用2020年的数据对该回归方程进行检验.若实际数与预测值的差值的绝对值不超过户,则认为回归方程可靠.请问该回归方程是否可靠?
      附:回归方程中斜率和截距的最小二乘法公式为:,.
      【答案】(1)分布列见解析;期望为;(2);该回归方程可靠.
      【难度】0.85
      【知识点】线性回归、写出简单离散型随机变量分布列、求离散型随机变量的均值
      【分析】(1)根据题意先求的所有取值,再求概率、分布列及期望;
      (2)根据题中的数据利用最小二乘法公式可求回归方程,再检验即可.
      【详解】(1)用表示取得的数据分别为和,则所有的基本事件有,,,,,,,,,,,,,,共个,对应的的取值分别为,,,,,,,,,,,,,,,即的取值有,,,,,且
      ,,,,,
      故变量的分布列为:
      期望值.
      (2)根据题意知,,,
      所以
      则.
      所以.
      当时,,而预测数与实际数的差值的绝对值为
      (百户),即差值为户,所以该回归方程可靠.
      重难点题型4 非线性经验回归模型
      1.(2025·云南·模拟预测)自2020年以来,某地区人工智能核心产值规模呈快速增长态势,下表给出了近5年该地区的人工智能核心产值规模(单位:亿元).
      (1)若用作为回归模型,并已求得,,,求此模型下的决定系数(精确到0.01).
      (2)若用作为回归模型,
      ①求的值;
      ②已知该模型下的决定系数,请说明哪种回归模型拟合效果更好,并用拟合效果好的模型预测2025年该地区的人工智能核心产值规模.
      参考数据:
      附:(1)上表中;
      (2)一组数据,其经验回归直线的斜率和截距的最小二乘估计公式分别为,,决定系数.
      【答案】(1)
      (2)①,,②预测2025年该地区的人工智能核心产值规模为(亿元).
      【难度】0.65
      【知识点】求回归直线方程、非线性回归
      【分析】(1)利用决定系数公式计算即可;
      (2)①将指数模型两边取对数转化为线性模型,利用最小二乘法求解,即可求解;②通过比较判断模型优劣,并代入预测2025年产值即可.
      【详解】(1)由题意可得,
      所以决定系数
      (2)将两边取对数,可得,
      设,则模型为,其中,
      因为,
      所以

      所以,
      则,
      所以,,
      因为该模型下的决定系数,大于线性模型下的决定系数,
      故指数模型拟合效果更好,
      令,可得(亿元),
      故预测2025年该地区的人工智能核心产值规模为(亿元).
      2.(2025·海南省直辖县级单位·模拟预测)蝗虫能对农作物造成严重伤害,每只蝗虫的平均产卵数(单位:个)和平均温度(单位:)有关.现收集到一只蝗虫的产卵数(个)和温度的8组观测数据,制成图1所示的散点图.现用两种模型①,②分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图2所示的残差图.
      根据收集到的数据,计算得到如下值:
      表中,,,;
      (1)根据残差图,比较模型①、②的拟合效果,模型_____比较合适?根据所选择的模型,利用上表中的参考数据,求出关于的回归方程.
      (2)根据以往统计,该地每年平均温度达到以上时蝗虫会对农作物造成严重伤害,需要人工防治,其他情况均不需要人工防治.设该地每年平均温度达到以上的概率为,该地今后年恰好需要2次人工防治的概率为.
      ①求取得最大值时对应的概率;
      ②当取最大值时,设该地今后5年需要人工防治的次数为,求的均值和方差.
      附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,.
      【答案】(1)模型①,;
      (2)①;②均值为2,方差为
      【难度】0.4
      【知识点】由导数求函数的最值(不含参)、求回归直线方程、非线性回归、服从二项分布的随机变量概率最大问题
      【分析】(1)根据残差点的分布情况即可确定函数模型①的拟合效果较好,将非线性回归转化为线性回归,根据所给数据代入公式即可得回归方程;
      (2)①由题意表示,利用导数分析函数单调性和最值可得结果;
      ②由①得每年需要人工防治的概率为,故服从二项分布,根据二项分布的均值和方差公式即可得解.
      【详解】(1)模型①更合适,理由如下:
      模型①残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型②带状区域宽度窄,
      所以模型①的拟合效果更好,故选模型①比较合适.
      令,则,
      由所给的参考数据可得,,
      所以,
      因此关于的线性回归方程为,即,
      所以产卵数关于温度的回归方程为.
      (2)①由题意得,,
      所以

      令,得,当时,,当时,,
      所以在上单调递增,在上单调递减,
      所以取得最大值时对应的概率;
      ②由①知,当时,取最大值,
      所以当时,,
      由题意可知每年需要人工防治的概率为,且服从二项分布,
      所以,.
      3.(2025·福建泉州·模拟预测)泉州少年郎团队从2024年10月份以来,通过深度整合AI算法、大数据分析和自动化技术,不断优化产品与服务,显著提升了运营效率和市场竞争力,推动团队收入持续攀升.该团队在近7个月的经济收入(单位:百万元)的数据如下表:
      (1)根据以上数据绘制散点图,并根据散点图判断,与(均为大于零的常数)哪一个适宜作为该团队经济收入y关于月份x的回归方程模型?(给出判断即可,不必说明理由)并根据你的判断结果及表中的数据,求出y关于x的回归方程;
      (2)请你根据所求的回归方程,预测该团队下一个月的经济收入;
      (3)试从统计学角度分析,如果用所求的回归方程预测该团队接下来1年的经济收入情况是否合理?
      参考数据:
      其中设,
      参考公式:,.
      【答案】(1)适宜,
      (2)347百万元
      (3)不合理
      【难度】0.65
      【知识点】解释回归直线方程的意义、求回归直线方程、非线性回归、根据回归方程进行数据估计
      【分析】(1)看到形式,通过取对数转化成的形式,把复杂形式变简单. 算出的均值、的均值和这些值. 用公式算出,再把样本中心点代入求出,进而得到回归方程.
      (2)把代入回归方程,算出对应的值,得到预测收入.
      (3)经验回归方程有时效性,所以判断预测不合理.
      【详解】(1)散点图如图所示,
      根据散点图判断,适宜作为5G经济收入y关于月代码x的回归方程类型,
      ,两边同时取常用对数得:,
      设,,




      把样本中心点代入,得:,
      ,,

      y关于x的回归方程:.
      (2)当时,,
      所以预测该公司2025年5月份的经济收入估计为347百万元.
      (3)不合理,经验回归方程一般具有时效性,解释变量越接近样本数据,预测值比较可信,否则会有显著误差.
      4.年初,哈尔滨利用冰雪资源成功吸引了大批游客前来旅游.年底,第二十六届哈尔滨冰雪大世界以“冰雪同梦,亚洲同心”为主题,再次邀请广大游客共赴冰雪之约.统计年这年月份来哈尔滨的游客数量(单位:万),并绘制散点图,如图所示(年份代码对应).
      (1)经计算得出下表中的数据,根据散点图,在模型①:与模型②:(均为常数)中,选择一个更适合作为每年月份来哈尔滨的游客数量关于年份代码的回归直线方程类型,并求出关于的回归直线方程.
      其中,.
      附:对于一组数据、、、,其回归直线的斜率和截距的最小二乘估计分别为,.参考数据:.
      (2)根据所求的回归直线方程预测年月份来哈尔滨的游客数量.
      【答案】(1)选择,回归方程为
      (2)万
      【难度】0.65
      【知识点】非线性回归、根据回归方程进行数据估计
      【分析】(1)根据散点图可作出判断,令,所以,利用最小二乘法求出、的值,即可得出回归方程;
      (2)将代入回归方程,可得结果.
      【详解】(1)由散点图可知,更适合作为每年月份来哈尔滨的游客数量关于年份代码的回归直线方程类型.
      因为,所以.
      因为,,,,
      所以,
      所以,所以回归方程为.
      所以每年月份来哈尔滨的游客数量关于年份代码的回归直线方程为.
      (2)当时,,
      所以预测年月份来哈尔滨的游客数量为万.
      5.(2023·江苏镇江·三模)经观测,长江中某鱼类的产卵数与温度有关,现将收集到的温度(单位:)和产卵数的10组观测数据作了初步处理,得到如图所示的散点图及一些统计量表.
      表中,,.
      (1)根据散点图判断,,与哪一个适宜作为与之间的回归方程模型(给出判断即可,不必说明理由),并求出关于的回归方程;
      (2)某兴趣小组抽取两批鱼卵,已知第一批中共有5个鱼卵,其中“死卵”有2个;第二批中共有6个鱼卵,其中“死卵”有3个.现随机挑选一批,然后从该批次中随机取出2个鱼卵,求取出“死卵”个数的分布列及数学期望.
      附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为,.
      【答案】(1)适宜作为与之间的回归方程模型,
      (2)答案见解析,.
      【难度】0.65
      【知识点】非线性回归、求离散型随机变量的均值、利用全概率公式求概率
      【分析】(1)根据散点图确定模型,代入数据计算即可;
      (2)确定随机变量取值,结合全概率公式计算概率,进而可求解;
      【详解】(1)根据散点图判断,看出样本点分布在一条指数函数的周围,所以适宜作为与之间的回归方程模型.
      令,则,


      所以,
      所以关于的回归方程为.
      (2)由题意设随机挑选一批,取出两个鱼卵,其中“死卵”个数为,则的可能取值为,,,
      设“所取两个鱼卵来自第批”,
      所以,
      设“所取两个鱼卵有个‘死卵’”,
      由全概率公式得



      所以取出“死卵”个数的分布列为
      所以,
      所以取出“死卵”个数的数学期望为.
      6.(24-25高二上·黑龙江哈尔滨·期末)2024年初,哈尔滨利用得天独厚的冰雪资源,成功火出圈,吸引了大批游客前来旅游.2024年底,第26届哈尔滨冰雪大世界以“冰雪同梦,亚洲同心”为主题,再次邀请广大游客共赴冰雪之约.超级冰滑梯作为园区最具人气的娱乐项目,每年冬天都会吸引众多游客慕名前来体验,坐上专用爬犁,上演冰雪版的速度与激情,让游客大呼过瘾.为了提升游客的游玩体验,园区决定增加超级冰滑梯的滑道数量.现有开放滑道数量和游客平均排队等待时间的数据如下:
      (1)通过回归分析,可以利用模型对与的关系进行拟合.利用表中数据,求出关于的回归方程,并依据该模型预测,为了让游客的平均等待时间不超过40分钟,至少应开放多少条滑道?
      (2)园区内超级冰滑梯和雪花摩天轮2个项目每个项目的平均排队时间为60分钟,冰雪世界等4个体验项目每个项目的平均排队时间为40分钟,梦想大舞台等3个演出活动每个项目的平均排队时间为30分钟.由于天气原因,小红决定选择其中的3个项目进行游玩,求小红排队时间总和恰为120分钟的概率;
      (3)为吸引游客,园区开展了抽奖活动.现有一家三口参加该抽奖活动,有两种抽奖方式可供选择:
      方式①:三人独立抽奖,每人抽奖一次,每人中奖的概率为30%;
      方式②:三人组队抽奖,共抽奖三次,第一次中奖的概率为20%,若某次抽奖不中,那么下一次中奖的概率会增加10%,若已中奖,那么下一次中奖的概率恢复到20%.为使三人中奖次数的期望更大,应选择哪种抽奖方式?
      附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,.
      参考数据:设,,,,,,,,,,.
      【答案】(1),21条
      (2)
      (3)方式一
      【难度】0.65
      【知识点】非线性回归、计算古典概型问题的概率、二项分布的均值、均值的实际应用
      【分析】(1)根据所给的数据,利用最小二乘估计法求和,即可求解回归方程,再根据方程转化为不等式,即可求解;
      (2)根据古典概型概率公式,结合组合公式,即可求解;
      (3)分别求两个方式的分布,以及期望,比较大小,即可判断.
      【详解】(1)设,
      则,,∴
      令,,∴至少应开放21条滑道
      (2)设事件“小红排队时间总和恰为120分钟”
      则4个体验项目选取3个,或是超级冰滑梯和雪花摩天轮选1个,或是梦想大舞台3个中选2个,则

      (3)方式①:中奖次数,
      方式二:设中奖次数为


      ,所以选方式一
      7.(2023·四川·模拟预测)下表是某工厂记录的一个反应器投料后,连续8天每天某种气体的生成量(L):
      为了分析该气体生成量变化趋势、工厂分别用两种模型:①,②对变量x和y的关系进行拟合,得到相应的回归方程并进行残差分析,残差图如下:
      注:残差:经计算得,,,,其中,
      (1)根据残差图、比较模型①,模型②的拟合效果,应该选择哪个模型?并简要说明理由;
      (2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);
      (3)若在第8天要根据(2)问求出的回归方程来对该气体生成量做出预测,那么估计第9天该气体生成量是多少?(精确到个位)
      附:回归直线的斜率和截距的最小二乘估计公式分别为:,.
      【答案】(1)选择模型①,理由见解析;
      (2);
      (3)157L.
      【难度】0.65
      【知识点】非线性回归、残差的计算、根据回归方程进行数据估计
      【分析】(1)根据残差意义分析即可;
      (2)求出,结合已知数据代入公式计算即可;
      (3)将代入回归方程即可得到预测值.
      【详解】(1)选择模型①,理由如下:
      根据残差图可以看出:模型①的残差点分布在x轴附近,模型②的残差点距离x轴较远,
      所以,模型②的残差明显比模型①大,所以模型①的拟合效果相对较好;
      (2)由(1)可知y关于x的回归方程为,
      令,则,
      由所给的数据可得,


      则,
      所以y关于x的回归方程为.
      (3)将代入回归方程,可得,
      所以预测该气体第9天的生成量约为157L.
      8.某研发团队实现了从单点光谱仪到超光谱成像芯片的跨越.为制定下一年的研发投入计划,该研发团队需要了解年研发资金投入量(单位:亿元)对年销售额(单位:亿元)的影响.结合近12年的年研发资金投入量和年销售额,该团队建立了两个函数模型:①,②,其中均为常数,为自然对数的底数.经对历史数据的初步处理,得到散点图如图.令,计算得到如下数据.

      (1)设变量和变量的样本相关系数为,变量和变量的样本相关系数为,请从样本相关系数的角度,选择一个与相关性较强的模型.
      (2)(i)根据(1)的选择及表中数据,建立关于的经验回归方程(系数精确到0.01);
      (ii)若下一年销售额需达到80亿元,预测下一年的研发资金投入量.
      附:;样本相关系数;经验回归方程,其中.
      【答案】(1)模型中与的相关性较强.
      (2)(i);(ii)27.1亿元.
      【难度】0.65
      【知识点】求回归直线方程、非线性回归、相关系数的意义及辨析、根据回归方程进行数据估计
      【分析】(1)分别将表中数据代入相关系数公式求出,比较大小即可判断;
      (2)(i)由取对数,换元得,由表中数据分别求和,得经验回归方程,利用指数式和对数式的互化,即得;
      (ii)将代入回归方程,利用题设条件,即可预测下一年的研发资金投入量.
      【详解】(1)由题意知
      .
      因为,所以,
      故从样本相关系数的角度,模型中与的相关性较强.
      (2)(i)由,得,即.
      因为,
      所以,
      故关于的经验回归方程为,即
      ,所以.
      (ii)将代入得.
      ,故得,解得,
      故预测下一年的研发资金投入量是27.1亿元.
      重难点题型5 独立性检验的应用
      1.(2025·浙江宁波·模拟预测)某校在2024年开展了两次劳动基地除草耕地活动,首次活动有800名学生参加.活动结束后,经评估发现有70%的学生的劳动技能得到了提升.为进一步增强劳动教育效果,学校汲取首次活动的经验并进行改进,第二次活动面向未参加第一次活动的学生开展.不仅增加了辨别杂草种类、合理使用农具等具有挑战性的任务,还特邀农业专家进行现场指导.已知第二次活动吸引了1200名学生参加,且活动结束后,有960名学生的劳动技能得到了提升.
      (1)补充完整下面的列联表;
      (2)依据小概率值的独立性检验,能否认为该校第二次除草耕地活动中学生的劳动技能提升与活动改进有关?
      (3)从参加第二次除草耕地活动的学生中按照劳动技能是否提升进行分层,用分层随机抽样的方法抽取20名学生进行意见调查,再从这20名学生中随机抽取3名进行深度访谈,求其中恰好有2名学生的劳动技能提升的概率.
      附:,.
      【答案】(1)列联表见详解
      (2)能
      (3)
      【难度】0.65
      【知识点】完善列联表、卡方的计算、计算古典概型问题的概率
      【分析】(1)由已知条件即可完成列联表;
      (2)由独立性检验知识可以完成判断;
      (3)依据组合的知识和古典概型公式即可求解.
      【详解】(1)首次活动劳动技能提升的学生人数70%人;
      首次活动劳动技能未提升的学生人数人;
      第二次活动劳动技能提升的学生人数为人;
      第二次活动劳动技能未提升的学生人数人,
      (2)零假设为
      该校第二次除草耕地活动中学生的劳动技能提升与活动改进无关,

      根据小概率值的独立性检验,推断不成立,
      即该校第二次除草耕地活动中学生的劳动技能提升与活动改进有关,该推断犯错误的概率不超过.
      (3)抽取的名学生中劳动技能得到提升的人数为人,抽取的名学生中劳动技能未得到提升的人数为人,
      记从这20名学生中随机抽取3名进行深度访谈,其中恰好有2名学生的劳动技能提升为事件,则.
      2.(2025·四川达州·模拟预测)为了让学生感受文学名著的语言魅力,品味文学名著的博大精深,某中学规定了包含中国四大名著在内的20本中外名著作为该校学生的必读书目.为了了解活动进行的情况,学校在高三年级男生、女生中按分层抽样的方式随机抽取了100名学生进行阅读书目数的调查.根据调查结果将阅读书目数分组为,,,,,得到这100名学生阅读书目数的频率分布直方图(左图)和其中男生阅读书目数的频数分布表(右表).已知该校高三年级男生、女生人数比例为3:2.
      (1)求右表中a的值并估计出该校高三年级女生的阅读书目数的众数.
      (2)学校规定阅读书目数不低于12的同学获优秀奖.完成下列列联表,并判断是否有95%的把握认为该中学高三年级学生获优秀奖与性别有关.
      附:,其中.
      【答案】(1);14
      (2)列联表见解析,没有95%的把握
      【难度】0.65
      【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、卡方的计算、独立性检验解决实际问题
      【分析】(1)根据分层抽样的比例求出男生人数即可求出,再根据100名学生、男生的频数求出女生的频数,最后根据众数的定义即可;
      (2)根据联表求出,再根据独立性检验即可判断.
      【详解】(1)抽取的100名学生中,男生有人,所以,
      解得.

      所以女生的阅读书目数的众数估计值为.
      (2)列联表为:
      假设:该中学学生获优秀奖与性别无关,
      所以,.
      故没有95%的把握认为该中学高三年级学生获优秀奖与性别有关.
      3.某地区农户在推动农业机械化升级后,记录了某作物在接下来()年的增长数据(万吨),如下表所示:
      (1)经探究与之间具有相关关系,求关于的经验回归方程;
      (2)为了检验,两款机械设备的投放对某农作物的增收情况,在,两地区分别选取了两块相同面积的试验田来记录某年的增收情况,得到的数据如下表:
      根据小概率值的独立性检验,能否认为增收情况与使用,两种不同设备有关?
      参考公式:①,;
      ②(其中为样本容量).
      参考数据:
      【答案】(1)
      (2)认为增收情况与使用,两种不同设备有关
      【难度】0.85
      【知识点】求回归直线方程、卡方的计算、独立性检验解决实际问题
      【分析】(1)由题意分别求出,,,,从而可求解;
      (2)设出零假设,再利用独立性检验即可求解.
      【详解】(1)由题意得,,,
      ,,
      .

      故经验回归方程为.
      (2)零假设为:增收情况与设备相互独立,即增收情况与使用不同设备无关联.
      则.
      根据小概率值的独立性检验,不成立,
      所以认为增收情况与使用,两种不同设备有关.
      4.(2025·云南玉溪·模拟预测)某个景点自从取消门票实行免费开放后,迅速成为网红打卡点,不仅带动了淡季的旅游,而且优化了旅游产业的结构.下表是该景点免费开放后前五个月的打卡人y数(万人)与第个月的数据:
      (1)根据表中数据可用一元线性回归模型刻画变量y与变量x之间的线性相关关系,且回归方程中的,请计算相关系数r(精确到0.01),并判断是否可以认为y与x的线性相关性很强;
      (2)为更好地改进服务,景点对每位游客进行了满意度调查,已知评分X近似服从正态分布,评分低于m的游客约占15.865%,求m的值;
      (3)为进一步了解游客性别与满意度的关系,随机抽查200名游客,得到如下列联表,请填写下面的2×2列联表,根据小概率值的独立性检验,能否推断游客是否满意与性别有关?
      参考公式:
      相关系数:若,则认为与有较强的线性相关性.
      回归方程中斜率的最小二乘法估计公式为:
      ,其中.
      临界值表:
      参考数据:,
      若,则,
      【答案】(1),可以认为与有较强的线性相关性;
      (2)
      (3)答案见解析
      【难度】0.65
      【知识点】相关系数的计算、独立性检验解决实际问题、根据正态曲线的对称性求参数
      【分析】(1)根据题给数据算出平均数,再根据参考数据及,再对和进行求值,即可得到的值,再根据相关系数公式求解即可;
      (2)根据正态分布曲线的对称性求出,即可求出;
      (3)根据题给数据完成列联表,再根据公式代值求解,再与比较大小,即可得解.
      【详解】(1)由题可知,,

      则,可得,
      相关系数

      可以认为与有较强的线性相关性.
      (2)因,则,
      因,
      则.
      (3)填写下面的列联表
      由表可知,,
      零假设:游客是否满意与性别无关,

      所以根据小概率值的独立性检验,能推断游客是否满意与性别有关.
      5.(2025·海南·模拟预测)交通强国,铁路先行,每年我国铁路部门都会根据运输需求进行铁路调图,一铁路线l上有自东向西依次编号为1,2,…,21的21个车站.
      (1)为调查乘客对调图的满意度,在编号为10和11两个站点多次乘坐列车的旅客中,随机抽取100名旅客,得出数据(不完整)如下表所示:
      完善表格数据并计算分析:依据小概率值的独立性检验,在这两个车站中,能否认为旅客满意程度与车站编号有关联?
      (2)根据以往调图经验,列车在编号为8至14的终到站每次调图时有的概率改为当前终到站的西侧一站,有的概率改为当前终到站的东侧一站,每次调图之间相互独立.已知原定终到站编号为11的列车经历了3次调图,第3次调图后的终到站编号记为,求的分布列及均值.
      附,其中.
      【答案】(1)列联表见解析,认为旅客满意程度与车站编号有关联;
      (2)分布列见解析,.
      【难度】0.65
      【知识点】卡方的计算、独立性检验解决实际问题、写出简单离散型随机变量分布列、求离散型随机变量的均值
      【分析】(1)根据题目所给数据补充表格即可,先零假设为:旅客满意程度与车站编号无关,接着依据表格数据计算”的值,比较与的大小,再结合独立性检验的思想方法即可下结论得解;
      (2)先由题得的取值,接着依次计算每个取值相应的概率即可得的分布列,再根据均值公式即可直接计算求解的均值.
      【详解】(1))补充列联表如下:
      零假设为:旅客满意程度与车站编号无关,则,
      所以根据小概率值的独立性检验,推断不成立,
      即认为旅客满意程度与车站编号有关联.
      (2)由题的可能取值为8,10,12,14,
      则;;
      ;,
      所以的分布列为
      所以.
      6.(2025·江苏盐城·模拟预测)智能驾驶是近年来人工智能、传感器、高精度地图等领域融合发展的产物,正在逐步改变着传统交通方式.智驾的安全性是目前公众和行业关注的焦点.某车评中心对智能驾驶系统进行天气场景测试,每次测试相互独立,数据整理如下:
      (1)根据测试数据判断,是否有的把握认为测试结果与天气类型有关?
      (2)用频率估计概率,车评中心在某个雨雪天又进行了数次独立测试,记测试成功的次数为,若,求车评中心测试的次数.
      参考公式:
      【答案】(1)有
      (2)11
      【难度】0.85
      【知识点】卡方的计算、独立性检验解决实际问题、建立二项分布模型解决实际问题
      【分析】(1)根据独立性检验的思想,求出,然后与临界值比较即可判断;
      (2)由题意,求出后列式求解即可.
      【详解】(1)提出假设为:测试结果与天气类型没有关系,
      根据列联表中数据,求得,
      可以推断假设不成立.因此有的把握认为,测试结果与天气类型有关.
      (2)设车评中心测试的次数为,则,
      则,
      因为,所以即,
      所以车评中心测试的次数为11.
      7.(2025·甘肃白银·模拟预测)在制造业智能化的趋势下,某企业委托机构随机调查了200名传统质检员,以评估AI质检系统对传统质检员数量的影响,部分数据如下表所示:
      (1)求,,,.
      (2)根据小概率值的独立性检验,能否认为质检系统的应用与传统质检员数量减少有关?
      (3)企业引入质检系统后,将对质检员开展三轮专项培训,已知每轮达到“熟练操作质检系统”水平(视为达标)的概率分别为,,,各轮结果相互独立,且规定两轮及以上达标者,方可操作该系统.某部门有48名质检员,规定培训通过(两轮及以上达标)者可获得500元奖金,求该部门为员工培训需准备的奖金总额的数学期望.
      附:.
      【答案】(1),,,
      (2)能
      (3)元
      【难度】0.65
      【知识点】完善列联表、独立性检验解决实际问题、利用互斥事件的概率公式求概率、二项分布的均值
      【分析】(1)由列联表相关概念,结合数据,可得答案;
      (2)由列联表中的数据计算出卡方,根据独立性检验,可得答案;
      (3)由互斥事件的概率加法,根据二项分布的均值,可得答案.
      【详解】(1)由表格数据,得,,,.
      (2)零假设为:质检系统的应用与传统质检员数量减少无关.
      根据列联表中的数据,经计算得到,
      根据小概率值的独立性检验,推断不成立,
      此推断犯错误的概率不大于0.010,即认为质检系统的应用与传统质检员数量减少有关.
      (3)设表示“第轮达标”,表示“能操作质检系统”,

      设培训后能操作质检系统的人数为,,,
      则奖金总额的数学期望为元.
      8.(2025·湖南岳阳·三模)在制造业智能化的趋势下,某企业委托机构随机调查了200名传统质检员,以评估质检系统对传统质检员数量的影响,部分数据如下表所示:
      (1)根据以上数据及小概率值的独立性检验,能否认为质检系统的应用与传统质检员数量减少有关?
      (2)该企业引入质检系统后,将对质检员开展三轮专项培训,已知每轮达到“熟练操作质检系统”水平(视为达标)的概率分别为,,,各轮结果相互独立,且规定两轮及以上达标者,方可操作该系统.
      ①某部门有48名质检员,规定培训通过(两轮及以上达标)者可获得500元奖金,求该部门为员工培训需准备的奖金总额的数学期望.
      ②调研发现,能操作质检系统的质检员中,70%的人薪资涨幅超过15%;不能操作质检系统的质检员中,30%的人薪资涨幅超过15%.若在质检员培训后,从中随机选取一人,其薪资涨幅超过15%,求该员工能操作质检系统的概率.
      附:,.
      【答案】(1)有关,理由见解析
      (2)①17000;②
      【难度】0.65
      【知识点】卡方的计算、独立性检验解决实际问题、独立事件的乘法公式、求离散型随机变量的均值
      【分析】(1)先根据已知条件,列出列联表,做出零假设,计算的值,即可得出结论;
      (2)①根据独立事件的概率计算公式得到员工培训通过的概率,利用二项分布的期望公式以及期望的性质进行计算;②利用条件概率公式和全概率公式进行计算.
      【详解】(1)依题意,列联表如下:
      零假设:质检系统的应用与传统质检员数量减少无关,
      由列联表中数据得,,
      根据小概率值的独立性检验,推断不成立,
      即认为质检系统的应用与传统质检员数量减少有关,此推断犯错误的概率不大于.
      (2)①设“员工第轮达标”(),且相互独立,
      设“员工培训通过”,


      设48名质检员中培训通过的人数为,该部门为员工培训需准备的奖金金额为,
      由题意得,,所以,

      所以该部门为员工培训需准备的奖金金额的数学期望为17000.
      ②设为能操作质检系统,为薪资涨幅超15%,
      ,,,,


      所以该员工能操作质检系统的概率为.
      序号
      题型
      重难点题型1
      变量间的相关关系的判断
      重难点题型2
      相关系数
      重难点题型3
      线性经验回归模型
      重难点题型4
      非线性经验回归模型
      重难点题型5
      独立性检验的应用
      超市
      A
      B
      C
      D
      E
      F
      广告支出x万元
      1
      2
      4
      6
      13
      10
      销售额y万元
      14
      21
      29
      30
      43
      37
      第年
      1
      2
      3
      4
      5
      利润/亿元
      2
      3
      4
      5
      7
      x
      3
      4
      5
      6
      y
      2.5
      m
      4
      4.5
      温度
      4
      8
      10
      18
      微生物数量(个)
      30
      22
      18
      14
      x
      45
      55
      65
      75
      y
      23
      38
      65
      74
      月份
      1
      2
      3
      4
      5
      订单
      20
      24
      43
      52
      (千克)
      2
      4
      5
      6
      8
      (千克)
      300
      400
      400
      400
      500
      年份






      序号
      第年
      第年
      第年
      第年
      第年
      第年
      贫困户数(百户)
      年份
      2020
      2021
      2022
      2023
      2024
      年份编号
      1
      2
      3
      4
      5
      核心产值规模
      1.5
      2.5
      3.4
      4.9
      7.8
      3
      4.02
      16.16
      104.91
      1.24
      22.54
      1.1
      1.5
      11.4
      24
      2.9
      646
      168
      422688
      50.4
      70308
      月份编号
      1
      2
      3
      4
      5
      6
      7
      收入(百万元)
      6
      11
      21
      34
      66
      101
      196
      435
      10.78
      2535
      50.12
      2.82
      3.47
      360
      54.5
      1360
      44
      384
      3
      588
      32
      6430
      0
      1
      2
      滑道数量
      11
      12
      13
      14
      15
      平均等待时间(分钟)
      88
      81
      75
      70
      66
      日期代码x
      1
      2
      3
      4
      5
      6
      7
      8
      生成的气体y(L)
      4
      8
      16
      31
      51
      71
      97
      122
      20
      66
      770
      200
      14
      460
      4.20
      3125000
      0.308
      21500
      劳动技能提升的学生人数
      劳动技能未提升的学生人数
      合计
      首次活动
      第二次活动
      合计
      0.10
      0.05
      0.01
      2.706
      3.841
      6.635
      劳动技能提升的学生人数
      劳动技能未提升的学生人数
      合计
      首次活动
      560
      240
      800
      第二次活动
      960
      240
      1200
      合计
      1520
      480
      2000
      分组
      频数
      5
      a
      18
      18
      2
      获优秀奖
      未获优秀奖
      男生
      女生
      ()
      0.15
      0.10
      0.05
      0.025
      0.010
      2.072
      2.706
      3.841
      5.024
      6.635
      区间
      频数(抽取的100名学生)
      频数(男生)
      频数(女生)
      5
      4
      17
      6
      18
      10
      18
      16
      2
      4
      获优秀奖
      未获优秀奖
      男生
      20
      40
      女生
      20
      20
      1
      2
      3
      4
      5
      26
      37
      50
      64
      93
      地区
      用M设备
      用设备
      A
      30
      20
      B
      15
      35
      0.100
      0.050
      0.010
      0.005
      0.001
      2.706
      3.841
      6.635
      7.879
      10.828
      x
      1
      2
      3
      4
      5
      y
      23.1
      37.0
      62.1
      111.6
      150.8
      喜欢
      不喜欢
      总计

      100

      60
      总计
      110
      0.010
      0.005
      0.001
      6.635
      7.879
      10.828
      喜欢
      不喜欢
      总计

      70
      30
      100

      40
      60
      100
      总计
      110
      90
      200
      车站编号
      满意
      不满意
      合计
      10
      35
      50
      11
      30
      合计
      55
      0.1
      0.01
      0.001
      2.706
      6.635
      10.828
      车站编号
      满意
      不满意
      合计
      10
      35
      15
      50
      11
      20
      30
      50
      合计
      55
      45
      100
      8
      10
      12
      14
      天气类型
      成功次数
      失败次数
      总计
      晴天
      80
      20
      100
      雨雪天
      50
      50
      100
      合计
      130
      70
      200
      0.1
      0.05
      0.01
      0.001
      2.706
      3.841
      6.635
      10.828
      AI质检系统的应用情况
      传统质检员数量
      合计
      减少
      未减少
      应用
      70

      120
      未应用
      50
      合计
      100
      200
      0.050
      0.010
      0.001
      3.841
      6.635
      10.828
      质检系统的应用情况
      传统质检员数量
      合计
      减少
      未减少
      应用
      70
      应用
      未应用
      50
      未应用
      合计
      100
      合计
      0.050
      0.010
      0.001
      3.841
      6.635
      10.828
      质检系统的应用情况
      传统质检员数量
      合计
      减少
      未减少
      应用
      70
      50
      120
      未应用
      30
      50
      80
      合计
      100
      100
      200

      相关试卷

      2026年高考数学一轮复习重点难点题练习(新高考)专题9.3成对数据的统计分析(五类重难点题型精练)原卷版+解析:

      这是一份2026年高考数学一轮复习重点难点题练习(新高考)专题9.3成对数据的统计分析(五类重难点题型精练)原卷版+解析,共73页。试卷主要包含了与温度的部分数据如下表等内容,欢迎下载使用。

      2026年高考数学一轮复习重点难点题练习(新高考)专题9.1随机抽样、常用的统计图表(五类重难点题型精练)原卷版+解析:

      这是一份2026年高考数学一轮复习重点难点题练习(新高考)专题9.1随机抽样、常用的统计图表(五类重难点题型精练)原卷版+解析,共44页。

      新高考数学一轮复习高频考点与题型分类训练8-3 成对数据的统计分析 (精讲精练)(2份,原卷版+解析版):

      这是一份新高考数学一轮复习高频考点与题型分类训练8-3 成对数据的统计分析 (精讲精练)(2份,原卷版+解析版),文件包含新高考数学一轮复习高频考点与题型分类训练8-3成对数据的统计分析精讲精练原卷版doc、新高考数学一轮复习高频考点与题型分类训练8-3成对数据的统计分析精讲精练解析版doc等2份试卷配套教学资源,其中试卷共122页, 欢迎下载使用。

      资料下载及使用帮助
      版权申诉
      • 1.电子资料成功下载后不支持退换,如发现资料有内容错误问题请联系客服,如若属实,我们会补偿您的损失
      • 2.压缩包下载后请先用软件解压,再使用对应软件打开;软件版本较低时请及时更新
      • 3.资料下载成功后可在60天以内免费重复下载
      版权申诉
      若您为此资料的原创作者,认为该资料内容侵犯了您的知识产权,请扫码添加我们的相关工作人员,我们尽可能的保护您的合法权益。
      入驻教习网,可获得资源免费推广曝光,还可获得多重现金奖励,申请 精品资源制作, 工作室入驻。
      版权申诉二维码
      高考专区
      • 精品推荐
      • 所属专辑48份
      欢迎来到教习网
      • 900万优选资源,让备课更轻松
      • 600万优选试题,支持自由组卷
      • 高质量可编辑,日均更新2000+
      • 百万教师选择,专业更值得信赖
      微信扫码注册
      手机号注册
      手机号码

      手机号格式错误

      手机验证码获取验证码获取验证码

      手机验证码已经成功发送,5分钟内有效

      设置密码

      6-20个字符,数字、字母或符号

      注册即视为同意教习网「注册协议」「隐私条款」
      QQ注册
      手机号注册
      微信注册

      注册成功

      返回
      顶部
      添加客服微信 获取1对1服务
      微信扫描添加客服
      Baidu
      map