(新高考)高考数学三轮冲刺大题优练5《成对数据的统计分析》(2份打包,解析版+原卷版)
展开
例1.这一年来人类与新型冠状病毒的“战争”让人们逐渐明白一个道理,人类社会组织模式的差异只是小事情,病毒在地球上存在了三四十亿年,而人类的文明史不过只有几千年而已,人类无法消灭病毒,只能与之共存或者病毒自然消亡,在病毒面前,个体自由要服从于集体或者群体生命的价值.在传染病学中,通常把从致病刺激物侵入机体内或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期,因此我们应该注意做好良好的防护措施和隔离措施.某研究团队统计了某地区10000名患者的相关信息,得到如表表格:
潜伏期(天) | |||||||
人数 | 600 | 1900 | 3000 | 2500 | 1600 | 250 | 150 |
(1)新冠肺炎的潜伏期受诸多因素的影响,为研究潜伏期与年龄的关系,通过分层抽样从10000名患者中抽取200人进行研究,完成下面的2×2列联表,并判断能否在犯错误的概率不超过0001的前提下认为潜伏期与患者年龄有关?
| 潜伏期天 | 潜伏期天 | 总计 |
60岁以上(含60岁) |
|
| 150 |
60岁以下 | 30 |
|
|
总计 |
|
| 200 |
(2)依据上述数据,将频率作为概率,且每名患者的潜伏期是否超过8天相互独立.为了深入研究,该团队在这一地区抽取了20名患者,其中潜伏期不超过8天的人数最有可能是多少?
附:.
0150 | 0100 | 0050 | 0025 | 0010 | 0005 | 0001 | |
2072 | 2706 | 3841 | 5024 | 6635 | 7879 | 10828 |
【答案】(1)表格见解析,能;(2)16名.
【解析】(1)由表中数据可知,潜伏期大于8天的人数为人,
补充完整的2×2列联表如下,
| 潜伏期天 | 潜伏期天 | 总计 |
60岁以上(含60岁) | 130 | 20 | 150 |
60岁以下 | 30 | 20 | 50 |
总计 | 160 | 40 | 200 |
所以,
故能在犯错误的概率不超过的前提下认为潜伏期与患者年龄有关.
(2)该地区10000名患者中潜伏期不超过8天的人数为名,
将频率视为概率,潜伏期不超过8天的概率为,
所以抽取的20名患者中潜伏期不超过8天的人数最有可能是名.
例2.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限(单位:年)与失效费(单位:万元)的统计数据如下表所示:
使用年限(单位:年) | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
失效费(单位:万元) | 290 | 330 | 360 | 440 | 480 | 520 | 590 |
(1)由上表数据可知,可用线性回归模型拟合与的关系.请用相关系数加以说明;(精确到)
(2)求出关于的线性回归方程,并估算该种机械设备使用10年的失效费.
参考公式:相关系数.
线性回归方程中斜率和截距最小二乘估计计算公式,.
参考数据:,,.
【答案】(1)见解析;(2),万元.
【解析】(1)由题意,知,,
,
∴结合参考数据知:.
因为与的相关系数近似为,所以与的线性相关程度相当大,
从而可以用线性回归模型拟合与的关系.
(2)∵,∴.
∴关于的线性回归方程为,
将代入线性回归方程,得.
∴估算该种机械设备使用10年的失效费为万元.
例3.近年来,明代著名医药学家李时珍故乡黄冈市蕲春县大力发展大健康产业,蕲艾产业化种植已经成为该县脱贫攻坚的主要产业之一,已知蕲艾的株高y(单位:cm)与一定范围内的温度x(单位:℃)有关,现收集了蕲艾的13组观测数据,得到如下的散点图:
现根据散点图利用或建立y关于x的回归方程,令,得到如下数据:
且与(i=1,2,3,…,13)的相关系数分别为,,且.
(1)用相关系数说明哪种模型建立y与x的回归方程更合适;
(2)根据(1)的结果及表中数据,建立关于x的回归方程;
(3)已知蕲艾的利润z与x、y的关系为,当x为何值时,z的预报值最大.
参考数据和公式:,,,
对于一组数据 (i=1,2,3,…,n),其回归直线方程的斜率和截距的最小二乘法估计分别为,,相关系数.
【答案】(1)用模型建立与的回归方程更合适;(2);(3)当温度为20℃时这种草药的利润最大.
【解析】(1)由题意知,,
因为,所有用模型建立与的回归方程更合适.
(2)因为,,
所以关于的回归方程为.
(3)由题意知,
所以,当且仅当时等号成立,
所以当温度为20℃时这种草药的利润最大.
1.在新型冠状病毒疫情期间,某高中学校实施线上教学,为了解线上教学的效果,随机抽取了名学生对线上教学效果进行评分(满分100分),记低于的评分为“效果一般”,不低于分为“效果较好”.
(1)请补充完整列联表;通过计算判断,有没有99%的把握认为线上教学效果评分为“效果较好”与性别有关?
| 效果一般 | 效果较好 | 合计 |
男 |
|
| |
女 |
| ||
合计 |
|
|
|
(2)用(1)中列联表的数据估计全校线上教学的效果,用频率估计概率.从该校学生中任意抽取人,记所抽取的人中线上教学“效果较好”的人数为,求的分布列和数学期望.
附表及公式:
其中,.
【答案】(1)列联表见解析,有的把握认为;(2)分布列见解析,.
【解析】(1)由题意,补充后的列联表为:
| 效果一般 | 效果较好 | 合计 |
男 | |||
女 | |||
合计 |
则,
因此有的把握认为线上教学效果评分为“效果较好”与性别有关.
(2)随机变量的值可能为,
由题可知,线上教学“效果较好”的频率为,则,
可得;;
;.
则随机变量的分布列为
所以(或).
2.如图是市旅游局宣传栏中的一幅标题为“2012~2019年我市接待游客人次”的统计图.根据该统计图提供的信息解决下列问题.
(1)求市在所统计的这8年中接待游客人次的平均值和中位数;
(2)在所统计的8年中任取两年,记其中接待游客人次不低于平均数的年份数为,求的分布列和数学期望;
(3)由统计图可看出,从2016年开始,市接待游客的人次呈直线上升趋势,请你用线性回归分析的方法预测2021年市接待游客的人次.
①参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘法估计分别为,.
②参考数据:
0 | 1 | 2 | 3 | |
90 | 330 |
【答案】(1)平均数为(万人次),中位数为(万人次);(2)分布列见解析,数学期望为;(3)1365万人次.
【解析】(1)平均数为(万人次),
中位数为(万人次).
(2)不低于平均数的有3年,的可能取值为0,1,2,
则;;.
所以的分布列为
0 | 1 | 2 | |
故.
(3)
2016 | 2017 | 2018 | 2019 | |
330 | 510 | 720 | 960 |
简化变量:
0 | 1 | 2 | 3 | |
90 | 330 |
,,,.
,.
.
当时,,,所以,所以.
即2021年接待的游客约为1365万人次.
3.首届中国国际进口博览会在国家会展中心(上海)举行,吸引了58个“一带一路”沿线国家的超过1000多家企业参展,成为共建“一带一路”的又一个重要支撑.某企业为了参加这次盛会,提升行业竞争力,加大了科技投入.该企业连续6年来的科技投入(百万元)与收益(百万元)的数据统计如下:
科技投入 | 2 | 4 | 6 | 8 | 10 | 12 |
收益 | 56 | 65 | 120 | 275 | 800 | 1292 |
并根据数据绘制散点图如图所示:
根据散点图的特点,甲认为样本点分布在指数曲线的周围,据此他对数据进行了一些初步处理.如下表:
其中,.
(1)(ⅰ)请根据表中数据,建立关于的回归方程(保留一位小数);
(ⅱ)根据所建立的回归方程,若该企业想在下一年收益达到2亿,则科技投入的费用至少要多少?(其中)
(2)乙认为样本点分布在二次曲线的周围,并计算得回归方程为,以及该回归模型的相关指数,试比较甲乙两人所建立的模型,谁的拟合效果更好.
附:对于一组数据,,,,,其回归直线的斜率和截距的最小二乘估计分别为,.相关指数:.
【答案】(1)(ⅰ);(ⅱ)百万元;(2)甲建立的回归模型拟合效果更好.
【解析】(1)(ⅰ),
令,令,则.
根据最小二乘估计可知:,
从而,故回归方程为,即.
(ⅱ)设,解得,即,
故科技投入的费用至少要百万元,下一年的收益才能达到2亿.
(2)甲建立的回归模型的残差:
则,从而,
即甲建立的回归模型拟合效果更好.
4.重庆十一中某组同学为参加第20届中国青少年机器人竞赛重庆赛区选拔赛,需要从工厂订制零件,已知该厂有两条不同生产线和,同学们为保证质量,现从各自生产的产品中分别随机抽取20件,进行品质鉴定,鉴定成绩的茎叶图如下所示:
该零件的质量评价标准规定:鉴定成绩达到的零件,质量等级为优秀;鉴定成绩达到的零件,质量等级为良好;鉴定成绩达到的零件,质量等级为合格.将这组数据的频率视为整批产品的概率.
(1)请完成下面质量等级与生产线产品列联表,并判断能不能在犯错误的概率不超过的情况下,认为产品等级是否达到良好以上与生产产品的生产线有关;
| 生产线的产品 | 生产线的产品 | 合计 |
良好以上 |
|
|
|
合格 |
|
|
|
合计 |
|
|
|
(2)从等级为优秀的样本中随机抽取两件,记为来自生产线的产品数量,写出的分布列,并求的数学期望;
(3)为了确定机器人身上的零件个数与使用寿命的关系,同时又兼顾灵敏性,同学们通过实践研究把和的数据作了初步处理,得到下面的散点图及一些统计量的值.
上表中,.
根据散点图直接判断(不必说明理由)与哪一个适宜作为y关于x的回归方程类型?
并根据表中数据建立y关于x的回归方程.
附:.
对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为,.
【答案】(1)列联表见解析,不能在误差不超过的情况下,认为产品等级是否达到良好以上与生产产品的机器有关;(2)分布列见解析,;(3)更适合,.
【解析】(1)由已知可得,列联表为:
| A生产的产品 | B生产的产品 | 合计 |
良好以上 | 6 | 12 | 18 |
合格 | 14 | 8 | 22 |
合计 | 20 | 20 | 40 |
,
所以不能在误差不超过的情况下,认为产品等级是否达到良好以上与生产产品的机器有关.
(2)从茎叶图可以知道,样本中优秀的产品有2个来自A工厂,3个来自B工厂,
所以X的可能取值为0,1,2.
,,,
X的分布列为:
X | 0 | 1 | 2 |
P | 01 | 06 | 03 |
所以.
(3)根据散点图的形状更接近函数的图象可以判断出更适合,令,先建立y关于w的线性回归方程.
由,.
所以y关于w的线性回归方程为,
因此y关于x的回归方程为.
(新高考)高考数学三轮冲刺大题优练13《导数极值点偏移》(2份打包,解析版+原卷版): 这是一份(新高考)高考数学三轮冲刺大题优练13《导数极值点偏移》(2份打包,解析版+原卷版),文件包含新高考高考数学三轮冲刺大题优练13《导数极值点偏移》解析版doc、新高考高考数学三轮冲刺大题优练13《导数极值点偏移》原卷版doc等2份试卷配套教学资源,其中试卷共17页, 欢迎下载使用。
(新高考)高考数学三轮冲刺大题优练12《导数研究根的个数问题》(2份打包,解析版+原卷版): 这是一份(新高考)高考数学三轮冲刺大题优练12《导数研究根的个数问题》(2份打包,解析版+原卷版),文件包含新高考高考数学三轮冲刺大题优练12《导数研究根的个数问题》解析版doc、新高考高考数学三轮冲刺大题优练12《导数研究根的个数问题》原卷版doc等2份试卷配套教学资源,其中试卷共18页, 欢迎下载使用。
(新高考)高考数学三轮冲刺大题优练11《导数恒成立问题》(2份打包,解析版+原卷版): 这是一份(新高考)高考数学三轮冲刺大题优练11《导数恒成立问题》(2份打包,解析版+原卷版),文件包含新高考高考数学三轮冲刺大题优练11《导数恒成立问题》解析版doc、新高考高考数学三轮冲刺大题优练11《导数恒成立问题》原卷版doc等2份试卷配套教学资源,其中试卷共14页, 欢迎下载使用。