所属成套资源:新高考数学概率统计分章节特训专题练习(原卷版+解析)
新高考数学概率统计分章节特训专题01线性回归方程专题练习(原卷版+解析)
展开
这是一份新高考数学概率统计分章节特训专题01线性回归方程专题练习(原卷版+解析),共21页。试卷主要包含了已知下列说法,已知与之间的一组数据,已知一组数据点等内容,欢迎下载使用。
A.B.C.D.
例2.已知下列说法:
①对于线性回归方程,变量增加一个单位时,平均增加5个单位;
②在线性回归模型中,相关指数越接近于1,则模型回归效果越好;
③两个随机变量的线性相关性越强,则相关系数就越接近1;
④互斥事件不一定是对立事件,对立事件一定是互斥事件;
⑤演绎推理是从特殊到一般的推理,它的一般模式是“三段论”.
其中说法错误的个数为
A.1B.2C.3D.4
例3.变量,之间的一组相关数据如表所示:若,之间的线性回归方程为,则的值为
A.B.C.D.
例4.我国技术研发试验在年进行,分为关键技术试验、技术方案验证和系统验证三个阶段实施.2020年初以来,技术在我国已经进入高速发展的阶段,手机的销量也逐渐上升,某手机商城统计了近5个月来手机的实际销量,如表所示:
若与线性相关,且求得线性回归方程为,则下列说法正确的是
A.
B.与正相关
C.与的相关系数为负数
D.12月份该手机商城的手机销量约为365部
例5.已知与之间的一组数据:
已求得关于与的线性回归方程,则的值为 .
例6.邢台市物价部门对市区的天一城、北国商城、恒大城、家乐园、中北世纪城5家商场的某件商品在7月15号一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如表所示:
已知销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的 .
例7.已知一组数据点:
用最小二乘法得到其线性回归方程为,若数据,,,的平均数为1,则 .
例8.垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化、减量化处理.某市为调査产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据,,2,,,其中和分别表示第个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得,,,,.
(1)请用相关系数说明该组数据中与之间的关系可用线性回归模型进行拟合;
(2)求关于的线性回归方程;
(3)某科研机构研发了两款垃圾处理机器,如表是以往两款垃圾处理机器的使用年限(整年)统计表:
某环保机构若考虑购买其中一款垃圾处理器,以使用年限的频率估计概率.根据以往经验估计,该机构选择购买哪一款垃圾处理机器,才能使用更长久?
参考公式:相关系数.
对于一组具有线性相关关系的数据,,2,,,其回归直线的斜率和截距的最小二乘估计分别为:,.
例9.近年来,高铁的发展逐渐改变了人们的出行方式,我国年高铁运营里程的数据如表所示.
(Ⅰ)求关于的线性回归方程;
(Ⅱ)每一年与前一年的高铁运营里程之差即为该年新增的里程,若用年每年新增里程的频率代替之后每年新增相应里程的概率,求2023年中国高铁运营里程大于或等于5万千米的概率.
附:线性回归方程中斜率和截距的最小二乘估计公式分别为:,.
例10.某地区2013年至2019年居民纯收入(单位:千元)的部分数据如表所示:
2018和2019年的居民纯收入(单位:千元)数据采用随机抽样的方式获得,用样本的均值来代替当年的居民人均纯收入,其数据如下:
2018年抽取的居民纯收入(单位:千元)数据:5.2 4.8 6.5 5.6 6.0 7.1 6.1 7.3 5.9 7.5
2019年抽取的居民纯收入(单位:千元)数据:6.2 7.8 6.6 5.8 7.1 6.8 7.2 7.9 5.9 7.7
(Ⅰ)求关于的线性回归方程;
(Ⅱ)当地政府为了提高居民收入水平,现从2018和2019年居民纯收入(单位:千元)高于7.0千元的样本中随机选择3人进行座谈,了解其工作行业及主要收入来源.设为选出的3人中2018年纯收入高于7.0千元的人数,求随机变量的分布列和数学期望.
附:回归直线的斜率和截距的最小二乘法估计公式分别为:,.
例11.为了缓解日益拥堵的交通状况,不少城市实施车牌竞价策略,以控制车辆数量.某地车牌竞价的基本规则是:
①“盲拍”,即所有参与竞拍的人都是网络报价,每个人不知晓其他人的报价,也不知道参与当期竞拍的总人数;②竞价时间截止后,系统根据当期车牌配额,按照竞拍人的出价从高到低分配名额.某人拟参加2020年12月份的车牌竞拍,他为了预测最低成交价,根据竞拍网站的公告.统计了最近5个月参与竞拍的人数(见表)
(1)由收集数据的散点图发现1可用线性回归模型拟合竞拍人数(万人)与月份编号之间的相关关系.请用最小二乘法求关于的线性回归方程:,并预测2020年12月份参与竞拍的人数.
(2)某市场调研机构对200位拟参加2020年12月份车牌竞拍人员的报价价格进行了一个抽样调查,得到如下的一份频数表:
(ⅰ)求这200为竞拍人员报价的平均数值和样本方差(同一区间的报价可用该价格区间的中点值代替);
(ⅱ)假设所有参与竞价人员的报价可视为服从正态分布,且与可分别由(ⅰ)中所求的样本平均数及估值.若2020年12月份实际发放车牌数量是3174,请你合理预测(需说明理由)竞拍的最低成交价.
参考公式及数据:①回归方程,其中,;
②;
③若随机变量服从正态分布,则,,.
④方差.
例12.某医疗专家组为了研究新冠肺炎病毒在特定环境下一周内随时间变化的繁殖情况,得到如下的实验数据:
(1)由如表数据可知,可用线性回归模型拟合与的关系,求关于的线性回归方程;
(Ⅱ)若由线性回归方程得到的估计数据与实验数据的误差不超过0.5,则该实验数据是“理想数据”,现从实验数据中随机抽取3个,求“理想数据”的个数的分布列和数学期望.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为,.
例13.在线教育的发展,有利于弥补乡村教育短板,为我国各地区教育均衡发展提供了条件年《政府工作报告》明确提出发展“互联网教育”促进优质资源共享.下面是年我国在线教育网络使用率的统计表:
其散点图如图:
设日期代码.
(Ⅰ)求关于的线性回归方程;
(Ⅱ)根据线性回归方程,预测2025年我国在线教育网络使用率约达到多少?
附:回归直线中斜率和截距的最小二乘估计公式:,.
例14.学校食堂统计了最近5天到餐厅就餐的人数(百人)与食堂向食材公司购买所需食材(原材料)的数量(袋,得到如下统计表:
(1)根据所给的5组数据,求出关于的线性回归方程;
(2)已知购买食材的费用(元与数量(袋的关系为,投入使用的每袋食材相应的销售单价为700元,多余的食材必须无偿退还食材公司,据悉下周一大约有1500人到食堂餐厅就餐.根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材,才能获得最大利润,最大利润是多少?(注:利润销售收入原材料费用)
参考公式:,.
参考数据:,,.
(次数分钟)
20
30
40
50
60
25
27.5
29
32.5
36
4
5
6
7
8.2
7.8
6.6
5.4
月份
2020年6月
2020年7月
2020年8月
2020年9月
2020年10月
月份编号
1
2
3
4
5
销量部
50
96
185
227
0
1
2
3
3
5.5
7
价格
8.5
9
11
11.5
销售量
12
6
7
5
使用年限
台数
款式
1年
2年
3年
4年
5年
甲款
5
20
15
10
50
乙款
15
20
10
5
50
年份
2015
2016
2017
2018
2019
年份代码
1
2
3
4
5
高铁运营里程(万千米)
1.9
2.2
2.5
2.9
3.5
年份
2013
2014
2015
2016
2017
2018
2019
年份代号
1
2
3
4
5
6
7
人均纯收入
3.9
4.3
4.6
5.4
5.8
月份
2020.07
2020.08
2020.09
2020.10
2020.11
月份编号
1
2
3
4
5
竞拍人数(万人)
0.5
0.6
1
1.4
1.7
报价区间(万元)
,
,
,
,
,
,
频数
20
60
60
30
20
10
天数(天
1
2
3
4
5
6
7
繁殖个数(千个)
1
1
2
3
4
4
6
年份
2015
2016
2017
2018
2019
使用率
16
18.8
20.1
24.3
27.2
第一天
第二天
第三天
第四天
第五天
就餐人数(百人)
13
9
8
10
12
原材料(袋
32
23
18
24
28
专题1 线性回归方程
例1.蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率(每分钟鸣叫的次数)与气温(单位:存在着较强的线性相关关系.某地观测人员根据如表的观测数据,建立了关于的线性回归方程,则当蟋蟀每分钟鸣叫56次时,该地当时的气温预报值为
A.B.C.D.
【解析】解:由题意,得,
,
则;
当时,.
故选:.
例2.已知下列说法:
①对于线性回归方程,变量增加一个单位时,平均增加5个单位;
②在线性回归模型中,相关指数越接近于1,则模型回归效果越好;
③两个随机变量的线性相关性越强,则相关系数就越接近1;
④互斥事件不一定是对立事件,对立事件一定是互斥事件;
⑤演绎推理是从特殊到一般的推理,它的一般模式是“三段论”.
其中说法错误的个数为
A.1B.2C.3D.4
【解析】解:①对于线性回归方程,变量增加一个单位时,平均减少5个单位,故①不正确;
②在线性回归模型中,相关指数越接近于1,则模型回归效果越好,故②正确;
③两个随机变量的线性相关性越强,则相关系数的绝对值就越接近1,故③不正确;
④互斥事件不一定是对立事件,对立事件一定是互斥事件,所以④正确;
⑤演绎推理是从一般到特殊的推理,它的一般模式是“三段论”.所以⑤不正确;
故选:.
例3.变量,之间的一组相关数据如表所示:若,之间的线性回归方程为,则的值为
A.B.C.D.
【解析】解:,,
则样本点的中心的坐标为,
代入,得,
则.
故选:.
例4.我国技术研发试验在年进行,分为关键技术试验、技术方案验证和系统验证三个阶段实施.2020年初以来,技术在我国已经进入高速发展的阶段,手机的销量也逐渐上升,某手机商城统计了近5个月来手机的实际销量,如表所示:
若与线性相关,且求得线性回归方程为,则下列说法正确的是
A.
B.与正相关
C.与的相关系数为负数
D.12月份该手机商城的手机销量约为365部
【解析】解:根据表中数据,可得,
,
于是,,即,故正确;
由回归方程中的系数大于0,可知与正相关,且相关系数,故正确,错误;
12月份时,,部,故错误.
故选:.
例5.已知与之间的一组数据:
已求得关于与的线性回归方程,则的值为 0.5 .
【解析】解:,,
这组数据的样本中心点是,
关于与的线性回归方程,
,解得,
的值为0.5.
故答案为:0.5.
例6.邢台市物价部门对市区的天一城、北国商城、恒大城、家乐园、中北世纪城5家商场的某件商品在7月15号一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如表所示:
已知销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的 10 .
【解析】解:依题意,代入回归直线方程得①,根据题意②,解①②组成的方程组得,
故答案为:10.
例7.已知一组数据点:
用最小二乘法得到其线性回归方程为,若数据,,,的平均数为1,则 16 .
【解析】解:由题意,,设样本点的中心为,
又线性回归方程为,则,
.
故答案为:16.
例8.垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化、减量化处理.某市为调査产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据,,2,,,其中和分别表示第个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得,,,,.
(1)请用相关系数说明该组数据中与之间的关系可用线性回归模型进行拟合;
(2)求关于的线性回归方程;
(3)某科研机构研发了两款垃圾处理机器,如表是以往两款垃圾处理机器的使用年限(整年)统计表:
某环保机构若考虑购买其中一款垃圾处理器,以使用年限的频率估计概率.根据以往经验估计,该机构选择购买哪一款垃圾处理机器,才能使用更长久?
参考公式:相关系数.
对于一组具有线性相关关系的数据,,2,,,其回归直线的斜率和截距的最小二乘估计分别为:,.
【解析】解:(1)由题意知相关系数,
因为与的相关系数接近1,
所以与之间具有较强的线性相关关系,可用线性回归模型进行拟合.
(2)由题意可得,,,
所以.
(3)以频率估计概率,购买一台甲款垃圾处理机器节约政府支持的垃圾处理费用(单位:万元)的分布列为
(万元)
购买一台乙款垃圾处理机器节约政府支持的垃圾处理费用(单位:万元)的分布列为:
(万元)
因为,所以该县城选择购买一台甲款垃圾处理机器更划算.
例9.近年来,高铁的发展逐渐改变了人们的出行方式,我国年高铁运营里程的数据如表所示.
(Ⅰ)求关于的线性回归方程;
(Ⅱ)每一年与前一年的高铁运营里程之差即为该年新增的里程,若用年每年新增里程的频率代替之后每年新增相应里程的概率,求2023年中国高铁运营里程大于或等于5万千米的概率.
附:线性回归方程中斜率和截距的最小二乘估计公式分别为:,.
【解析】解:(Ⅰ),,
,
,
,
.
关于的线性回归方程为:.
(Ⅱ)设每年新增高铁运营里程为万千米,由条件知的分布列为:
若2023年中国高铁运营里程小于5万平方千米,
则年每年新增的高铁运营里程有三种情况:,,,
相应的概率为.
年中国高铁运营里程大于或等于5万千米的概率为.
例10.某地区2013年至2019年居民纯收入(单位:千元)的部分数据如表所示:
2018和2019年的居民纯收入(单位:千元)数据采用随机抽样的方式获得,用样本的均值来代替当年的居民人均纯收入,其数据如下:
2018年抽取的居民纯收入(单位:千元)数据:5.2 4.8 6.5 5.6 6.0 7.1 6.1 7.3 5.9 7.5
2019年抽取的居民纯收入(单位:千元)数据:6.2 7.8 6.6 5.8 7.1 6.8 7.2 7.9 5.9 7.7
(Ⅰ)求关于的线性回归方程;
(Ⅱ)当地政府为了提高居民收入水平,现从2018和2019年居民纯收入(单位:千元)高于7.0千元的样本中随机选择3人进行座谈,了解其工作行业及主要收入来源.设为选出的3人中2018年纯收入高于7.0千元的人数,求随机变量的分布列和数学期望.
附:回归直线的斜率和截距的最小二乘法估计公式分别为:,.
【解析】解:(Ⅰ)根据2018年的抽样数据可得2018年的人均纯收入为 千元,
根据2019年的抽样数据可得2019年的人均纯收入为千元,
由所给的数据得,
,
,
,
,
则,
则所求关于的线性回归方程为;
(Ⅱ)由2018年和2019年的抽样数据可知,2018年居民纯收入高于7.0千元的有3人,2019年居民纯收入高于7.0千元的有5人,
由题意可得,随机变量的可能取值为0,1,2,3,
则,,
,,
随机变量的分布列为则的分布列为:
则
例11.为了缓解日益拥堵的交通状况,不少城市实施车牌竞价策略,以控制车辆数量.某地车牌竞价的基本规则是:
①“盲拍”,即所有参与竞拍的人都是网络报价,每个人不知晓其他人的报价,也不知道参与当期竞拍的总人数;②竞价时间截止后,系统根据当期车牌配额,按照竞拍人的出价从高到低分配名额.某人拟参加2020年12月份的车牌竞拍,他为了预测最低成交价,根据竞拍网站的公告.统计了最近5个月参与竞拍的人数(见表)
(1)由收集数据的散点图发现1可用线性回归模型拟合竞拍人数(万人)与月份编号之间的相关关系.请用最小二乘法求关于的线性回归方程:,并预测2020年12月份参与竞拍的人数.
(2)某市场调研机构对200位拟参加2020年12月份车牌竞拍人员的报价价格进行了一个抽样调查,得到如下的一份频数表:
(ⅰ)求这200为竞拍人员报价的平均数值和样本方差(同一区间的报价可用该价格区间的中点值代替);
(ⅱ)假设所有参与竞价人员的报价可视为服从正态分布,且与可分别由(ⅰ)中所求的样本平均数及估值.若2020年12月份实际发放车牌数量是3174,请你合理预测(需说明理由)竞拍的最低成交价.
参考公式及数据:①回归方程,其中,;
②;
③若随机变量服从正态分布,则,,.
④方差.
【解析】解:(1)由题意得,,
,
,
,
关于的线性回归方程为.
当时,.
预测2020年12月份参与竞拍的人数为2万人.
(2)依题意可得这200人报价的平均值为:
.
这200人报价的方差为:
.
年12月份实际发放车牌数量是3174,
根据竞价规则,报价在最低成交价以上人数占总人数比例为,
根据假设报价可视为服从正态分布,
,,,
,
,
预测竞拍的最低成交价为4.8万元.
例12.某医疗专家组为了研究新冠肺炎病毒在特定环境下一周内随时间变化的繁殖情况,得到如下的实验数据:
(1)由如表数据可知,可用线性回归模型拟合与的关系,求关于的线性回归方程;
(Ⅱ)若由线性回归方程得到的估计数据与实验数据的误差不超过0.5,则该实验数据是“理想数据”,现从实验数据中随机抽取3个,求“理想数据”的个数的分布列和数学期望.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为,.
【解析】解:(Ⅰ)由题意,,,
,,
,
.
关于的线性回归方程为;
(Ⅱ)由题意将估计数据与实验数据列表:
由列表和题意可知该实验数据为“理想数据”的有5个,
故的所有可能取值为1,2,3.
,
,
.
“理想数据”个数的分布列为:
则.
例13.在线教育的发展,有利于弥补乡村教育短板,为我国各地区教育均衡发展提供了条件年《政府工作报告》明确提出发展“互联网教育”促进优质资源共享.下面是年我国在线教育网络使用率的统计表:
其散点图如图:
设日期代码.
(Ⅰ)求关于的线性回归方程;
(Ⅱ)根据线性回归方程,预测2025年我国在线教育网络使用率约达到多少?
附:回归直线中斜率和截距的最小二乘估计公式:,.
【解析】解:(Ⅰ)由,得5组对应数据为,,,,,
则,
,
求出,,
所以:,
,
所以关于的线性回归方程为.
(Ⅱ)当时,,
此时,
所以预测2025年我国在线教育网络使用率约达到.
例14.学校食堂统计了最近5天到餐厅就餐的人数(百人)与食堂向食材公司购买所需食材(原材料)的数量(袋,得到如下统计表:
(1)根据所给的5组数据,求出关于的线性回归方程;
(2)已知购买食材的费用(元与数量(袋的关系为,投入使用的每袋食材相应的销售单价为700元,多余的食材必须无偿退还食材公司,据悉下周一大约有1500人到食堂餐厅就餐.根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材,才能获得最大利润,最大利润是多少?(注:利润销售收入原材料费用)
参考公式:,.
参考数据:,,.
【解析】解:(1)由所给数据可得:,
,
,
,
关于的线性回归方程为;
(2)由(1)中求出的线性回归方程知,
当时,,
即预计需要购买食材36.5袋.
,
当时,利润,
当时,;
当时,.
当时,.
综上所述,食堂应该购买36袋食材,才能使利润获得最大,最大利润为11870元.
(次数分钟)
20
30
40
50
60
25
27.5
29
32.5
36
4
5
6
7
8.2
7.8
6.6
5.4
月份
2020年6月
2020年7月
2020年8月
2020年9月
2020年10月
月份编号
1
2
3
4
5
销量部
50
96
185
227
0
1
2
3
3
5.5
7
价格
8.5
9
11
11.5
销售量
12
6
7
5
使用年限
台数
款式
1年
2年
3年
4年
5年
甲款
5
20
15
10
50
乙款
15
20
10
5
50
0
50
100
0.1
0.4
0.3
0.2
20
70
120
0.3
0.4
0.2
0.1
年份
2015
2016
2017
2018
2019
年份代码
1
2
3
4
5
高铁运营里程(万千米)
1.9
2.2
2.5
2.9
3.5
0.3
0.4
0.6
年份
2013
2014
2015
2016
2017
2018
2019
年份代号
1
2
3
4
5
6
7
人均纯收入
3.9
4.3
4.6
5.4
5.8
0
1
2
3
月份
2020.07
2020.08
2020.09
2020.10
2020.11
月份编号
1
2
3
4
5
竞拍人数(万人)
0.5
0.6
1
1.4
1.7
报价区间(万元)
,
,
,
,
,
,
频数
20
60
60
30
20
10
天数(天
1
2
3
4
5
6
7
繁殖个数(千个)
1
1
2
3
4
4
6
天数(天
1
2
3
4
5
6
7
繁殖个数
(千个)
1
1
2
3
4
4
6
估计个数
(千个)
3
1
2
3
年份
2015
2016
2017
2018
2019
使用率
16
18.8
20.1
24.3
27.2
第一天
第二天
第三天
第四天
第五天
就餐人数(百人)
13
9
8
10
12
原材料(袋
32
23
18
24
28
相关试卷
这是一份新高考数学概率统计分章节特训专题19概率最值问题专题练习(原卷版+解析),共19页。试卷主要包含了 绿水青山就是金山银山等内容,欢迎下载使用。
这是一份新高考数学概率统计分章节特训专题18保险问题专题练习(原卷版+解析),共23页。
这是一份新高考数学概率统计分章节特训专题17道路通行问题专题练习(原卷版+解析),共19页。试卷主要包含了 为响应绿色出行,某市在等内容,欢迎下载使用。