高中数学高考考点56 变量间相关关系、统计案例-备战2021年新高考数学一轮复习考点一遍过(1)
展开
这是一份高中数学高考考点56 变量间相关关系、统计案例-备战2021年新高考数学一轮复习考点一遍过(1),共21页。
考点56变量间的相关关系、统计案例
【命题解读】
变量间相关关系、统计案例是近几年高考出题率比较高的知识点,这部分知识与实际结合比较密切,常与概率相结合,出题难度适中,关键是考查对题目的阅读分析,对数据的处理,因此能力要求方面还是比较高。
【命题预测】
预计2021年的变量间的相关关系、统计案例一如既往的出解答题的可能性比较大,考查分析问题和处理数据的能力。
【复习建议】
1.了解变量间的相关关系,掌握回归直线和独立性检验;
2.会求回归直线和独立性检验。
考向一 回归分析
1.两个变量的线性相关
(1)正相关
在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.
(2)负相关
在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.
(3)线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫作回归直线.
2.回归方程
(1)最小二乘法
求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫作最小二乘法.
(2)回归方程
方程是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中,是待定参数.
,
3.回归分析
(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.
(2)样本点的中心
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中(x,y)称为样本点的中心.
(3)相关系数
当r>0时,表明两个变量正相关;
当r400
空气质量好
空气质量不好
附:K2=,
P(K2≥k)
0.050 0.010 0.001
k
3.841 6.635 10.828
.
6. 【2020年高考山东】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了天空气中的和浓度(单位:),得下表:
32
18
4
6
8
12
3
7
10
(1)估计事件“该市一天空气中浓度不超过,且浓度不超过”的概率;
(2)根据所给数据,完成下面的列联表:
(3)根据(2)中的列联表,判断是否有的把握认为该市一天空气中浓度与浓度有关?
附:,
0.050 0.010 0.001
3.841 6.635 10.828
题组二
1. 【2020全国高三专题练习(文)】有一散点图如图所示,在5个数据中去掉后,下列说法正确的是( )
A.残差平方和变小 B.相关系数变小
C.相关指数变小 D.解释变量与预报变量的相关性变弱
2. 【2020全国高三专题练习】在某个物理实验中,测得变量x和变量y的几组数据,如下表:
x
y
则下列选项中对x,y最适合的拟合函数是( )
A. B. C. D.
3. 【2020全国高二课时练习】为了解某次考试中语文成绩是否优秀与性别的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:
语文成绩优秀
语文成绩非优秀
总计
男生
10
20
30
女生
20
10
30
总计
30
30
60
下列说法正确的是( )
A.有99.5%的把握认为语文成绩是否优秀与性别有关系
B.有99.9%的把握认为语文成绩是否优秀与性别有关系
C.有99%的把握认为语文成绩是否优秀与性别有关系
D.没有理由认为语文成绩是否优秀与性别有关系
4. 【2019湖北高二期中(理)】中小学生的智能手机使用已引发社会的广泛关注,某研究性学习小组调查学生使用智能手机对学习的影响,部分统计数据如下:
使用智能手机
不使用智能手机
合计
学习成绩优秀
75
55
130
学习成绩不优秀
125
45
170
合计
200
100
300
附表:
P()
0.010
0.005
0.001
6.635
7.879
10.828
由算得,.则得到的结论中正确的是( )
A.在犯错误的概率不超过的前提下,认为“使用智能手机对学习有影响”
B.有以上的把握,认为“使用智能手机对学习有影响”
C.有以上的把握,认为“使用智能手机对学习有影响”
D.如果一个中小学生使用智能手机,那么他学习成绩不优秀的可能性高达
5. 【2020全国高三专题练习】某大型电子商务平台每年都会举行“双11”商业促销狂欢活动,现统计了该平台从2011年到2019年共9年“双11”当天的销售额(单位:亿元)并作出散点图,将销售额y看成以年份序号x(2011年作为第1年)的函数.运用excel软件,分别选择回归直线和三次多项式回归曲线进行拟合,效果如下图,则下列说法错误的是( )
A.销售额y与年份序号x呈正相关关系
B.根据三次多项式函数可以预测2020年“双11”当天的销售额约为8454亿元
C.销售额y与年份序号x线性相关不显著
D.三次多项式回归曲线的拟合效果好于回归直线的拟合效果
6. 【2020湖南长沙市长郡中学高三月考】针对当下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有( )
附表:
0.050
0.010
3.841
6.635
附:
A. B. C. D.
7. 【2020齐齐哈尔市第八中学校高二期中(理)】如表是某位同学连续5次周考的数学、物理的成绩,结果如下:
周次
1
2
3
4
5
数学(x分)
79
81
83
85
87
物理(y分)
77
79
79
82
83
参考公式:,,表示样本均值.
(1)求该生5次月考数学成绩的平均分和物理成绩的方差;
(2)一般来说,学生的数学成绩与物理成绩有较强的线性相关关系,根据上表提供的数据,求两个变量x、y的线性回归方程.
8. 【2020江苏镇江市高三月考】为了缓解日益拥堵的交通状况,不少城市实施车牌竞价策略,以控制车辆数量.某地车牌竞价的基本规则是:①“盲拍”,即所有参与竞拍的人都是网络报价,每个人不知晓其他人的报价,也不知道参与当期竞拍的总人数;②竞价时间截止后,系统根据当期车牌配额,按照竞拍人的出价从高到低分配名额.某人拟参加年月份的车牌竞拍,他为了预测最低成交价,根据竞拍网站的公告,统计了最近个月参与竞拍的人数(见下表)∶
月份
月份编号
竞拍人数(万人)
(1)由收集数据的散点图发现,可用线性回归模型拟合竞拍人数(万人)与月份编号之间的相关关系.请用最小二乘法求关于的线性回归方程:,并预测年月份参与竞拍的人数.
(2)某市场调研机构对位拟参加年月份车牌竞拍人员的报价价格进行了一个抽样调查,得到如下的一份频数表:
报价区间(万元)
频数
(i)求这位竞拍人员报价的平均值和样本方差(同一区间的报价可用该价格区间的中点值代替);
(ii)假设所有参与竞价人员的报价可视为服从正态分布,且与可分别由(i)中所求的样本平均数及估值.若年月份实际发放车牌数量为,请你合理预测(需说明理由)竞拍的最低成交价.
参考公式及数据:①回归方程,其中,;②,,;③若随机变量服从正态分布,则,,.
9. 【2020全国高三专题练习(理)】垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化、减量化处理.某市为调查产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据,其中和分别表示第个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得,,,,.
(1)请用相关系数说明该组数据中与之间的关系可用线性回归模型进行拟合;
(2)求关于的线性回归方程;
(3)某科研机构研发了两款垃圾处理机器,其中甲款机器每台售价100万元,乙款机器每台售价80万元,下表是以往两款垃圾处理机器的使用年限统计表:
1年
2年
3年
4年
合计
甲款
5
20
15
10
50
乙款
15
20
10
5
50
根据以往经验可知,某县城每年可获得政府支持的垃圾处理费用为50万元,若仅考虑购买机器的成本和每台机器的使用年限(使用年限均为整年),以频率估计概率,该县城选择购买一台哪款垃圾处理机器更划算?
参考公式:相关系数,对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计分别为:,.
10. 【2020全国高二课时练习】为了研究一种新药的疗效,选100名患者随机分成两组,每组各50名,一组服药,另一组不服药.一段时间后,记录两组患者的生理指标和的数据,并制成下图,其中“*”表示服药者,“+”表示未服药者.
(1)从服药的50名患者中随机选出一人,求此人指标的值小于1.7的概率;
(2)试判断这100名患者中服药者指标的方差与未服药者指标的方差的大小;(只需写出结论)
(3)若指标小于1.7且指标大于60就说总生理指标正常(例如图中两名患者的总生理指标正常),根据上图,完成下面的列联表,并判断能否有95%的把握认为总生理指标正常与服药有关,说明理由.
总生理指标正常
总生理指标不正常
总计
服药
不服药
总计
题组一
1.D
【解析】由散点图分布可知,散点图分布在一个对数函数的图象附近,
因此,最适合作为发芽率和温度的回归方程类型的是.
故选:D.
2.C
【解析】由题意得,阅读过《西游记》的学生人数为90-80+60=70,则其与该校学生人数之比为70÷100=0.7.故选C.
3.
【解析】由题意得,经停该高铁站的列车正点数约为,其中高铁个数为,所以该站所有高铁平均正点率约为.
4. 见解析
【解析】(1)由已知得样本平均数,从而该地区这种野生动物数量的估计值为60×200=12000.
(2)样本的相关系数
.
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
5. 见解析
【解析】(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:
空气质量等级
1
2
3
4
概率的估计值
0.43
0.27
0.21
0.09
(2)一天中到该公园锻炼的平均人次的估计值为
.
(3)根据所给数据,可得列联表:
人次≤400
人次>400
空气质量好
33
37
空气质量不好
22
8
根据列联表得
.
由于,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
6. 见解析
【解析】(1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且浓度不超过150的天数为,因此,该市一天空气中PM2.5浓度不超过75,且浓度不超过150的概率的估计值为.
(2)根据抽查数据,可得列联表:
64
16
10
10
(3)根据(2)的列联表得.
由于,故有的把握认为该市一天空气中浓度与浓度有关.
题组二
1. A【解析】
∵从散点图可分析得出:
只有点偏离直线远,去掉点,变量与变量的线性相关性变强,
∴相关系数变大,相关指数变大,残差的平方和变小,故选A.
2.D【解析】根据,,代入计算,可以排除;
根据,,代入计算,可以排除、;
将各数据代入检验,函数最接近,可知满足题意
故选:.
3.C【解析】由列联表得:,
所以有99%的把握认为语文成绩是否优秀与性别有关系.
故选:C.
4. C【解析】则K的观测值:;
故在犯错误的概率不超过的前提下,认为“使用智能手机对学习有影响”.
即有以上的把握,认为“使用智能手机对学习有影响”.
故选:C.
5.BC
【解析】对于A,散点从左下到右上分布,所以销售额y与年份序号x呈正相关关系,故A正确,不符合题意;
对于B,令,由三次多项式函数得,所以2020年“双11”当天的销售额约为2684.54亿元,故B错误,符合题意;
对于C,因为相关系数,非常接近1,故销售额y与年份序号x线性相关显著,故C错误,符合题意;
对于D,用三次多项式回归曲线拟合的相关指数,而回归直线拟合的相关指数,相关指数越大,拟合效果越好,故D正确,不符合题意.
故选:BC.
6.BC
【解析】设男生的人数为,根据题意列出列联表如下表所示:
男生
女生
合计
喜欢抖音
不喜欢抖音
合计
则,
由于有的把握认为是否喜欢抖音和性别有关,则,
即,得,
,则的可能取值有、、、,
因此,调查人数中男生人数的可能值为或.
故选:BC.
7. 见解析
【解析】(1)数学成绩的平均分为,
因为物理成绩的平均分为,所以物理成绩的方差;
(2)由已知数据得,所以,所以,
所以两个变量x、y的线性回归方程为.
8. 见解析
【解析】(1)易知,,
,
,
则关于的线性回归方程为,
当时,,即2020年11月份参与竞拍的人数估计为2万人;
(2)(i)依题意可得这人报价的平均值和样本方差分别为:
,
;
(ii)2020年11月份实际发放车牌数量为3174,根据竞价规则,报价在最低成交价以上人数占总人数比例为,
根据假设,报价可视为服从正态分布,
且,,
又,,
可预测2020年11月份竞拍的最低成交价为4.8万..
【点睛】
9. 见解析
【解析】(1)由题意知相关系数,
因为与的相关系数接近,
所以与之间具有较强的线性相关关系,可用线性回归模型进行拟合.
(2)由题意可得,,
,
所以.
(3)以频率估计概率,购买一台甲款垃圾处理机器节约政府支持的垃圾处理费用(单位:万元)的分布列为:
0
50
100
(万元).
购买一台乙款垃圾处理机器节约政府支持的垃圾处理费用(单位:万元)的分布列为:
20
70
120
(万元).
因为,所以该县城选择购买一台甲款垃圾处理机器更划算.
10. 见解析
【解析】(1)由题图知,在服药的50名患者中,指标的值小于1.7的有人,
所以从服药的50名患者中随机选出一人,
此人指标的值小于1.7的概率.
(2)在这100名患者中,服药者指标的方差大于未服药者指标的方差.
(3)根据题中数据得到如下列联表:
总生理指标正常
总生理指标不正常
总计
服药
33
17
50
不服药
22
28
50
总计
55
45
100
,
所以有95%的把握认为总生理指标正常与服药有关.
相关试卷
这是一份高考数学一轮复习考点测试刷题本56 变量间的相关关系与统计案例(含答案解析),共10页。
这是一份艺术生高考数学专题讲义:考点51 变量间的相关关系与统计案例,共13页。试卷主要包含了相关关系,散点图,正相关与负相关,回归直线方程,相关系数,独立性检验等内容,欢迎下载使用。
这是一份艺术生高考数学专题讲义:考点51 变量间的相关关系与统计案例,共13页。试卷主要包含了相关关系,散点图,正相关与负相关,回归直线方程,相关系数,独立性检验等内容,欢迎下载使用。