高中数学人教B版 (2019)选择性必修 第二册4.3.1 一元线性回归模型多媒体教学课件ppt
展开课后素养落实(二十一) 相关系数与非线性回归
(建议用时:40分钟)
一、选择题
1.如果两个变量之间的线性相关程度很高,则其相关系数r的绝对值应接近于( )
A.0.5 B.2
C.0 D.1
D [相关系数|r|越接近于1,相关程度越高.故选D.]
2.两个变量的散点图如图,可考虑用如下函数进行拟合比较合理的是( )
A.y=a·xb B.y=a+bln x
C.y=a·ebx D.y=a·e
B [由散点图可知,此曲线类似对数函数型曲线,因此可用函数y=a+bln x模型进行拟合.]
3.若回归直线的斜率∈(0,+∞),则相关系数r的取值范围为( )
A.(0,1] B.[-1,0)
C.0 D.无法确定
A [由相关系数与回归直线的斜率之间的关系可知相关系数的取值范围是0<r≤1,故选A.]
4.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
A.-1 B.0 C. D.1
D [因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1.]
5.已知变量y关于x的回归方程为=ebx-0.5,其一组数据如下表所示:
x | 1 | 2 | 3 | 4 |
y | e | e3 | e4 | e6 |
若x=5,则预测y的值可能为( )
A.e5 B.e C.e7 D.e
D [将式子两边取对数,得到ln =bx-0.5,令z=ln ,得到z=bx-0.5,列出x,z的取值对应的表格,
x | 1 | 2 | 3 | 4 |
z | 1 | 3 | 4 | 6 |
则==2.5,==3.5,
∵(,)满足=b-0.5,∴3.5=b×2.5-0.5,
解得b=1.6,∴z=1.6x-0.5,∴=e1.6x-0.5,当x=5时,=e1.6×5-0.5=e,故选D.]
二、填空题
6.若对甲、乙、丙3组不同的数据作线性相关性检验,得到这3组数据的线性相关系数依次为0.83,0.72,-0.90,则线性相关程度最强的一组是________.(填甲、乙、丙中的一个)
丙 [两个变量y与x的回归模型中,它们的相关系数|r|越接近于1,这个模型的两个变量线性相关程度就越强,在甲、乙、丙中,所给的数值中-0.90的绝对值最接近1,所以丙的线性相关程度最强.]
7.某学校开展研究性学习活动,一组同学获得了如表所示的一组试验数据.
x | 1.99 | 3 | 4 | 5.1 | 8 |
y | 0.99 | 1.58 | 2.01 | 2.35 | 3.00 |
现有如下5个模拟函数:
①y=0.58x-0.16;②y=2x-3.02;③y=x2-5.5x+8;④y=log2x;⑤y=+1.74.
请从中选择一个模拟函数,使它能近似地反映这些数据的规律,应选________(填序号).
④ [画出散点图如图所示.
由图可知上述点大致在函数y=log2x的图像上,故选择y=log2x可以近似地反映这些数据的规律,故填④.]
8.已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y=3e2x+1的图像附近,令u=ln y,则可通过转换得到的线性回归方程为________.
u=1+ln 3+2x [由y=3e2x+1,得ln y=ln(3e2x+1),
即ln y=ln 3+2x+1.
令u=ln y,则线性回归方程为u=1+ln 3+2x.]
三、解答题
9.某公司为了预测下月产品销售情况,找出了近7个月的产品销售量y(单位:万件)的统计表:
月份代码t | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
销售量y(万件) | y1 | y2 | y3 | y4 | y5 | y6 | y7 |
但其中数据污损不清,经查证yi=9.32,
tiyi=40.17,=0.55.
(1)请用相关系数说明销售量y与月份代码t有很强的线性相关关系;
(2)求y关于t的回归方程(系数精确到0.01);
(3)公司经营期间的广告宣传费xi=(单位:万元)(i=1,2,…,7),每件产品的销售价为10元,预测第8个月的毛利润能否突破15万元,请说明理由.(毛利润等于销售金额减去广告宣传费)
参考公式及数据:≈2.646,相关系数
r=,当|r|>0.75时,认为两个变量有很强的线性相关关系,回归方程=t+中斜率和截距的最小二乘估计公式分别为
=,=-.
[解] (1)由题中的数据和附注中的参考数据得
=4, (ti-)2=28,=0.55,
(ti-)(yi-)=tiyi-yi
=40.17-4×9.32=2.89,
∴r=≈0.99>0.75,
所以销售量y与月份代码t有很强的线性相关关系.
(2)由=≈1.331及(1)得
==≈0.103,
=-≈1.331-0.103×4≈0.92,
所以y关于t的回归方程为=0.10t+0.92,
(3)当t=8时,代入回归方程得
=0.10×8+0.92=1.72(万件),
故第8个月的毛利润为
z=10×1.72-=17.2-2×1.414=14.372,
因为14.372<15,
预测第8个月的毛利润不能突破15万元.
10.如图是某企业2014年至2020年的污水净化量(单位:吨)的折线图.
注:年份代码1~7分别对应年份2014~2020.
(1)由折线图看出,可用线性回归模型拟合y和t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程,预测2021年该企业的污水净化量.
参考数据:=54, (ti-)(yi-)=21,
≈3.74,
参考公式:相关系数r=,
线性回归方程=+t,=,
=-.
[解] (1)由折线图中的数据得,
=4, (ti-)2=28, (yi-)2=18,
所以r=≈0.94.
因为y与t的相关系数近似为0.94,说明y与t的线性相关程度相当大,所以可以用线性回归模型拟合y与t的关系.
(2)因为=54,===,
所以=-=54-×4=51,
所以y关于t的线性回归方程为=t+=t+51,将2021年对应的t=8代入上式,得
=×8+51=57,
所以预测2021年该企业污水净化量约为57吨.
1.某化工厂产生的废气经过过滤后排放,以模型y=p0e-kx去拟合过滤过程中废气的污染物浓度y mg/L与时间x h之间的一组数据,为了求出回归方程,设z=ln y,其变换后得到线性回归方程为=-0.5x+2+ln 300,则当经过6 h后,预报废气的污染物浓度为( )
A.300e2 mg/L B.300e mg/L
C. mg/L D. mg/L
D [当x=6时,=-1+ln 300=ln ,所以y=e=.]
2.(多选题)某同学将收集到的六组数据制作成散点图如图所示,并得到其回归直线的方程为l1:y=0.68x+,计算其相关系数为r1.经过分析确定点F为“离群点”,把它去掉后,再利用剩下的5组数据计算得到回归直线的方程为l2:y=x+0.68,相关系数为r2,以下结论中,正确的是( )
A.r1>0,r2>0 B.r1>r2
C.=0.12 D.0<<0.68
ACD [由图可知两变量呈现正相关,故
r1>0,r2>0,且r1<r2,故A正确,B错误;又回归直线l1:y=0.68x+必经过样本中心点(3.5,2.5),所以=2.5-0.68×3.5=0.12,C正确;回归直线l2:y=x+0.68必经过样本中心点(3,2),所以2=×3+0.68,
所以=0.44,也可直接根据图像判断0<<0.68(比较两直线的倾斜程度),故ACD正确.]
3.以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln y,其变换后得到线性回归方程z=0.3x+4,则c=________.
e4 [∵y=cekx,∴两边取对数,
可得ln y=ln(cekx)=ln c+ln ekx=ln c+kx,
令z=ln y,可得z=ln c+kx,
∵z=0.3x+4,∴ln c=4,∴c=e4.故答案为e4.]
4.已知第一组样本点为(-5,-8.9),(-4,-7.2),(-3,-4.8),(-2,-3.3),(-1,-0.9),其变量间的相关系数为r1;第二组样本点为(1,8.9),(2,7.2),(3,4.8),(4,3.3),(5,0.9)其变量间的相关系数为r2.则r1,r2的大小关系为________.
r1>r2 [由第1组数据可知,两变量间成正相关,故r1>0,由第2组数据可知,两变量间成负相关,故r2<0,故r1>0>r2.]
区块链技术被认为是继蒸汽机、电力、互联网之后,下一代颠覆性的核心技术.区块链作为构造信任的机器,将可能彻底改变整个人类社会价值传递的方式,2015年至2019年五年期间,中国的区块链企业数量逐年增长,且居世界前列.现收集我国近5年区块链企业数量相关的数据,整理得到下表.
年份 | 2015 | 2016 | 2017 | 2018 | 2019 |
编导x | 1 | 2 | 3 | 4 | 5 |
企业数量y (单位:千个) | 2.156 | 3.727 | 8.305 | 24.279 | 36.224 |
(1)根据表中数据判断,y=a+bx与y=cedx(其中e=2.718 28…,为自然对数的底数)中哪一个回归方程类型适宜用来预测未来几年我国区块链企业数量.(给出结果即可,不必说明理由)
(2)根据(1)的结果,求y关于x的回归方程(结果精确到0.001).
(3)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛.比赛规则如下:①每场比赛有两个公司参加,并决出胜负;②每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;③在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司就被称为此次信息化技术比赛的“优胜公司”.已知在每场比赛中,甲胜乙的概率为,甲胜丙的概率为,乙胜丙的概率为,请通过计算说明,哪两个公司进行首场比赛时,甲公司被称为“优胜公司”的概率最大.
参考数据:yi=74.691,xiyi=312.761,zi=10.980,xizi=40.457(其中z=ln y).
[解] (1)回归方程y=cedx适宜预测未来几年我国区块链企业数量.
(2)对y=cedx两边取自然对数,得
ln y=ln c+dx,令z=ln y,g=ln c,得=+x.
易知xi=15,=xi=3,x=55,=zi=2.196.
∵===0.751 7≈0.752,
=-=2.196-0.751 7×3≈-0.059,
∴z关于x的回归方程为=0.752x-0.059,
则y关于x的回归方程为=e0.752x-0.059.
(3)对于首场比赛的选择有以下三种情况:
甲与乙先赛;甲与丙先赛;丙与乙先赛.记“甲与乙先赛且最终甲获胜”为事件A,“甲与丙先赛且最终甲获胜”为事件B,“丙与乙先赛且最终甲获胜”为事件C,
P(A)=×+×××+×××=;
P(B)=×+×××+×××=;
P(C)=××+××=.
∵>>,
因此甲与丙两公司进行首场比赛时,甲公司获得“优胜公司”的概率最大.
高中数学人教B版 (2019)选择性必修 第二册4.3.1 一元线性回归模型多媒体教学ppt课件: 这是一份高中数学人教B版 (2019)选择性必修 第二册4.3.1 一元线性回归模型多媒体教学ppt课件,文件包含人教B版高中数学选择性必修第二册431《相关系数与非线性回归》第2课时课件ppt、人教B版高中数学选择性必修第二册431《相关系数与非线性回归》第2课时教案doc等2份课件配套教学资源,其中PPT共60页, 欢迎下载使用。
数学必修 第二册5.1.1 数据的收集图文ppt课件: 这是一份数学必修 第二册5.1.1 数据的收集图文ppt课件,文件包含人教B版高中数学必修第二册第5章51511第2课时分层抽样课件ppt、人教B版高中数学必修第二册第5章51511第2课时分层抽样学案doc、人教B版高中数学必修第二册课后素养落实11分层抽样含答案doc等3份课件配套教学资源,其中PPT共48页, 欢迎下载使用。
高中数学人教B版 (2019)选择性必修 第二册4.3.1 一元线性回归模型图片课件ppt: 这是一份高中数学人教B版 (2019)选择性必修 第二册4.3.1 一元线性回归模型图片课件ppt,文件包含人教B版高中数学选择性必修第二册第4章431第1课时相关关系与回归直线方程课件ppt、人教B版高中数学选择性必修第二册第4章431第1课时相关关系与回归直线方程学案doc、人教B版高中数学选择性必修第二册课后素养落实20相关关系与回归直线方程含答案doc等3份课件配套教学资源,其中PPT共60页, 欢迎下载使用。