- 第二章 随机变量及其分布复习提升 试卷 试卷 2 次下载
- 第二章 随机变量及其分布达标检测 试卷 1 次下载
- 3.2 独立性检验的基本思想及其初步应用练习题 试卷 1 次下载
- 第三章 统计案例复习提升 试卷 试卷 1 次下载
- 第三章 统计案例达标检测 试卷 1 次下载
高中数学人教版新课标A选修2-33.1回归分析的基本思想及其初步应用巩固练习
展开基础过关练
题组一 线性回归分析
1.(2019河北保定高二期末)在判断两个变量y与x是否相关时,选择了4个不同的模型来进行模拟,这4个模型的相关指数R2分别为0.25、0.50、0.98、0.80,则其中拟合效果最好的模型是( )
A.模型1B.模型2C.模型3D.模型4
2.(2019安徽六安一中高二期末)有一散点图如图所示,去掉图中的D(3,10)后,下列说法正确的是( )
A.残差平方和变小
B.方差变大
C.相关指数R2变小
D.解释变量x与预报变量y的相关性变弱
3.(2019山西阳高一中高二下学期期末)在对两个变量x,y进行线性回归分析时有下列步骤:①对所求出的回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所收集的数据绘制散点图.若根据可靠性要求能够得出变量x,y具有线性相关的结论,则下列操作顺序正确的是( )
A.①②⑤③④B.③②④⑤①
C.②④③①⑤D.②⑤④③①
4.(2020黑龙江齐齐哈尔第八中学高二月考)某产品在某零售摊位的零售价y(单位:元)与每天的销售量x(单位:个)的统计数据如下表所示:
由表可得回归直线方程y^=b^x+a^中的b^=-4,据此模型预测当零售价为20元时,每天的销售量为( )
A.26个B.27个C.28个D.29个
5.(2019黑龙江哈尔滨六中高二上学期期末)下列命题中,正确的是( )
A.在回归方程y^=0.5x-85中,当变量x=200时,变量y的值一定是15
B.两个变量相关性越强,则相关系数r就越接近于1
C.在残差图中,残差点比较均匀地落在水平的带状区域中,即可说明选用的模型比较合适,与带状区域的宽度无关
D.在回归方程y^=0.2x+12中,解释变量x每增加一个单位,预报变量y^就增加0.2个单位
6.(2019陕西商洛高二期末)已知变量x,y之间的一组数据如下表所示,若求得y关于x的线性回归方程为y^=0.82x+1.27,则下列说法错误的是( )
A.变量x,y之间呈正相关关系
B.可以预测当x=5时,y^=5.37
C.该回归直线必过点(1.5,2.5)
D.m的值为2.09
7.(2019黑龙江哈尔滨三中高二上期中)下列命题中错误的是( )
A.样本数据的方差越小,则数据的离散程度越小
B.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
C.相关系数r满足|r|≤1且|r|越接近于1,线性相关程度越强,|r|越接近于0,线性相关程度越弱
D.相关指数越小,回归直线拟合效果越好
8.(2019黑龙江齐齐哈尔高二下学期期末)某种产品的广告费支出x与销售额y之间的数据如下表(单位:万元):
若已知y关于x的线性回归方程为y^=6.5x+17.5,那么当广告费支出为5万元时,随机误差的效应(残差)为 万元(残差=真实值-预报值)( )
A.40B.30C.20D.10
9.(2019广东阳江高二开学考试)珠海市某学校的研究性学习小组对昼夜温差(一天内最高温度与最低温度的差)的大小与绿豆种子一天内的出芽数之间的关系进行了研究,该小组4月记录了1日至6日每天的昼夜最高、最低温度(如图1,单位:℃)以及浸泡的100粒绿豆种子当天内的出芽数(如图2).
图1
图2
已知绿豆种子出芽数y和温差x之间具有线性相关关系.
(1)求绿豆种子出芽数y关于温差x的回归方程y^=b^x+a^;
(2)假如4月1日至7日的昼夜温差的平均值为10 ℃,估计4月7日浸泡的2 000粒绿豆种子一天内的出芽数.
附:b^= ∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2 = ∑i=1nxiyi-nxy∑i=1nxi2-nx 2,a^=y-b^x.
10.(2019河北唐山高二期末)随着智能手机的普及,各类手机娱乐软件也如雨后春笋般涌现.下表中统计的是某手机娱乐软件自2018年8月初推出后至2019年4月底的月新注册用户数,记月份代码为t(t=1对应2018年8月份,t=2对应2018年9月份,……,t=9对应2019年4月份),月新注册用户数为y(百万).
(1)请依据上表的统计数据,判断月新注册用户数y与月份t的线性相关性的强弱;
(2)求出月新注册用户数y关于月份t的线性回归方程,并预测2020年5月份的新注册用户数.
参考数据:∑i=19tiyi=318.5,∑i=19yi2=364.2,67≈8.2.
回归直线的斜率和截距公式:b^=∑i=1n(ti-t)(yi-y)∑i=1n(ti-t)2=∑i=1ntiyi-nty∑i=1nti2-nt 2,a^=y-b^t.
相关系数r=∑i=1n(ti-t)(yi-y)∑i=1n(ti-t)2∑i=1n(yi-y)2(当|r|≥0.75时,认为两变量的相关性很强).
11.(2019广东中山一中等七校联合体高三第二次联考)下图是我国2010年至2016年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1~7分别对应年份2010~2016.
(1)由折线图可知,可用线性回归模型拟合y与t的关系,请求出相关系数r,并用相关系数的大小说明y与t相关性的强弱(当|r|≥0.75时,认为两变量的相关性很强);
(2)建立y关于t的回归方程(系数精确到0.01),预测2020年我国的生活垃圾无害化处理量.
参考数据:∑i=17yi=10.97,∑i=17tiyi=47.36,∑i=17(yi-y)2=0.664,7≈2.646.
参考公式:
相关系数r=∑i=1n(ti-t)(yi-y)∑i=1n(ti-t)2∑i=1n(yi-y)2=∑i=1ntiyi-t∑i=1nyi∑i=1n(ti-t)2∑i=1n(yi-y)2;
回归直线y=a+bt中斜率和截距的最小二乘估计公式分别为b^=∑i=1n(ti-t)(yi-y)∑i=1n(ti-t)2,a^=y-b^t.
题组二 非线性回归分析
12.(2019河南开封高二期中)已知变量x与y的相关数据如下表所示,且变量y关于x的回归方程为y^=ebx-0.5.
若x=5,则y的值可能为( )
A.e5B.e112C.e7D.e152
13.某工厂每日生产一种产品x(x≥1)吨,每日生产的产品当日销售完毕,日销售额为y万元,产品价格随着产量变化而有所变化,经过一段时间的产销,得到了x,y的一组统计数据,如下表:
(1)请判断y=bx+a与y=dln x+c中,哪个模型更适合刻画x,y之间的关系,并从函数增长趋势方面给出简单的理由;
(2)根据你的判断及下面的数据和公式,求出y关于x的回归方程,并估计当日产量x=6时,日销售额是多少.(结果保留整数)
参考公式:线性回归方程y^=b^x+a^中,b^=∑i=1nxiyi-nx·y∑i=1nxi2-nx 2,a^=y-b^x.
参考数据:ln1+ln2+ln3+ln4+ln55≈0.96,5ln 1+12ln 2+16ln 3+19ln 4+
21ln 5≈86,ln 6≈1.8,(ln 1)2+(ln 2)2+(ln 3)2+(ln 4)2+(ln 5)2≈6.2.
能力提升练
一、选择题
1.(2019山东日照莒县第二中学高考模拟,★★☆)变量x,y的相关数据如散点图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程y^=b^1x+a^1,相关系数为r1;方案二:剔除点(10,21),根据剩下的数据得到线性回归方程y^=b^2x+a^2,相关系数为r2,则( )
A.0
A.r1>0,r2>0 B.R12>R22
C.a^=0.12 D.03.(2019四川眉山高考模拟,★★☆)已知变量x与y线性相关,由观测数据算得样本的平均数x=3,y=4,线性回归方程y^=b^x+a^中的系数b^,a^满足b^-a^=2,则线性回归方程为 ( )
A.y^=-x+7 B.y^=-12x-32
C.y^=x+1 D.y^=32x-12
4.(2019山西原平范亭中学高二月考,★★☆)将指数曲线y=aebx进行线性变换后得到的回归方程为u^=1-0.6x,则函数y=x2+bx+a的单调递增区间为( )
A.(0,+∞) B.310,+∞
C.12,+∞ D.(1,+∞)
二、填空题
5.(2019河南南阳中学高二月考,★★☆)某企业节能降耗技术改造后,在生产某产品的过程中记录了产量x(吨)与相应的生产能耗y(吨)的几组数据,如下表所示:
若根据表中数据得出y关于x的线性回归方程为y^=0.7x+0.35,则表中a的值为 .
三、解答题
6.(2019河南林州第一中学高二上学期开学考试,★★☆)一台还可以用的机器由于使用的时间较长,按不同的转速生产出来的部分机械零件会有缺陷,每小时生产有缺陷零件的数量会随机器转速的变化而变化,下表为抽样试验结果:
(1)画出散点图;
(2)如果y与x有线性相关关系,求回归直线方程;
(3)若实际生产中,允许每小时生产的产品中有缺陷的零件最多为10件,则机器的转速应控制在什么范围内?
7.(2019山东青岛高三调研检测,★★☆)近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y(单位:十)表示每天使用扫码支付的人次,统计数据如下表所示:
根据以上数据,绘制了如下图所示的散点图.
(1)根据散点图判断,在推广期内,y=a+bx与y=c·dx(c,d均为大于零的常数)哪一个更适合作为扫码支付的人次y关于活动推出天数x的回归方程类型(给出判断结果即可,不必说明理由);
(2)根据(1)的判断结果及表中的数据,求y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.
参考数据:
其中vi=lg yi,v=17∑i=17vi.
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计公式分别为β^=∑i=1nuivi-nu v∑i=1nui2-nu 2,α^=v-β^u.
8.(2019福建泉州高二期末,★★☆)旅游业作为一个第三产业,时间性和季节性非常强,每年11月份来临,全国各地就相继进入旅游淡季,很多旅游景区就变得门庭冷落.为改变这种局面,某旅游公司借助一自媒体平台做宣传推广,销售特惠旅游产品.该公司统计了活动刚推出一周内产品的销售数量,用x表示活动推出的天数,y表示产品的销售数量(单位:百件),统计数据如下表所示,并绘制了如图所示的散点图.
根据已有的函数知识,发现样本点分布在指数型函数y=ebx+a的图象的周围.为求出该回归方程,相关人员确定的研究方案是先用其中5个数据建立y关于x的回归方程,再用剩下的2个数据进行检验.试回答下列问题:
(1)现令t=ln y,若选取的是表格中的前5个数据,已知∑i=15ti=8ln 2+6ln 3,∑i=15xiti=26ln 2+22ln 3,请求出t关于x的线性回归方程(结果保留一位有效数字);
(2)若由回归方程得到的估计数据与选出的检验数据的误差均不超过10,则认为得到的回归方程是可靠的,试问(1)中所得的回归方程是否可靠?
参考公式及数据:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线y=bx+a的斜率和截距的最小二乘估计公式分别为b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2=∑i=1nxiyi-nxy∑i=1nxi2-nx 2,a^=y-b^x;ln 2≈0.69,ln 3≈1.10;e4.2≈66.7,e4.8≈121.5.
答案全解全析
基础过关练
1.C 相关指数的绝对值越接近1,拟合效果越好,故选C.
2.A 由散点图可知,去掉D(3,10)后,y与x的线性相关性加强,且为正相关,所以相关系数r变大,相关指数R2变大,残差平方和变小,故选A.
3.D 进行线性回归分析一般经历以下几个过程:首先对相关数据进行收集,再根据收集到的数据作出散点图,根据散点图作出线性相关或非线性相关或不相关的判断,然后进行相关系数的计算,以确定相关程度大小,这样可以提高回归分析的可信度,最后求出回归方程并结合方程说明其实际意义.故选D.
4.D 由题表得x=16+17+18+194=17.5,y=50+34+41+314=39.∵回归直线必过样本点的中心(x,y),∴将(x,y)代入回归直线方程中,得39=-4×17.5+a^,解得a^=109,∴该回归直线方程为y^=-4x+109.当x=20时,y^=-4×20+109=29.故选D.
5.D 在回归方程y^=0.5x-85中,当变量x=200时,得到的15只是变量y的一个预报值,故A不正确;两个变量相关性越强,则相关系数r的绝对值就越接近于1,故B不正确;在残差图中,残差点比较均匀地落在水平的带状区域中,带状区域的宽度越窄,拟合效果越好,故C不正确;显然D正确.故选D.
6.D 对于选项A,因为线性回归方程为y^=0.82x+1.27,其中0.82>0,所以变量x,y之间呈正相关关系,故A中说法正确;对于选项B,当x=5时,y^=0.82×5+1.27=5.37,故B中说法正确;对于选项C,由题表中数据可得,x=0+1+2+34=1.5,因为回归直线必过点(x,y),所以y=0.82×1.5+1.27=2.5,故C中说法正确;对于选项D,0.8+m+3.1+4.34=2.5,解得m=1.8,故D中说法错误.故选D.
7.D 相关指数越小说明残差平方和越大,则回归直线拟合效果越差.故选D.
8.D ∵y关于x的线性回归方程为y^=6.5x+17.5,∴当x=5时,y^=50.当广告费支出为5万元时,由题表中数据知y=60,故随机误差的效应(残差)为60-50=10(万元).故选D.
9.解析 (1)由题图可得如下数据:(7,23),(8,26),(12,37),(9,31),(13,40),(11,35),故x=7+8+12+9+13+116=10,y=23+26+37+31+40+356=32,
∑i=16(xi-x)(yi-y)=(-3)×(-9)+(-2)×(-6)+2×5+(-1)2+3×8+1×3=77,
∑i=16(xi-x)2=(-3)2+(-2)2+22+(-1)2+32+12=28,
所以b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2=7728=114,a^=y-b^x=32-114×10=92,
所以绿豆种子出芽数y关于温差x的回归方程为y^=114x+92.
(2)因为4月1日至7日的昼夜温差的平均值为10 ℃,所以4月7日的温差x7=7×10-60=10 ℃,所以当x=10时,y^=114×10+92=32,
所以4月7日浸泡的2 000粒绿豆种子一天内的出芽数的估计值为32100×2 000=640.
10.解析 (1)由题表得t=19×(1+2+3+…+9)=5,y=19×(3.2+3.8+4.3+…+9.5)=6,
∑i=19ti2=12+22+32+…+92=285,
∑i=19(ti-t)·(yi-y)=∑i=19tiyi-9ty
=318.5-9×5×6=48.5,∑i=19(ti-t)2∑i=19(yi-y)2
=(∑i=19ti2-9t2)(∑i=19yi2-9y2)
=(285-9×25)(364.2-9×36)
=667≈49.11,
故r=∑i=1n(ti-t)(yi-y)∑i=1n(ti-t)2∑i=1n(yi-y)2
=∑i=19tiyi-9ty(∑i=19ti2-9t2)(∑i=19yi2-9y 2)
=≈0.99.
因为0.99>0.75,所以月新注册用户数y与月份t的线性相关性很强.
(2)由(1)得b^=∑i=19(ti-t)(yi-y)∑i=19(ti-t)2
=∑i=19tiyi-9ty∑i=19ti2-9t 2=48.5285-9×25=48.560≈0.81,a^=y-b^t≈6-0.81×5=1.95,
所以线性回归方程为y^=0.81t+1.95,易知2020年5月份对应t=22,令t=22,得y^=19.77,即2020年5月份新注册用户数的预测值为19.77百万.
11.解析 (1)由折线图及参考数据得t=4,∑i=17(ti-t)2=28,∑i=17(yi-y)2=0.664,∑i=17(ti-t)(yi-y)=∑i=17tiyi-t∑i=17yi=47.36-4×10.97=3.48,
∴r≈×2×2.646≈0.99.
∵0.99>0.75,∴y与t的线性相关程度很高.
(2)由y=10.977≈1.57及(1)中相关计算得b^=∑i=17(ti-t)(yi-y)∑i=17(ti-t)2=3.4828≈0.12,
∴a^=y-b^t≈1.57-0.12×4=1.09.
所以y关于t的回归方程为y^=1.09+0.12t.
将2020年对应的t=11代入回归方程得y^=1.09+0.12×11=2.41.
所以2020年我国的生活垃圾无害化处理量的估计值为2.41亿吨.
12.D 由y^=ebx-0.5,得ln y^=bx-0.5,令z=ln y^,则z=bx-0.5,∴x与z之间的数据关系如下表:
∴x=1+2+3+44=2.5,z=1+3+4+64=3.5,
∵z=bx-0.5必过点(x,z),∴3.5=b×2.5-0.5,解得b=1.6,
∴z=1.6x-0.5,∴y^=e1.6x-0.5,当x=5时,y^=e1.6×5-0.5=e152,故选D.
13.解析 (1)y=dln x+c更适合刻画x,y之间的关系.理由:由题表中数据可知,x的值每增加1,函数值y的增加量分别为7,4,3,2,增加得越来越缓慢,符合对数型函数的增长规律,与直线型函数的均匀增长存在较大差异,故y=dln x+c更适合刻画x,y之间的关系.
(2)令zi=ln xi,由题意得y=5+12+16+19+215=735=14.6,所以d^=∑i=15ziyi-5z·y∑i=15zi2-5z 2≈86-5×0.96××0.962=10,c^=y-d^·z≈14.6-10×0.96=5,所以所求的回归方程为y^=10ln x+5.当x=6时,日销售额为10ln 6+5≈23(万元).
能力提升练
一、选择题
1.D 由散点图可知变量x,y呈负相关,所以r1<0,r2<0,因为剔除点(10,21)后,剩下的数据更具有线性相关性,|r|更接近于1,所以-1
又∵b^-a^=2,∴b^=32,a^=-12,∴线性回归方程为y^=32x-12.故选D.
4.B ∵y=aebx,∴ln y=ln(aebx)=ln a+ln ebx=ln a+bx,∵将指数曲线y=aebx进行线性变换后得到的回归方程为u^=1-0.6x,∴u^=ln y,b=-0.6,ln a=1,即a=e,∴函数y=x2+bx+a=x2-0.6x+e为二次函数,其图象开口向上,对称轴为直线x=310,∴函数y=x2+bx+a的单调递增区间为310,+∞,故选B.
二、填空题
5.答案 4.5
解析 由题意可知,产量x的平均值为x=14×(3+4+5+6)=4.5,又线性回归方程为y^=0.7x+0.35,其线性回归直线经过样本点的中心(x,y),所以y=0.7×4.5+0.35=3.5,由y=14×(2.5+3+4+a)=3.5,解得a=4.5,故答案为4.5.
三、解答题
6.解析 (1)画出散点图,如图所示:
(2)由题表得x=12.5,y=8.25,∑i=14xiyi=438,∑i=14xi2=660,
∴b^=∑i=14xiyi-4x y∑i=14xi2-4x 2=438-4×12.5×8.25660-4×12.52≈0.728 6,a^=y-b^x≈8.25-0.728 6×12.5=-0.857 5.故回归直线方程为y^=0.728 6x-0.857 5.
(3)令0.728 6x-0.857 5≤10,得x≤108 5757 286≈14.9,故机器的转速应控制在14.9转/秒以下.
7.解析 (1)根据散点图可知,y=c·dx更适合作为扫码支付的人次y关于活动推出天数x的回归方程类型.
(2)对y=c·dx两边同时取常用对数,得lg y=lg(c·dx)=lg c+xlg d.
设lg y=v,则v=lg c+xlg d,
由题知x=4,v=1.54,∑i=17xi2=140,
∴lg d^=∑i=17xivi-7x v∑i=17xi2-7x 2=50.12-7×4×1.54140-7×42=728=0.25,
把(4,1.54)代入v=lg c+xlg d中,得lg c=0.54,
∴v^=0.54+0.25x,∴lg y^=0.54+0.25x,
∴y关于x的回归方程为y^=100.54+0.25x=3.47×100.25x.
把x=8代入上式,得y^=3.47×102=347,
∴活动推出第8天使用扫码支付的人次的估计值为3 470.
解析 (1)由已知得x=15∑i=15xi=3,∑i=15ti=8ln 2+6 ln 3,∑i=15xiti=
26ln 2+22ln 3,∑i=15xi2=55,
所以b^=∑i=15xiti-5xt∑i=15xi2-5x 2
=26ln2+22ln3-3(8ln2+6ln3)55-5×32
=ln2+2ln35≈0.6,
a^=t-b^·x≈8ln2+6ln35-0.6×3≈2.4-1.8=0.6,所以t^=0.6x+0.6.
(2)可靠.由(1)可知y^=e0.6x+0.6,
当x=6时,y^=e4.2≈66.7,与检验数据的误差为2.7,不超过10;
当x=7时,y^=e4.8≈121.5,与检验数据的误差为8.5,不超过10.
故可以认为得到的回归方程y^=e0.6x+0.6是可靠的.
x
16
17
18
19
y
50
34
41
31
x
0
1
2
3
y
0.8
m
3.1
4.3
x
2
4
5
6
8
y
30
40
60
50
70
t
1
2
3
4
5
6
7
8
9
y
3.2
3.8
4.3
4.7
5.6
6.4
7.9
8.6
9.5
x
1
2
3
4
y
e
e3
e4
e6
日产量x(吨)
1
2
3
4
5
日销售额y(万元)
5
12
16
19
21
x
3
4
5
6
y
2.5
3
4
a
转速x(转/秒)
16
14
12
8
每小时生产有缺陷
零件的数量y(件)
11
9
8
5
x
1
2
3
4
5
6
7
y
6
11
21
34
66
101
196
y
v
∑i=17xivi
100.54
62.14
1.54
50.12
3.47
x
1
2
3
4
5
6
7
y
3
8
12
18
36
64
113
x
1
2
3
4
z
1
3
4
6
高中数学人教版新课标A选修2-33.1回归分析的基本思想及其初步应用同步测试题: 这是一份高中数学人教版新课标A选修2-33.1回归分析的基本思想及其初步应用同步测试题,共13页。试卷主要包含了96B,8D等内容,欢迎下载使用。
数学选修1-21.1回归分析的基本思想及其初步应用巩固练习: 这是一份数学选修1-21.1回归分析的基本思想及其初步应用巩固练习,
数学选修1-21.1回归分析的基本思想及其初步应用练习题: 这是一份数学选修1-21.1回归分析的基本思想及其初步应用练习题,