


所属成套资源:新教材2023_2024学年高中数学新人教A版选择性必修第三册分层作业(27份)
- 新教材2023_2024学年高中数学第7章随机变量及其分布综合训练新人教A版选择性必修第三册 试卷 0 次下载
- 新教材2023_2024学年高中数学第8章成对数据的统计分析8.1成对数据的统计相关性8.1.1变量的相关关系8.1.2样本相关系数分层作业新人教A版选择性必修第三册 试卷 0 次下载
- 新教材2023_2024学年高中数学第8章成对数据的统计分析8.3列联表与独立性检验8.3.1分类变量与列联表8.3.2独立性检验分层作业新人教A版选择性必修第三册 试卷 0 次下载
- 新教材2023_2024学年高中数学第8章成对数据的统计分析测评新人教A版选择性必修第三册 试卷 0 次下载
- 新教材2023_2024学年高中数学第8章成对数据的统计分析综合训练新人教A版选择性必修第三册 试卷 0 次下载
人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用同步训练题
展开这是一份人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用同步训练题,共11页。试卷主要包含了3,则=等内容,欢迎下载使用。
第八章8.2 一元线性回归模型及其应用
8.2.1 一元线性回归模型 8.2.2 一元线性回归模型参数的最小二乘估计
A级 必备知识基础练
1.[探究点一·2023陕西汉中模拟]如图所示,已知两个线性相关的变量x,y的统计数据如下:
x | 6 | 8 | 10 | 12 |
y | 6 | 5 | 3 | 2 |
其经验回归方程为x+10.3,则=( )
A.-0.7 B.0.7 C.-0.5 D.-2
2.[探究点二]红铃虫是棉花的主要害虫之一,一只红铃虫的产卵数和温度有关.现收集了7组观测数据,用4种模型分别进行拟合.由此得到相应的经验回归方程并进行残差分析,进一步得到如图4幅残差图,根据残差图,拟合效果最好的模型是( )
A.模型一 B.模型二 C.模型三 D.模型四
3.[探究点二]关于残差图的描述错误的是( )
A.残差图的横坐标可以是样本编号
B.残差图的横坐标也可以是解释变量或响应变量
C.残差分布的带状区域的宽度越窄R2越小
D.残差分布的带状区域的宽度越窄残差平方和越小
4.[探究点三·2023山东滨州模拟]下列结论正确的是 .
①对两个变量x,y进行回归分析,若所有样本点都在直线y=-2x+1上,则r=1;
②对两个变量x,y进行回归分析,以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=ln y,将其变换后得到经验回归方程=0.3x+4,则c,k的值分别是e4和0.3;
③某人投篮一次命中的概率为,某次练习他进行了20次投篮,每次投篮命中与否互相之间没有影响,设本次练习他投篮命中的次数为随机变量X,则当P(X=k)(k=0,1,2,3,…,20)取得最大值时,X=6;
④已知(1-2x)7=a0+a1x+a2x2+…+a7x7,则a1+2a2+…+7a7=-14.
5.[探究点一]某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x/元 | 8 | 8.2 | 8.4 | 8.6 | 8.8 | 9 |
销量y/件 | 90 | 84 | 83 | 80 | 75 | 68 |
(1)已知y与x线性相关,求销量y关于单价x的经验回归方程x+,其中=-20,;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
6.[探究点二]在一段时间内,某网店一种商品的销售价格x(单位:元)和日销售量y(单位:件)之间的一组数据如下表:
价格x/元 | 22 | 20 | 18 | 16 | 14 |
日销售量y/件 | 37 | 41 | 43 | 50 | 56 |
求出y关于x的经验回归方程,并用R2说明拟合效果.
参考数据:xiyi=3 992,=1 660.
参考公式:,R2=1-.
B级 关键能力提升练
7.研究表明蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y(单位:℃)存在着较强的线性相关关系.某地观测人员根据如表的观测数据,建立了y关于x的经验回归方程=0.27x+,则下列说法不正确的是( )
x/(次数/分钟) | 20 | 30 | 40 | 50 | 60 |
y/℃ | 25 | 27.5 | 29 | 32.5 | 36 |
A.的值是19.2
B.变量x,y正相关
C.若x的值增加1,则y的值约增加0.27
D.当蟋蟀以52次/分钟的频率鸣叫时,该地当时的气温预测值为33.5 ℃
8.(多选题)下列说法正确的是( )
A.经验回归直线一定经过点()
B.若两个具有线性相关关系的变量的相关程度越强,则样本相关系数r的值越接近于1
C.在残差图中,残差分布的水平带状区域越窄,说明模型的拟合精度越高
D.在线性回归模型中,决定系数R2越接近于1,说明回归模型的拟合效果越好
9.已知蝗虫的产卵量y与温度x的关系可以用模型y=c1拟合,设z=ln y,其变换后得到一组数据:
x | 20 | 23 | 25 | 27 | 30 |
z | 2 | 2.4 | 3 | 3 | 4.6 |
由上表可得经验回归方程=0.2x+,则c1=( )
A.-2 B.e-2 C.3 D.e3
10.某品牌服装专卖店为了解保暖衬衣的销售量y(单位:件)与平均气温x(单位:℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如下表:
时间 | 二月上旬 | 二月中旬 | 二月下旬 | 三月上旬 |
旬平均气温x/℃ | 3 | 8 | 12 | 17 |
旬销售量y/件 | 55 | m | 33 | 24 |
由表中数据算出经验回归方程x+中的=-2,=10,=38.
(1)表中数据m= .
(2)气象部门预测三月中旬的平均气温约为22 ℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为 件.
11.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了四次试验,得到的数据如下:
零件的个数x | 1 | 2 | 4 | 5 |
加工的时间y/小时 | 2 | 3 | 5 | 6 |
已知零件的个数x与加工的时间y具有线性相关关系.
(1)求出y关于x的经验回归方程;注:
(2)试预测加工10个零件需要多少时间.
12.流感每年在世界各地均有传播,在我国北方通常呈冬春季流行,南方有冬春季和夏季两个流行高峰.某幼儿园将去年春季该园患流感小朋友按照年龄与人数统计,得到如下数据:
年龄x | 2 | 3 | 4 | 5 | 6 |
患病人数y | 22 | 22 | 17 | 14 | 10 |
(1)已知y与x线性相关,求y关于x的经验回归方程;
(2)计算样本相关系数r(计算结果精确到0.01),并回答是否可以认为该幼儿园去年春季患流感人数与年龄负相关很强.(若|r|∈[0.75,1],则x,y相关性很强;若|r|∈[0.3,0.75),则x,y相关性一般;若|r|∈[0,0.25],则x,y相关性较弱)
参考数据:≈5.477.
参考公式:,样本相关系数r=.
13.某医疗科研团队攻坚克难研发出一种新型防疫产品,该产品的成本由原
料成本及非原料成本组成,每件产品的非原料成本y(单位:元)与生产该产品的数量x(单位:千件)有关,根据已经生产的统计数据,绘制了如图所示的散点图.观察散点图,两个变量不具有线性相关关系,现考虑用函数y=a+对两个变量的关系进行拟合.参考数据如下其中ui=:
yi | uiyi | |||||
0.41 | 0.168 1 | 1.492 | 306 | 20 858.44 | 173.8 | 50.39 |
(1)求y关于x的非线性经验回归方程,并求y关于u的样本相关系数(精确到0.01).
(2)该产品采取订单生产模式(根据订单数量进行生产,即产品全部售出).根据市场调研数据,若该产品单价定为80元,则签订9千件订单的概率为0.7,签订10千件订单的概率为0.3;若单价定为70元,则签订10千件订单的概率为0.3,签订11千件订单的概率为0.7.已知每件产品的原料成本为30元,根据(1)的结果,要想获得更高利润,产品单价应选择80元还是70元?请说明理由.
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归方程v=α+βu的斜率和截距的最小二乘估计分别为,相关系数r=.
C级 学科素养创新练
14.[2023辽宁鞍山模拟]某IT公司在1月份至6月份的5G经济收入y(单位:百万元)关于月份x的数据如下表所示,并根据数据绘制了如图所示的散点图.
月份x | 1 | 2 | 3 | 4 | 5 | 6 |
收入y/百万元 | 6.6 | 8.6 | 16.1 | 21.6 | 33.0 | 41.0 |
(1)根据散点图判断,y=ax+b与y=cedx(a,b,c,d均为常数)哪一个更适宜作为5G经济收入y关于月份x的经验回归方程类型;(给出判断即可,不必说明理由)
(2)根据(1)中的结果及表中的数据,求出y关于x的经验回归方程,并预测该公司7月份的5G经济收入;(结果保留小数点后两位)
(3)从前6个月的收入中抽取2个,记收入超过2 000万元的个数为X,求X的分布列和数学期望.
参考数据:
(xi-)2 | (xi-)(yi-) | (xi-)(ui-) | e1.52 | e2.66 | |||
3.50 | 21.15 | 2.85 | 17.5 | 125.35 | 6.73 | 4.57 | 14.30 |
其中,u=ln y,ui=ln yi(i=1,2,3,4,5,6).
参考公式:对于一组具有线性相关关系的数据(xi,vi)(i=1,2,3,…,n),其经验回归直线x+的斜率和截距的最小二乘估计分别为.
参考答案
8.2 一元线性回归模型及其应用
8.2.1 一元线性回归模型
8.2.2 一元线性回归模型
参数的最小二乘估计
1.A 由表格中数据可得=9,=4,则=-0.7.故选A.
2.D 当残差比较均匀地落在水平的带状区域时,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明拟合效果越好,对比4个残差图,可知模型四的图对应的带状区域的宽度最窄.
3.C 残差分布的带状区域的宽度越窄,说明模型拟合精度越高,则残差平方和越小,此时R2的值越大,故描述错误的是选项C.
4.②④ 对于①,对两个变量x,y进行回归分析,若所有样本点都在直线y=-2x+1上,则r=-1,故①错误;
对于②,由=0.3x+4及z=ln y,得=e0.3x+4=e4·e0.3x,故c=e4,k=0.3,故②正确;
对于③,依题意可知,X~B20,,P(X=k)=k1-20-k,假设P(X=k)最大,
则
即
整理得
∴解得6≤k≤7,
∴P(X=k)(k=0,1,2,3,…,20)取得最大值时X=6或X=7,故③错误;
对于④,由(1-2x)7=a0+a1x+a2x2+…+a7x7,两边对x求导,得7(1-2x)6·(-2)=a1+2a2x+3a3x2+…+7a7x6,令x=1,得-14=a1+2a2+…+7a7,故④正确.
5.解(1)因为×(8+8.2+8.4+8.6+8.8+9)=8.5,×(90+84+83+80+75+68)=80,
所以=80+20×8.5=250.所以经验回归方程为=-20x+250.
(2)设工厂获得的利润为L(单位:元),依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1 000=-20+361.25.
当且仅当x==8.25时,L取得最大值.
故当单价定为8.25元时,工厂可获得最大利润.
6.解作出散点图(图略),观察散点图可知这些点散布在一条直线的附近,故可知x与y线性相关.
因为=18,
=45.4.
所以=-2.35,
=45.4-(-2.35)×18=87.7.
所以经验回归方程为=-2.35x+87.7.
yi-与yi-的值如下表:
yi- | 1 | 0.3 | -2.4 | -0.1 | 1.2 |
yi- | -8.4 | -4.4 | -2.4 | 4.6 | 10.6 |
计算得(yi-)2=8.3,(yi-)2=229.2,所以R2=1-≈0.964.
因为0.964很接近于1,所以该模型的拟合效果比较好.
7.D 由题意,得×(20+30+40+50+60)=40,×(25+27.5+29+32.5+36)=30,
则-0.27=30-0.27×40=19.2,故A正确;
由经验回归方程可知,变量x,y呈正相关关系,故B正确;
若x的值增加1,则y的值约增加0.27,故C正确;
当x=52时,=0.27×52+19.2=33.24,故D错误.
8.ACD 对于A,经验回归直线一定经过点(),故A正确;
对于B,由样本相关系数的绝对值越趋近于1,相关程度越强可知,若两个变量负线性相关,其线性相关程度越强,则样本相关系数r的值越接近于-1,故B错误;
对于C,因为在残差图中,残差分布的水平带状区域越窄,说明模型的拟合精度越高,故C正确;
对于D,因为在线性回归模型中,决定系数R2越接近于1,说明线性回归模型的拟合效果越好,故D正确.
9.B 由已知可得,×(20+23+25+27+30)=25,
×(2+2.4+3+3+4.6)=3,
则=3-0.2×25=-2.
z=ln y=ln(c1)=c2x+ln c1,
则lnc1=-2,即c1=e-2.
10.(1)40 (2)14 (1)由(55+m+33+24)=38,解得m=40.
(2)由,得=58.
故=-2x+58.
当x=22时,=14.
故三月中旬的销售量约为14件.
11.解(1)由表中数据得xiyi=58,=3,=4,=46,∴=1,=4-3=1.
∴=x+1.
(2)将x=10代入经验回归方程=x+1中,得=11,
∴预测加工10个零件需要11小时.
12.解(1)由题意可得=4,=17,
==-3.2,
=17+3.2×4=29.8.
故y关于x的经验回归方程为=-3.2x+29.8.
(2)r=≈-0.97,由r<0,可知x,y负相关.又因为|r|∈[0.75,1],所以x,y相关性很强.
因此,可以认为该幼儿园去年春季患流感人数与年龄负相关很强.
13.解(1)令u=,先建立y关于u的经验回归方程.
因为=51,所以=100.
所以=51-100×0.41=10.所以=10+100u.
所以y关于x的非线性经验回归方程为=10+.
y关于u的样本相关系数为
r=
=≈0.96.
(2)(方法一)(ⅰ)若产品单价为80元,记企业利润为X(单位:元).
当订单为9千件时,每件产品的成本为10++30=(元),
企业的利润为80-40+×9 000=260 000(元).
当订单为10千件时,每件产品的成本为10++30=50(元),企业的利润为(80-50)×10 000=300 000(元).
所以企业利润X的分布列为
X | 260 000 | 300 000 |
P | 0.7 | 0.3 |
E(X)=260000×0.7+300000×0.3=272000.
(ⅱ)若产品单价为70元,记企业利润为Y(单位:元).
当订单为10千件时,每件产品的成本为10++30=50(元),企业的利润为(70-50)×10000=200000(元).
当订单为11千件时,每件产品的成本为10++30=(元),
企业的利润为70-40+×11000=230000(元).
所以企业利润Y的分布列为
Y | 200000 | 230000 |
P | 0.3 | 0.7 |
E(Y)=200000×0.3+230000×0.7=221000.
所以E(X)>E(Y),故企业要想获得更高利润,产品单价应选择80元.
(方法二)(ⅰ)若产品单价为80元,记企业的产量为X(单位:千件),其分布列为
X | 9 | 10 |
P | 0.7 | 0.3 |
所以E(X)=9×0.7+10×0.3=9.3,
企业的利润为80-40+×9300=272000(元).
(ⅱ)若产品单价为70元,记企业的产量为Y(单位:千件),其分布列为
Y | 10 | 11 |
P | 0.3 | 0.7 |
所以E(Y)=10×0.3+11×0.7=10.7,企业的利润为70-40+×10700=221000(元).
因为272000>221000,
所以企业要想获得更高利润,产品单价应选择80元.
14.解(1)根据散点图判断,y=cedx更适宜作为5G经济收入y关于月份x的经验回归方程类型.
(2)由(1)得y=cedx,则两边同时取常用对数得lny=lnc+dx,设u=lny,则u=lnc+dx.
∵=3.50,=2.85,
∴≈0.38,
∴≈2.85-0.38×3.50=1.52,
∴=1.52+0.38x,
∴=e1.52+0.38x.
令x=7,则=e1.52+0.38×7=e1.52×e2.66≈4.57×14.30≈65.35,
故预测该公司7月份的5G经济收入大约为65.35百万元.
(3)前6个月的收入中,收入超过2 000万元的有3个,
∴随机变量X的可能取值为0,1,2,
∴P(X=0)=,P(X=1)=,P(X=2)=,故X的分布列为
X | 0 | 1 | 2 |
P |
∴E(X)=0×+1×+2×=1.
相关试卷
这是一份高中人教A版 (2019)8.2 一元线性回归模型及其应用同步测试题,共6页。试卷主要包含了9,且等内容,欢迎下载使用。
这是一份高中数学人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用练习题,共10页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
这是一份人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.2 一元线性回归模型及其应用当堂达标检测题,共16页。试卷主要包含了27B,已知x、y的取值如下表所示,4B等内容,欢迎下载使用。