





- 专题6.6 概率(基础巩固卷)-2023-2024学年高二数学必考考点各个击破(北师大版选择性必修第一册) 试卷 0 次下载
- 专题6.7 概率(能力提升卷)-2023-2024学年高二数学必考考点各个击破(北师大版选择性必修第一册) 试卷 0 次下载
- 专题7.2 非线性回归问题(3类必考点)-2023-2024学年高二数学必考考点各个击破(北师大版选择性必修第一册) 试卷 0 次下载
- 专题7.3 独立性检验(3类必考点)-2023-2024学年高二数学必考考点各个击破(北师大版选择性必修第一册) 试卷 0 次下载
- 专题7.4 统计案例(基础巩固卷)-2023-2024学年高二数学必考考点各个击破(北师大版选择性必修第一册) 试卷 0 次下载
专题7.1 一元线性回归问题(3类必考点)-2023-2024学年高二数学必考考点各个击破(北师大版选择性必修第一册)
展开TOC \ "1-3" \t "正文,1" \h
\l "_Tc25588" 【基础知识】 PAGEREF _Tc25588 \h 1
\l "_Tc19382" 【考点1:相关系数】 PAGEREF _Tc19382 \h 2
\l "_Tc11678" 【考点2:求回归直线方程】 PAGEREF _Tc11678 \h 5
\l "_Tc28601" 【考点3:一元线性回归模型的应用】 PAGEREF _Tc28601 \h 10
【基础知识】
【一元线性回归】
[方法技巧]
判断相关关系的两种方法
(1)散点图法:如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.
(2)相关系数法:利用相关系数判定,|r|越趋近于1相关性越强.
1.回归直线方程中系数的两种求法
(1)公式法:利用公式,求出回归系数eq \(b,\s\up6(^)),eq \(a,\s\up6(^)).
(2)待定系数法:利用回归直线过样本点中心(eq \(x,\s\up6(-)),eq \(y,\s\up6(-)))求系数.
2.回归分析的两种策略
(1)利用回归方程进行预测:把回归直线方程看作一次函数,求函数值.
(2)利用回归直线判断正、负相关:决定正相关还是负相关的是回归系数eq \(b,\s\up6(^)).
【考点1:相关系数】
【知识点:相关系数】
1.(2023春·陕西咸阳·高二校考阶段练习)在变量y与x的回归模型中,根据下面四个的相关系数r,判断拟合效果最好的是( )
A.模型1的相关系数r为0.2B.模型2的相关系数r为0.3
C.模型3的相关系数r为0.9D.模型4的相关系数r为0.8
【答案】C
【分析】由相关系数的绝对值越接近于1,回归模型拟合效果越好即可得出结论.
【详解】根据相关系数的绝对值大小可得模型3的相关系数r为0.9,离1最接近,
所以C项的拟合效果最好.
故选:C
2.(2023·河南安阳·统考二模)已知建筑地基沉降预测对于保证施工安全,实现信息化监控有着重要意义.某工程师建立了四个函数模型来模拟建筑地基沉降随时间的变化趋势,并用相关指数、误差平方和、均方根值三个指标来衡量拟合效果.相关指数越接近1表明模型的拟合效果越好,误差平方和越小表明误差越小,均方根值越小越好.依此判断下面指标对应的模型拟合效果最好的是( ).
A.
B.
C.
D.
【答案】C
【分析】根据相关指数大小和误差平方和以及均方根值即可得到答案.
【详解】相关指数越接近于1,拟合效果越好,比较相关指数知,可选C,D,
误差平方和及均方根值都越小,拟合效果越好,观察误差平方和和均方根值,知C的拟合效果最好.
故选:C.
3.(2023·全国·高二专题练习)关于相关系数r,下面说法正确的是( )
A.r∈−1,1
B.若r=0,则两个变量线性不相关
C.若r<0,则一个变量增加,另一个变量有减少的趋势
D.r越小,变量之间的线性相关程度越高
【答案】ABC
【分析】根据相关系数的定义以及性质即可求解.
【详解】r∈−1,1,故A正确,若r=0,则两个变量线性不相关,故B正确,若r<0,则一个变量增加,另一个变量有减少的趋势,C正确,r越大,变量之间的线性相关程度越高,故D错误,
故选:ABC
4.(2023春·河北·高三统考阶段练习)在回归分析中,下列说法正确的是( )
A.相关系数0
C.点xi,yi所对应的残差是指yi−yi
D.R2越大,说明残差的平方和越小,即模型的拟合效果越好
【答案】ACD
【分析】根据题意,由相关系数的性质对选项逐一判断,即可得到结果.
【详解】相关系数0
残差是指实际值-估计值,所以C正确;
R2越大,说明残差的平方和越小,即模型的拟合效果越好,所以D正确.
故选:ACD.
5.(2023·全国·高三专题练习)某专营店统计了近五年来该店的创收利润y(单位:万元)与时间ti(单位:年)的相关数据,列表如下:
依据表中给出的数据,是否可用线性回归模型拟合y与t的关系?请计算相关系数r并加以说明(计算结果精确到0.01,若r>0.8,则认为y与t高度相关,可用线性回归模型拟合y与t的关系).
【答案】r≈0.97, y与t高度相关,可用线性回归模型拟合y与t的关系.
【分析】根据所给数据,由相关系数计算公式计算,即可得出结论.
【详解】由题知,t=15×(1+2+3+4+5)=3,y=15×(2.4+2.7+4.1+6.4+7.9)=4.7,
i=15tiyi=85.2,i=15(ti−t)2=10,i=15(yi−y)2=22.78,
则r=i=15tiyi−5tyi=15(ti−t)2i=15(yi−y)2=85.2−5×3×4.710×22.78=14.7227.8≈≈0.97,
∵|0.97|>0.8,
∴y与t高度相关,可用线性回归模型拟合y与t的关系.
6.(2023·全国·高三专题练习)某企业坚持以市场需求为导向,合理配置生产资源,不断改革、探索销售模式.下表是该企业每月生产的一种核心产品的产量x(件)与相应的生产总成本y(万元)的五组对照数据:
试求y与x的相关系数r,并利用相关系数r说明y与x是否具有较强的线性相关关系(若r>0.75,则线性相关程度很高,可用线性回归模型拟合).
参考公式:r=i=1n(xi−x)(yi−y)i=1n(xi−x)2i=1n(yi−y)2
【答案】答案见详解
【分析】先根据公式求出相关系数,再根据相关系数的值判断y与x是否具有较强的线性相关关系.
【详解】x=151+2+3+4+5=3,y=153+7+8+10+12=8,
i=15(xi−x)2=10,i=15(yi−y)2=46,i=15(xi−x)(yi−y)=21,
相关系数r=2110×46≈0.98.
因为r>0.75,所以y与x具有较强的线性相关关系,可用线性回归模型拟合.
【考点2:求回归直线方程】
【知识点:求回归直线方程】
1.(2023·高二课时练习)已知变量y与x之间具有线性相关关系,根据变量x与y的相关数据,计算得i=17xi=28,i=17yi=1078,i=17xi2=140,i=17xiyi=4508则y关于x的线性回归方程为( )
附:回归方程y=bx+a中的斜率和截距的最小二乘法估计公式分别为b=i=1nxiyi−nx⋅yi=1nxi2−nx2,a=y−bx.
A.y=7x−126B.y=7x+126
C.y=5x+121D.y=5x−121
【答案】B
【分析】根据已知数据求b,a,代入回归直线方程即可求解.
【详解】由题中的数据可知x=4,y=154,
所以b^=i=17xiyi−7xyi=17xi2−7x2=4508−7×4×154140−7×16=19628=7.
所以a=y−bx=154−7×4=126.
所以y关于x的线性回归方程为y=bx+a=7x+126.
故选:B.
2.(2023·全国·高三专题练习)2021年春节前,受疫情影响,各地鼓励外来务工人员选择就地过年.某市统计了该市4个地区的外来务工人数与就地过年人数(单位:万),得到如下表格:
请用相关系数说明y与x之间的关系可用线性回归模型拟合,并求y关于x的线性回归方程y=a+bx.
【答案】y与x之间的线性相关程度非常强,y=0.7x+0.35
【分析】根据相关系数公式计算r,判断相关性,再由最小二乘法,根据公式计算b,a,即可得解.
【详解】由题,x=3+4+5+64=4.5,y=2.5+3+4+4.54=3.5,
i=14xiyi=3×2.5+4×3+5×4+6×4.5=66.5,
i=14xi2=32+42+52+62=86,
i=14yi2=2.52+32+42+4.52=51.5,
所以相关系数r=66.5−4×4.5×3.586−4×4.52×51.5−4×3.52=3.55×2.5≈0.99,
因为y与x之间的相关系数近似为0.99,说明y与x之间的线性相关程度非常强,所以可用线性回归模型拟合y与x之间的关系.
b=66.5−4×4.5×3.586−4×4.52=0.7,a=y−bx=3.5−0.7×4.5=0.35,
故y关于x的线性回归方程为y=0.7x+0.35.
3.(2023·全国·高三专题练习)某汽车4S店关于某品牌汽车的使用年限x(年)和所支出的维修费用y(千元)有如下的统计资料:
试求y关于x的线性回归方程.
参考公式:b=i=1nxi−xyi−yi=1nxi−x2=i=1nxiyi−nxyi=1nxi2−nx2,a=y−bx.
【答案】y^=1.3x−0.2
【分析】根据题意,计算平均数和回归系数,写出回归直线方程.
【详解】由题,x=2+3+4+5+65=4,y=2+3.5+6+6.5+75=5,
i=15xiyi=2×2+3×3.5+4×6+5×6.5+6×7=113,
i=15xi2=22+32+42+52+62=90,
所以b=i=15xiyi−5x⋅yi=15xi2−5x2=113−5×4×590−5×42=1.3,a=y−b⋅x=5−1.3×4=−0.2,
所以y关于x的线性回归方程为:y^=1.3x−0.2
4.(2023·全国·高三专题练习)某部门统计了某网红景点在2022年3月至7月的旅游收入y(单位:万元),得到以下数据:
根据表中所给数据,用相关系数r加以判断,是否可用线性回归模型拟合y与x的关系?若可以,求出y关于x的线性回归方程;若不可以,请说明理由.
【答案】可以,y=2x+3.
【分析】根据相关系数公式计算r,判断相关性,再由最小二乘法求线性回归方程.
【详解】由已知得,x=5,y=13,i=15(xi−x)2=10,i=15(yi−y)2=64,i=15(xi−x)(yi−y)=20,
所以r=2010×64=5210=104≈0.791,
因为|r|≈0.791∈0.75,1,说明y与x的线性相关关系很强,
可用线性回归模型拟合y与x的关系,
∴b=2010=2,a=y−bx=13−10=3,
则y关于x的线性回归方程为:y=2x+3.
5.(2023·全国·高三专题练习)某餐厅查阅了最近5次食品交易会参会人数x(万人)与餐厅所用原材料数量y(袋),得到如下统计表:
根据所给5组数据,求出y关于x的线性回归方程.
参考公式:b=i=1nxi−xyi−yi=1nxi−x2=i=1nxiyi−nxyi=1nxi2−nx2,a=y−bx.
【答案】y=2.5x−1
【分析】根据所提供数据,由公式计算b,a即可得解.
【详解】设线性回归方程为y=bx+a,
x=13+9+8+10+125=10.4,y=32+23+18+24+285=25,
i=15xiyi=13×32+9×23+8×18+10×24+12×28=1343,
i=15xi2=132+92+82+102+122=558,
所以b=i=15xiyi−5x⋅yi=15xi2−5x2=1343−5×10.4×25558−5×10.42=2.5,a=y−b⋅x=25−2.5×10.4=−1,
即利润额y对销售额x的线性回归方程为y=2.5x−1
6.(2023·全国·高三专题练习)某连锁经营公司旗下的5个零售店某月的销售额和利润额如下表:
用最小二乘法计算利润额y关于销售额x的线性回归方程.
【答案】y=0.5x+0.4
【分析】根据最小二乘法公式求出b,a,即可得出.
【详解】设线性回归方程为y=bx+a,
因为y=2+3+3+4+55=3.4,x=3+5+6+7+95=6,
i=15xiyi=3×2+5×3+6×3+7×4+9×5=112,i=15xi2=32+52+62+72+92=200,
所以b=i=15xiyi−5x⋅yi=15xi2−5x2=112−5×6×3.4200−5×62=0.5,a=y−b⋅x=3.4−6×0.5=0.4,
即利润额y对销售额x的线性回归方程为y=0.5x+0.4.
7.(2023春·四川内江·高三四川省内江市第六中学校考阶段练习)小家电指除大功率、大体积家用电器(如冰箱、洗衣机、空调等)以外的家用电器,运用场景广泛,近年来随着科技发展,智能小家电市场规模呈持续发展趋势,下表为连续5年中国智能小家电市场规模(单位:千亿元),其中年份对应的代码依次为1∼5.
(1)由上表数据可知,可用线性回归模型拟合y与x的关系,请用相关系数加以说明;
(2)建立y关于x的经验回归方程(系数精确到0.01).
参考数据::y=1.32,i=15xiyi=21.4,i=15yi−y2≈0.55,10≈3.16;
参考公式:相关系数r=i=1nxi−xyi−yi=1nxi−x2i=1nyi−y2,回归方程y=bx+a中斜率和截距的最小二乘估计公式分别为b=i=1nxi−xyi−yi=1nxi−x2,a=y−bx.
【答案】(1)答案见解析
(2)y=0.16x+0.84
【分析】(1)由题意代入公式即可求出相关系数近似为0.92,说明y与x的线性相关程度较高,从而可以用线性回归模型拟合y与x的关系;
(2)利用最小二乘法求出b=0.16,a=0.84,即可得到y关于x的经验回归方程.
【详解】(1)由已知得x=1+2+3+4+55=3,y=1.32,i=15xi−x2=10,i=15yi−y2≈0.55,
i=15xi−xyi−y=i=15xiyi−5x⋅y=21.4−5×3×1.32=1.6
∴r≈×0.55≈0.92.
因为y与x的相关系数近似为0.92,说明y与x的线性相关程度较高,从而可以用线性回归模型拟合y与x的关系.
(2)由题可得,i=15xiyi=21.4,i=15xi2=12+22+32+42+52=55
b=i=15xi−xyi−yi=15xi2−5x2=1.655−5×32=0.16,a=y−bx=1.32−0.16×3=0.84
故y关于x的经验回归方程为y=0.16x+0.84.
8.(2023·全国·高三专题练习)某收费APP(手机应用程序)自上架以来,凭借简洁的界面设计、方便的操作方式和强大的实用功能深得用户的喜爱.该APP所在的公司统计了用户一个月月租减免的费用x(单位:元)及该月对应的用户数量y(单位:万人),得到如下数据表格:
已知x与y线性相关.
(1)求y关于x的线性回归方程(i=15xi2=135,i=15yi2=12.91,i=15xiyi=41.7);
(2)求y与x的相关系数(精确到0.01).
【答案】(1)y^=0.32x−0.06
(2)0.98
【分析】(1)根据最小二乘法公式计算b,a,求出线性回归方程;
(2)根据相关系数计算公式计算即可.
【详解】(1)由x=15×3+4+5+6+7=5,y=15×1+1.1+1.5+1.9+2.2=1.54,
有b=41.7−5×5×1.54135−5×52=0.32,a=1.54−0.32×5=−0.06,
故y关于x的线性回归方程为y^=0.32x−0.06;
(2)y与x的相关系数r=i=15xiyi−5xyi=15xi2−5x2i=15yi2−5y2
=41.7−5×5×1.54135−5×5212.91−5×1.542
=≈2×0.49=0.98.
【考点3:一元线性回归模型的应用】
【知识点:一元线性回归模型的应用】
1.(2023·全国·模拟预测)某农科所统计了单位面积某种化肥实施量x(kg)和玉米相应产量Y(kg)的相关数据,制作了数据对照表:
若在合理施肥范围内x与Y具有线性相关关系,
(1)求Y关于x的线性回归方程y=bx+a;
(2)请利用线性回归方程预测x=40kg时的玉米产量.
附:回归直线的斜率和截距的最小二乘法估计公式分别为:b=i=1nxi−xyi−yi=1nxi−x2,a=y−bx.
【答案】(1)y=5.893x+234.675
(2)470.395kg
【分析】(1)利用最小二乘法求解;
(2)将x=40kg代入回归方程求解.
【详解】(1)解:由表中数据计算得,x=25.y=382,
i=15xi−xyi−y=1438,i=15xi−x2=244,
b=i=15xi−xyi−yi=15xi−x2≈5.893,
a=y−bx=382−5.893×25=234.675.
所以回归方程为y=5.893x+234.675.
(2)将x=40kg代入回归方程得y=5.893x+234.675.
故预测x=40kg时,玉米产量约为5.893×40+234.675=470.395kg.
2.(2023·青海西宁·统考二模)造林绿化对生态发展特别是在防风固沙、缓解温室效应、净化空气、涵养水源等方面有着重要意义.某苗木培养基地为了对某种树苗的高度偏差x(单位:cm)与树干最大直径偏差y(单位:mm)之间的关系进行分析,随机挑选了8株该品种的树苗,得到它们的偏差数据(偏差是指个别测定值与测定的平均值之差)如下:
(1)若x与y之间具有线性相关关系,求y关于x的线性回归方程;
(2)若这种树苗的平均高度为120cm,树干最大直径平均为31.5mm,试由(1)的结论预测高度为128cm的这种树苗的树干最大直径为多少毫米.
参考数据:i=18xiyi=324,i=18xi2=1256.
参考公式:回归直线方程y=a+bx中斜率和截距的最小二乘估计:b=i=1nxiyi−nxyi=1nxi2−nx2,a=y−bx.
【答案】(1)y=14x+12
(2)34
【分析】(1)根据最小二乘法公式求出b,a,即可得出线性回归方程;
(2)利用回归直线方程代入x=128−120,求解即可.
【详解】(1)x=20+15+13+3+2+(−5)+(−10)+(−18)8=52,
y=56.5+3.5+3.5+1.5+0.5+(−0.5)+(−2.5)+(−3.5)8=98,
b=i=1nxiyi−nxyi=1nxi2−nx2=324−8×52×981256−8×(52)2=14,a=y−bx=98−14×52=12,
故y关于x的线性回归方程为y=14x+12
(2)当树干高度为128cm时,高度偏差x=128−120=8(cm),
y=14×8+12=2.5(mm),
所以树干直径约为2.5+31.5=34(mm),
即预测高度为128cm的这种树苗的树干最大直径为34毫米.
3.(2023春·陕西宝鸡·高二校联考阶段练习)某中学学生会为了激发学生们对中国古典文学的爱好,提升古典文学素养,在暑假开学返校后的第一个月组织了一个古典文学研究协会,在接下来的四个月内,该协会的会员人数如表:
(1)求会员人数与时间变量(记第一个月为x=1,第二个月为x=2,…,以此类推)的线性回归方程;(i=15xiyi=303,i=15xi2=55)
(2)根据(1)中所求的线性回归方程,预测12个月后,会员人数能否突破60人.
参考公式:回归方程=x+中斜率和截距的最小二乘估计公式分别为 ????? ????????.????3 \∗ ??????????? =i=1nxiyi−nx−⋅y−i=1nxi2−nx−2=i=1n(xi−x−)(yi−y−)i=1n(xi−x−)2; ????? ????????.????3 \∗ ??????????? =y− ????? ????????.????3 \∗ ??????????? x.
【答案】(1)y=4.5x+3.7
(2)不能突破60人
【分析】1由题意求出x,y,i=15xi2,i=15xiyi,代入公式求值,从而得到回归直线方程;
2代入x=12即可求出y的值,即可作出判断.
【详解】(1)由题意可得,x=151+2+3+4+5=3,y−=15(9+12+17+21+27)=17.2,
∵i=15xiyi=303,i=15xi2=55,
∴b=i=15xiyi−5x−y−i=15xi2−5x−2=303−5×3×17.255−5×32=4.5,
∴a=y−−bx−=17.2−4.5×3=3.7,
∴y=4.5x+3.7;
(2)根据1中所求的线性回归方程,将x=12代入该回归方程中,得y=4.5×12+3.7=57.7<60,
即预测12个月后,会员人数不能突破60人.
4.(2023·河南·校联考模拟预测)为了探讨学生的物理成绩y与数学成绩x之间的关系,从某校高三学生中抽取10名学生,他们的成绩(xi,yi)(i=1,2,…,10)如下表:
(1)请用相关数据说明该组数据中y与x间的关系是否可用线性回归模型拟合;
(2)求物理成绩y关于数学成绩x的线性回归方程;(结果保留三位小数)
(3)从统计的10名学生中随机抽取2名,求至少有一名学生物理成绩不少于60分的概率.
附:参考数据与参考公式
相关系数r=i=1nxi−xyi−yi=1nxi−x2i=1nyi−y2,b=i=1nxi−xyi−yi=1nxi−x2,a=y−b⋅x.
【答案】(1)可用线性回归模型拟合
(2)yˆ=0.672x−10.598
(3)1315
【分析】(1)由已知数据计算出相关系数r后可得;
(2)根据公式求出b,a即得;
(3)利用组合知识求得从10人任取2人的基本事件的个数、至少有一名同学物理成绩不少于60分的基本事件个数后可计算出概率.
【详解】(1)因为r=i=110xi−xyi−yi=110xi−x2i=110nyi−y2≈ 75963−10×112210×648103269.16738=≈0.9964,而0.9964非常接近于1,所以可用线性回归模型拟合.
(2)因为b^=i=110xi−xyi−yi=110xi−x2=3257.44845.6≈0.672,aˆ=64.8−0.672×112.2≈−10.598,
所以物理成绩y关于数学成绩x的线性回归方程为yˆ=0.672x−10.598.
(3)记“从统计的10名同学中随机抽取2名,至少有一名同学物理成绩不少于60分的为事件A”,则一次试验中所含有的基本事件的个数n=C102=45,
事件A中所含有的基本事件的个数m=C102−C42=39.
所以从统计的10名同学中随机抽取2名,至少有一名同学物理成绩不少于60分的概率为PA=mn=3945=1315.
5.(2023春·四川乐山·高二四川省乐山沫若中学校考阶段练习)近年来,随着社会对教育的重视,家庭的平均教育支出增长较快,随机抽样调查某市2015~2021年的家庭平均教育支出,得到如下表格.(附:年份代码1~7分别对应的年份是2015~2021).经计算得i=17yi=259,i=17tiyi=1175,i=17yi−y2=107,i=17ti−tyi−y=139.
(1)计算样本ti,yii=1,2,⋅⋅⋅,7的相关系数,并判断两个变量的相关性强弱;(精确到0.01)
(2)建立y关于t的线性回归方程;(精确到0.01)
(3)若2022年该市某家庭总支出为10万元,预测该家庭教育支出约为多少万元?
附:(i)相关系数:r=i=1nti−tyi−yi=1nti−t2i=1nyi−y2;(ii)线性回归方程:y=bt+a,其中b=i=1nti−tyi−yi=1nti−t2,a=y−bt.
【答案】(1)0.99,两个变量有很强的线性相关性
(2)y=4.96t+17.16
(3)5.684万元
【分析】(1)计算出t的值,将表格中的数据代入相关系数公式,可求得r,即可得出结论;
(2)求出y的值,将表格中的数据代入最小二乘法公式,求出b、a的值,可得出回归直线方程;
(3)将t=8代入回归方程方程,求出该市某家庭教育支出的比例,即可得解.
【详解】(1)t=171+2+3+4+5+6+7=4,
i=17ti−t2=1−42+2−42+3−42+4−42+5−42+6−42+7−42=28,
所以r=i=17ti−tyi−yi=17ti−t2i=17yi−y2=13927×107≈0.99,
故两个变量有很强的线性相关性.
(2)y=1721+26+34+38+43+46+51=37,
∴b=i=17ti−tyi−yi=17ti−t2=13928≈4.96,a=y−bt=37−4.96×4≈17.16,
所以,回归直线方程为y=4.96t+17.16.
(3)当t=8时,y=4.96×8+17.16=56.84,
故家庭教育支出为10×56.84%=5.684万元.
6.(2023春·四川凉山·高二校考阶段练习)2020年1月底因新型冠状病毒感染的肺炎疫情形势严峻,避免外出是减少相互交叉感染最有效的方式.在家中适当锻炼,合理休息,能够提高自身免疫力,抵抗该种病毒.某小区为了调查“宅”家居民的运动情况,从该小区随机抽取了100位成年人,记录他们某天的锻炼时间,其频率分布直方图如图.
(1)求a的值,并估计这100位居民锻炼时间的平均值x(同一组中的数据用该组区间的中点值代表);
(2)小张是该小区的一位居民,他记录了自己“宅”家7天的锻炼时长,如表:
①根据数据求m关于n的线性回归方程;
②若m−x≥4[x是(1)中的平均值],则当天被称为“有效运动日”,估计小张“宅”家第8天是否是“有效运动日”?
附:在线性回归方程y=bx+a中,b=i=1nxi−xyi−yi=1nxi−x2,a=y−bx.
【答案】(1)a=0.03,x=30.2(分钟)
(2)①m=11328n+347②第8天是“有效运动日”
【分析】(1)根据频率之和等于1求出a,再根据在频率分布直方图中平均数的计算公式计算即可;
(2)①先利用最小二乘法求出b,a,即可求得回归方程;
②把n=8代入求出m,判断m−x≥4是否成立即可得出结论.
【详解】(1)(0.005+0.012+a+0.035+0.015+0.003)×10=1,∴a=0.03,
x=5×0.005×10+15×0.012×10+25×0.03×10
+35×0.035×10+45×0.015×10+55×0.003×10=30.2(分钟);
(2)①∵n=1+2+3+4+5+6+77=4,
m=10+15+12+20+30+25+357=21,
i=17ni−nmi−m=(1−4)×(10−21)+(2−4)×(15−21)+(3−4)×(12−21)
+(4−4)×(20−21)+(5−4)×(30−21)+(6−4)×(25−21)+(7−4)×(35−21)=113,
i=1nni−n2=1−42+2−42+3−42+4−42+5−42+6−42+7−42=28,
∴b=11328,a=21−11328×4=347,
∴m关于n的线性回归方程为m=11328n+347;
②当n=8时,m=11328×8+347=2607,
∵2607−30.2>4,
∴估计小张“宅”家第8天是“有效运动日”.
7.(2023·湖南岳阳·统考二模)国家发改委和住建部等六部门发布通知,提到:2025年,农村生活垃圾无害化处理水平将明显提升.现阶段我国生活垃圾有填埋、焚烧、堆肥等三种处理方式,随着我国生态文明建设的不断深入,焚烧处理已逐渐成为主要方式.根据国家统计局公布的数据,对2013-2020年全国生活垃圾焚烧无害化处理厂的个数y(单位:座)进行统计,得到如下表格:
(1)根据表格中的数据,可用一元线性回归模型刻画变量y与变量x之间的线性相关关系,请用相关系数加以说明(精确到0.01);
(2)求出y关于x的经验回归方程,并预测2022年全国生活垃圾焚烧无害化处理厂的个数;
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,还能用(2)所求的经验回归方程预测吗?请简要说明理由.
参考公式:相关系数r=i=1nxi−xyi−yi=1nxi−x2i=1nyi−y2,回归方程y=bx+a中斜率和截距的最小二乘法估计公式分别为b=i=1nxi−xyi−yi=1nxi−x2,a=y−bx
参考数据:i=18yi=2292,i=18xi2=204,i=18yi2=730348,i=18xiyi=12041,5732=328329,105≈10.25,7369≈85.84
【答案】(1)答案见解析
(2)y=41.12x+101.46,513
(3)答案见解析
【分析】(1)根据相关系数的公式,即可代入求值,根据相关系数的大小即可作出判断,
(2)利用最小二乘法即可计算求解,
(3)根据相关关系不是确定的函数关系,而受多因素影响,即可求解.
【详解】(1)x=1+2+3+4+5+6+7+88=92,y=22928=5732
相关系数r=i=1nxi−xyi−yi=1nxi−x2i=1nyi−y2=i=18xiyi−8x⋅yi=18xi2−8x2i=18yi2−8y2
=12041−8×92×5732204−8×814730348−8×3283294=172742×73690≈172720.5×85.84≈0.98
因为y与x的相关系数r=0.98,接近1,所以y与x的线性相关程度很高,可用线性回归模型拟合y与x的关系.
(2)b=i=1nxi−xyi−yi=1nxi−x2=i=18xiyi−8x⋅yi=18xi2−8x2
=12041−8×92×5732204−8×814=172742≈41.12
a=y−bx≈5732−41.12×92=101.46
所以y与x的线性回归方程为y=41.12x+101.46
又2022年对应的年份代码x=10,当x=10时,y^=41.12×10+101.46=512.66≈513,
所以预测2022年全国生活垃圾焚烧无害化处理厂的个数为513.
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,不能由(2)所求的线性回归方程预测,理由如下(说出一点即可):
①线性回归方程具有时效性,不能预测较远情况;
②全国生活垃圾焚烧无害化处理厂的个数有可能达到上限,一段时间内不再新建;
③受国家政策的影响,可能产生新的生活垃圾无害化处理方式.
8.(2023春·山东德州·高二德州市第一中学校考阶段练习)某公司为了预测下月产品销售情况,找出了近7个月的产品销售量y单位:万件的统计表:
但其中数据污损不清,经查证i=17yi=9.32,i=17tiyi=40.17,i=17yi−y2=0.55.
(1)请用样本相关系数说明销售量y与月份代码t有很强的线性相关关系;
(2)求y关于t的回归方程(系数精确到0.001);
(3)公司经营期间的广告宣传费xi=ti(单位:万元)i=1,2,⋯,7(单位:万元),每件产品的销售价为10元,预测第8个月的毛利润能否突破15万元,请说明理由.(毛利润等于销售金额减去广告宣传费)
参考公式:b=i=1nxi−xyi−yl=1nxi−x2,a=y−bx,r=i=1nxi−xyi−yi=1nxi−xi2⋅i=1nyi−y2
【答案】(1)答案见解析
(2)y=0.10t+0.9.2
(3)不能,理由见解析
【分析】(1)根据题目所给数据及参考公式计算相关系数,得出结论;
(2)根据参考公式求出b,a即可得出回归方程;
(3)利用回归方程预测8月份销售量,再计算毛利润,即可得解.
【详解】(1)由表中的数据得t=4,i=17ti−ti2=28.i=17yi−y2=0.55,
i=17ti−tyi−y=i=17tiyi−ti=17yi=40.17−4×9.32=2.89,
∴r=2.8927×0.55≈2.892×2.646×0.55≈0.99
∵0.99>0.75 ∴销售量y与月份代码t有很强的线性相关关系.
(2)由y=9.327≈1.331及(1)得b=i=17ti−tyi−yl=17ti−t2=2.8928≈0.103
则a=y−bt≈1.331−0.103×4≈0.92,
故y关于t的回归方程为y=0.10t+0.9.2
(3)当t=8时,代入回归方程得y=0.10×8+0.92=1.72(万件),
第8个月的毛利润为z=10×1.72−8≈172−2×1.414=14.372,
由14.372<15,可预测第8个月的毛利润不能突破15万元.回归
直线
从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线
回归
方程
回归方程为eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),其中eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n,x)iyi-n\(x,\s\up6(-)) \(y,\s\up6(-)),\i\su(i=1,n,x)\\al(2,i)-n\(x,\s\up6(-))2), eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-))
相关
系数
当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性
相关指数
误差平方和
均方根值
0.949
5.491
0.499
相关指数
误差平方和
均方根值
0.933
4.179
0.436
相关指数
误差平方和
均方根值
0.997
1.701
0.141
相关指数
误差平方和
均方根值
0.997
2.899
0.326
ti
1
2
3
4
5
yi
2.4
2.7
4.1
6.4
7.9
产量x/件
1
2
3
4
5
生产总成本y/万元
3
7
8
10
12
A区
B区
C区
D区
外来务工人数x/万
3
4
5
6
就地过年人数y/万
2.5
3
4
4.5
x
2
3
4
5
6
y
2.0
3.5
6.0
6.5
7.0
月份x
3
4
5
6
7
旅游收入y
10
12
11
12
20
第一次
第二次
第三次
第四次
第五次
参会人数x/万人
13
9
8
10
12
原材料y/袋
32
23
18
24
28
商店名称
A
B
C
D
E
销售额x/千万元
3
5
6
7
9
利润额y/百万元
2
3
3
4
5
年份代码x
1
2
3
4
5
市场规模y
0.9
1.2
1.5
1.4
1.6
用户一个月月租减免的费用x(元)
3
4
5
6
7
用户数量y(万人)
1
1.1
1.5
1.9
2.2
x(kg)
16
20
24
29
36
Y(kg)
340
350
362
404
454
树苗序号
1
2
3
4
5
6
7
8
高度偏差x
20
15
13
3
2
−5
−10
−18
直径偏差y
6.5
3.5
3.5
1.5
0.5
−0.5
−2.5
−3.5
月份x
第一个月
第二个月
第三个月
第四个月
第五个月
会员人数y
9
12
17
21
27
xi
72
90
96
102
108
117
120
132
138
147
yi
39
49
53
59
61
69
69
79
80
90
i=110xi
i=110yi
i=110xiyi
i=110xi2
i=110yi2
3257.44845.6
10687455.36
1122
648
75963
130734
44196
0.672
3269.16738
0.9964
年份t
1
2
3
4
5
6
7
教育支出占家庭支出比例y(百分比)
21
26
34
38
43
46
51
序号n
1
2
3
4
5
6
7
锻炼时长m(单位:分钟)
10
15
12
20
30
25
35
年份
2013
2014
2015
2016
2017
2018
2019
2020
年份代码x
1
2
3
4
5
6
7
8
垃圾焚烧无害化
处理厂的个数 y
166
188
220
249
286
331
389
463
月份代码t
1
2
3
4
5
6
7
销售量y(万件)
y1
y2
y3
y4
y5
y6
y7
专题7.2 非线性回归问题(3类必考点)-2023-2024学年高二数学必考考点各个击破(北师大版选择性必修第一册): 这是一份专题7.2 非线性回归问题(3类必考点)-2023-2024学年高二数学必考考点各个击破(北师大版选择性必修第一册),文件包含专题72非线性回归问题3类必考点北师大版选择性必修第一册原卷版docx、专题72非线性回归问题3类必考点北师大版选择性必修第一册解析版docx等2份试卷配套教学资源,其中试卷共51页, 欢迎下载使用。
专题6.5 正态分布(3类必考点)-2023-2024学年高二数学必考考点各个击破(北师大版选择性必修第一册): 这是一份专题6.5 正态分布(3类必考点)-2023-2024学年高二数学必考考点各个击破(北师大版选择性必修第一册),文件包含专题65正态分布3类必考点北师大版选择性必修第一册原卷版docx、专题65正态分布3类必考点北师大版选择性必修第一册解析版docx等2份试卷配套教学资源,其中试卷共31页, 欢迎下载使用。
专题5.3 组合问题(4类必考点)-2023-2024学年高二数学必考考点各个击破(北师大版选择性必修第一册): 这是一份专题5.3 组合问题(4类必考点)-2023-2024学年高二数学必考考点各个击破(北师大版选择性必修第一册),文件包含专题53组合问题4类必考点北师大版选择性必修第一册原卷版docx、专题53组合问题4类必考点北师大版选择性必修第一册解析版docx等2份试卷配套教学资源,其中试卷共27页, 欢迎下载使用。