高中数学9.1线性回归分析课堂检测
展开9.1线性回归分析苏教版( 2019)高中数学选择性必修第二册
第I卷(选择题)
一、单选题(本大题共8小题,共40.0分。在每小题列出的选项中,选出符合题目的一项)
1. 下列有关一元线性回归分析的命题正确的是( )
A. 在经验回归方程y=2−0.5x中,若解释变量x增加1个单位,则预测值y平均减少0.5个单位
B. 经验回归直线是经过散点图中样本数据点最多的那条直线
C. 若两个变量的线性相关程度越强,则样本相关系数r就越接近于1
D. 若甲、乙两个模型的决定系数R2分别为0.87和0.78,则模型乙的拟合效果更好
2. 相关变量x,y的散点图如图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程y=b1x+a1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归直线方程:y=b2x+a2,相关系数为r2.则( )
A. 0
A. r1=r2 B. r1
4. 样本数据1的所有点(xi,yi)在散点图中都在直线y=−2x+3上,其相关系数为r1,样本数据2的所有点(mi,ni)在散点图中都在直线y=2x−3上,其相关系数为r2,则r1与r2的关系是( )
A. r2<0
价格x
9
9.5
10
10.5
11
销售y
11
10
8
6
5
y与x的回归直线方程是:y=−3.2x+a,相关系数|r|=0.986,下列说法错误的是( )
A. a=40 B. 变量x,y线性负相关且相关性较强
C. 相应于点(9.5,10)的残差约为−0.4 D. 当x=8时,y的估计值为14.4
6. 某网店经销某商品,为了解该商品的月销量y(单位:千件)与售价x(单位:元/件)之间的关系,收集5组数据进行了初步处理,得到如下数表:
x
5
6
7
8
9
y
8
6
4.5
3.5
3
根据表中的数据可得回归直线方程y=−1.25x+13.75,以下说法正确的是( )
A. x,y具有负相关关系,相关系数r=−1.25
B. x每增加一个单位,y平均减少13.75个单位
C. 第二个样本点对应的残差e2=0.25
D. 第三个样本点对应的残差e3=−0.5
7. 已知下列命题:①回归直线y=bx+a恒过样本点的中心(x,y),且至少过一个样本点;
②两个变量相关性越强,则相关系数r就越接近于1;
③将一组数据的每个数据都加一个相同的常数后,方差不变;
④在回归直线方程y=2-0.5x中,当解释变量x增加一个单位时,预报变量y平均减少0.5;
⑤在线性回归模型中,相关指数R2表示解释变量x对于预报变量y的贡献率,R2越接近于1,表示回归效果越好;
⑥对分类变量X与Y,它们的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大.
⑦两个模型中残差平方和越小的模型拟合的效果越好.
则正确命题的个数是( )
A. 3 B. 4 C. 5 D. 6
8. 已知变量y关于x的非线性经验回归方程为y=ebx−0.5,其一组数据如下表所示:
x
1
2
3
4
y
e
e3
e4
e5
若x=5,则预测y的值可能为( )
A. e152 B. e112 C. e7 D. e5
二、多选题(本大题共4小题,共20.0分。在每小题有多项符合题目要求)
9. 下列结论正确的有( )
A. 若随机变量ξ,η满足η=2ξ+1,则D(η)=2D(ξ)+1
B. 在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好
C. 若样本数据(xi,yi)(i=1,2,3,⋯,n)线性相关,则用最小二乘估计得到的经验回归直线经过该组数据的中心点(x,y)
D. 样本相关系数r越大,两个变量的线性相关性越强;反之,线性相关性越弱
10. 某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从2012年到2020年共9年“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额y看成年份序号x(2012年作为第1年)的函数.运用Excel软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如下图,则下列说法中正确的为( )
注:其中R2=1−i=1nyi−yi2i=1nyi−y2,R2越接近于1,表示回归的效果越好.
A. 销售额y与年份序号x呈正相关关系
B. 销售额y与年份序号x线性相关不显著
C. 三次函数回归曲线的拟合效果好于回归直线的拟合效果
D. 根据三次函数回归曲线可以预测2021年“年货节”期间的销售额约为8454亿元
11. 下列说法中正确的是( )
A. 对于独立性检验,X2的值越大,说明两事件的相关程度越大
B. 以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=lny,将其变换后得到线性方程z=0.3x+4,则c,k的值分别是e4和0.3
C. 在具有线性相关关系的两个变量的统计数据所得的回归直线方程y=a+bx中,b=2,x=1,y=3,则a=1
D. 通过回归直线y=bx+a及回归系数b,可以精确反映变量的取值和变化趋势
12. 为了研究某种病毒在特定环境下随时间变化的繁殖情况,得到了一些数据,绘制成散点图,发现用模型y=cekx拟合比较合适.令z=lny,得到z=1.3x+a,经计算发现x, z满足下表:
天数x(天)
2
3
4
5
6
z
1.5
4.5
5.5
6.5
7
则( )
A. c=e−0.2 B. k=1.3 C. c=e0.2 D. k=−1.3
第II卷(非选择题)
三、填空题(本大题共4小题,共20.0分)
13. (1)已知复数z=2+i,则z1+i在复平面上对应的点坐标为______.
(2)已知随机变量X+η=8,若X~B(10,0.6),则E(η) = ________,D(η)=_____.
(3)已知下列命题:
①在线性回归模型中,相关指数R2表示解释变量x对于预报变量y的贡献率,R2越接近于1,表示回归效果越好;
②两个变量相关性越强,则相关系数的绝对值就越接近于1;
③在回归直线方程∧ =−0.5x+2中,当解释变量x每增加一个单位时,预报变量∧ 平均减少0.5个单位;
④对分类变量X与Y,它们的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大.
其中正确命题的序号是__________.
(4)如图为我国数学家赵爽(约3世纪初)在为《周髀算经》作注时验证勾股定理的示意图,现在提供5种颜色给其中5个小区域涂色,规定每个区域只涂一种颜色,相邻区域颜色不相同,则不同的涂色方案种数为_______.
14. 下列说法:
①线性回归方程y=bx+a必过x,y;
②命题“∀x≥1,x2+3≥4”的否定是“∃x<1,x2+3<4”
③相关系数r越小,表明两个变量相关性越弱;
④在一个2×2列联表中,由计算得K2=8.079,则有99%的把握认为这两个变量间有关系;
其中正确的说法是__________.(把你认为正确的结论都写在横线上)
本题可参考独立性检验临界值表:
15. 用指数模型y=c·ekx去拟合一组数据时,为了求出回归方程,设z=lny,变换后得到线性回归直线方程z=0.3x+4,则常数c的值为_________.
16. 在研究两个变量的线性相关关系时,观察散点图发现样本点集中于某一条指数曲线y=ebx+a的周围,令z=lny,求得回归直线方程z∧=0.25x-2.58,则该模型的回归方程为
四、解答题(本大题共6小题,共72.0分。解答应写出文字说明,证明过程或演算步骤)
17. (本小题12.0分)
某公司为一所山区小学安装了价值2万元的一台饮用水净化设备,每年都要为这台设备支出保养维修费用,我们称之为设备年度保养维修费.下表是该公司第x年为这台设备支出的年度保养维修费y(单位:千元)的部分数据:
x
2
3
4
5
6
y
2.1
3.4
5.9
6.6
7.0
画出散点图如下:
通过计算得y与x的相关系数r≈0.96.由散点图和相关系数r的值可知,y与x的线性相关程度很高.
(1)建立y关于x的线性回归方程y=bx+a;
(2)若设备年度保养维修费不超过1.93万元就称该设备当年状态正常,根据(1)得到的线性回归方程,估计这台设备有多少年状态正常?
附:b=i=1nxi−xyi−yi=1nxi−x2,a=y−bx.
18. (本小题12.0分)
20个工业企业某年的平均固定资产价值与总产值(单位:百万元)如表所示.
企业编号
年平均固定资产价值
年总产值
企业编号
年平均固定资产价值
年总产值
1
36
32.0
11
50
45.5
2
43
40.2
12
70
65.0
3
50
47.5
13
62
56.0
4
40
41.5
14
58
55.0
5
55
51.0
15
58
55.0
6
58
53.4
16
63
57.0
7
38
33.8
17
64
54.2
8
45
42.8
18
53
56.5
9
47
45.6
19
54
50.2
10
42
40.8
20
56
49.2
设年平均固定资产价值为x,年总产值为y,单位均为百万元.试画出散点图,计算相关系数.
19. (本小题12.0分)
科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了一些年龄和脂肪含量的简单随机样本数据,如下表:
x(年龄/岁)
26
27
39
41
49
53
56
58
60
61
y(脂肪含量/%)
14.5
17.8
21.2
25.9
26.3
29.6
31.4
33.5
35.2
34.6
根据上表的数据得到如下的散点图.
根据上表中的样本数据及其散点图:
(1)求x;
(2)计算样本相关系数(精确到0.01),并刻画它们的相关程度.
参考数据y=27,i=110xiyi=13527.8,i=110xi2=23638,i=110yi2=7759.6,43≈6.56,2935≈54.18
参考公式:相关系数r=i=1n(xi−x)(yi−y)i=1n(xi−x)2i=1n(yi−y)2=i=1nxiyi−nx·yi=1nxi2−nx2i=1nyi2−ny2
20. (本小题12.0分)
一个工厂在某年连续10个月每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组数据:
x
1.08
1.12
1.19
1.28
1.36
1.48
1.59
1.68
1.80
1.87
y
2.25
2.37
2.40
2.55
2.64
2.75
2.92
3.03
3.14
3.26
(1)通过画散点图,发现可用线性回归模型拟合y与x的关系,请用相关系数加以说明;
(2)①建立月总成本y与月产量x之间的回归方程;
②通过建立的y关于x的回归方程,估计某月产量为1.98万件时,此时产品的总成本为多少万元?(均精确到0.001)
附注:①参考数据:i=110xi=14.45, i=110yi=27.31,i=110xi2−10x2=0.850, i=110yi2−10y2=1.042,b=1.222,
②参考公式:相关系数r=i=1nxiyi−nx⋅yi=1nxi2−nx2i=1nyi2−ny2,回归方程y=a+bx中斜率和截距的最小二乘估计公式分别为:b=i=1nxiyi−nx⋅yi=1nxi2−nx2, a=y−bx.
21. (本小题12.0分)
家族中兄弟或姐妹的智商是否有相关性一直是教育工作者、社会学家、生理学家关注的一个问题,日本学者在1989年曾对45对兄弟的智商进行测试,得出下表的结果,其中,X表示“哥哥的智商分数”,Y表示“弟弟的智商分数”.
X
78
77
112
114
104
99
92
80
113
Y
114
68
116
123
107
81
76
90
91
X
99
97
80
84
89
100
111
75
94
Y
95
106
99
82
77
81
111
80
98
X
67
46
106
99
102
127
113
91
91
Y
82
56
117
98
89
113
112
103
93
X
96
100
97
82
43
77
109
99
99
Y
90
102
104
92
43
100
90
100
103
X
100
56
56
67
71
66
78
95
38
Y
103
67
67
67
66
63
76
86
64
(1)请画出散点图,并求Y与X间的样本相关系数;
(2)建立Y关于X的线性回归方程,并预测当X为110时Y的值.
22. (本小题12.0分)
某企业为了提升行业竞争力,加大了科技研发资金投入.该企业连续6年来的科技投入x(百万元)与收益y(百万元)的数据统计如下:
科技投入x
2
4
6
8
10
12
收益y
5.6
6.5
12.0
27.5
80.0
129.2
并根据数据绘制散点图如图所示:
根据散点图的特点,甲认为样本点分布在指数曲线y=c·2bx的周围,据此他对数据进行了一些初步处理.如下表:
y
z
i=16(xi−x)(yi−y)
i=16(xi−x)(zi−z)
i=16(yi−y)2
i=16(xi−x)2
43.5
4.5
854.0
34.7
12730.4
70.0
其中zi=log2yi,z=16i=16zi.
(1)①请根据表中数据,建立y关于x的回归方程(保留一位小数);
②根据所建立的回归方程,若该企业想在下一年收益达到2亿元,则科技投入的费用至少要多少?(其中log25≈2.3)
(2)乙认为样本点分布在二次曲线y=mx2+n的周围,并计算得回归方程为y=0.92x2−12.0,以及该回归模型的相关指数R2=0.94,试比较甲乙两人所建立的模型,谁的拟合效果更好.
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线方程v=α+βu的斜率和截距的最小二乘估计分别为β=i=1n(ui−u)(vi−v)i=1n(ui−u)2,α=v−βu,相关指数:R2=1−i=1n(vi−vi)2i=1n(vi−v)2.
答案和解析
1.【答案】A
【解析】
【分析】
本题考查统计初步知识的应用问题,主要是线性回归直线的特征和决定系数、相关指数和模型拟合的效果,属于中档题.
根据“线性回归方程 y=2−0.5x即可判断A;根据回归直线的几何意义判断B;由相关系数r与变量的相关性的关系,可判断C;由模型的R 2与效果的关系,可判断D.
【解答】
解:对于A,回归直线方程 y=2−0.5x中,当解释变量 x增加1个单位时,预报变量 y平均减少0.5个单位,正确;
对于B,回归直线就是散点图中经过样本数据点最多的那条直线,不正确,回归直线也可能不过任何一个点;
对于C,如果两个变量的相关性越强,则相关系数r就越接近于1,不正确,应为相关系数r的绝对值就越接近于1;
对于D,甲、乙两个模型的R 2分别约为0.87和0.78,则模型乙的拟合效果更好,不正确,应为模型甲的拟合效果更好.
故选A.
2.【答案】D
【解析】
【分析】
本题考查了利用散点图判断两个变量的相关关系,线性回归直线方程,相关系数,是基础题.
由散点图可知,线性负相关,故r1<0,r2<0,点(10,21)较偏离整体,剔除后,相关性更强,由此得出结论.
【解答】
解:由图可知变量x,y负相关,
所以r1<0,r2<0,
剔除点(10,21)后,剩下的点的数据更具有线性相关性,r2更接近−1,
所以−1
3.【答案】C
【解析】
【分析】
本题考查了散点图与相关系数的应用问题,是基础题.
根据A、B两组样本数据的散点图分布特征,即可得出r1、r2的大小关系.
【解答】
解:根据A、B两组样本数据的散点图知,
A组样本数据几乎在一条直线上,且成正相关,
∴相关系数为r1应最接近1,
B组数据分散在一条直线附近,也成正相关,
∴相关系数为r2满足r2
故选:C.
4.【答案】B
【解析】
【分析】
本题考查散点图及相关系数的概念、性质,是基础题.
根据相关系数的概念进行判断.
【解答】
解:因为样本数据1的所有点(xi,yi)在散点图中都在直线y=−2x+3上,所以r1=−1,
样本数据2的所有点(mi,ni)在散点图中都在直线y=2x−3上,所以r2=1,
则r2=−r1=1,
故选B.
5.【答案】C
【解析】
【分析】
本题主要考查线性回归方程的性质,以及残差公式,属于中档题.
根据相关系数判断A选项;利用样本中心点判断B选项;将x=8.5代入回归直线方程,由此判断C选项;求得x=10.5时y的估计值,进而求得对应的残差,从而判断D选项.
【解答】
解:对A,价格平均x=159+9.5+10+10.5+11=10,销售量y=1511+10+8+6+5=8.
故回归直线恒过定点10,8,故8=−3.2×10+a⇒a=40,故A正确.
对B,由表可知y随x增大而减少,可认为变量x,y线性负相关,且由相关系数r=0.986可知相关性强,故B正确.
对C,相应于点9.5,10的残差10−(−3.2×9.5+40)=0.4,故C不正确.
对D,当x=8时,y=−3.2×8+40=14.4,故D正确.
故选C.
6.【答案】D
【解析】
【分析】
本题考查回归直线方程,是基础题.
x的系数为−1.25,y与x具有负相关关系;相关系数的范围属于[−1,1];由相关关系的特点可知,把x=6,7代入回归方程所得的y值,不是准确值,而是一个估计值,综合可得答案.
【解答】
解:由y=−1.25x+13.75,x的系数为−1.25,y与x具有负相关关系,相关系数r∈−1,1,故A错误;
x每增加一个单位,y平均减少1.25个单位,故B错误;
当x=6时,y=−1.25×6+13.75=6.25,第二个样本点对应的残差e2=6−6.25=−0.25,故C错误;
当x=7时,y=−1.25×7+13.75=5,第三个样本点对应的残差e3=4.5−5=−0.5,故D正确;
故选D.
7.【答案】B
【解析】
【分析】
本题考查命题的真假判断,主要是线性回归直线的特点,线性相关性的强弱和模型的拟合度,考查判断能力,属于基础题.
逐一判断即可.
【解答】
解:对于①,回归直线y∧=b∧x+a∧恒过样本点的中心(x,y),可以不过任一个样本点,故①错误;
对于②,两个变量相关性越强,则相关系数r的绝对值就越接近于1,故②错误;
对于③,将一组数据的每个数据都加一个相同的常数后,由方差的性质可得方差不变,故③正确;
对于④,在回归直线方程y∧=2−0.5x中,当解释变量x每增加一个单位时,
预报变量y∧平均减少0.5个单位,故④正确;
对于⑤,在线性回归模型中,相关指数R2表示解释变量x对于预报变量y的贡献率,R2越接近于1,表示回归效果越好,故⑤正确;
对于⑥,对分类变量X与Y,它们的随机变量K2的观测值k来说,k越大,“X与Y有关系”的把握程度越大,故⑥错误;
对于⑦,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故⑦正确.其中正确个数为4.
故选B.
8.【答案】C
【解析】
【分析】
本题考查可线性化的回归方程,考查推理能力和计算能力,属于一般题.
将y=ebx−0.5两边同时取对数,得lny=bx−0.5,设z=bx−0.5,由样本中心x,z必在回归直线z=bx−0.5上,可求出b,从而即可求解.
【解答】
解:由题意,将y=ebx−0.5两边同时取对数,得lny=bx−0.5,
设z=bx−0.5,则
x
1
2
3
4
z
1
3
4
5
x=1+2+3+44=2.5,z=1+3+4+54=3.25,
由z=bx−0.5,得3.25=2.5b−0.5,解得b=1.5,
所以y=e1.5x−0.5,
所以当x=5时,y=e1.5×5−0.5=e7,
故选:C.
9.【答案】BC
【解析】
【分析】
本题考查随机变量的方差的性质,残差、散点图与模型的拟合效果,最小二乘法,相关系数,属于中档题.
依据方差的性质判定A;根据残差的定义,残差分布的水平带状区域的宽度越窄,预测值与实际值越接近,其模型的拟合效果越好,判定B;回归直线经过该组数据的中心点(x,y),判定C;线性相关系数|r|越大,两个变量的线性相关性越强;反之,线性相关性越弱,判定D.
【解答】
解:对于A,依据方差的性质判定,若随机变量ξ,η满足η=2ξ+1,D(η)=4D(ξ),故A错误;
对于B,根据残差的定义可知,在残差的散点图中,残差分布的水平带状区域的宽度越窄,预测值与实际值越接近,其模型的拟合效果越好,故B正确;
对于C,用最小二乘估计得到的经验回归直线经过该组数据的中心点(x,y),故C正确;
对于D,统计中用相关系数r来衡量两个变量之间的线性关系的强弱.线性相关系数|r|越大,两个变量的线性相关性越强;反之,线性相关性越弱,故D错误.
10.【答案】AC
【解析】
【分析】
本题考查了散点图、相关系数及线性回归方程的应用,属于中档题.
根据散点图可得销售额y与年份序号x呈正相关关系,再根据决定系数的定义判断B、C,根据三次函数回归曲线,代入x=10,即可预测2021年“年货节”期间的销售额,从而判断D;
【解答】
解:由题图可知,散点从左下到右上分布,所以销售额y与年份序号x呈正相关关系,A正确;
∵R2=0.936接近于1,∴销售额y与年份序号x线性相关显著,故B错误;
∵0.999>0.936,∴三次函数回归曲线的拟合效果好于回归直线的拟合效果,C正确;
由三次函数y=0.168x3+28.141x2−29.027x+6.889知,当x=10时,y=2698.719,故D错误.
故选AC.
11.【答案】ABC
【解析】
【分析】
本题考查了回归分析、独立性检验就等知识,解题时抓住相关概念即可,为中档题.
根据,回归分析,以及独立性检验等知识,对选项进行逐一分析即可.
【解析】
解:对于A,根据独立性检验的性质知,χ2的值越大,说明两个分类变量相关程度越大,A正确;
对于B,由y=cekx,两边取自然对数,可得lny=lnc+kx,
令z=lny,得z=kx+lnc,∵z=0.3x+4,
∴lnc=4,k=0.3,则c=e4,k=0.3,B正确;
对于C,回归直线方程y=a+bx中,
a=y−b·x=3−2×1=1,C正确;
对于D,通过回归直线y=a+bx及回归系数b,可估计和预测变量的取值和变化趋势,D错误.
故选ABC.
12.【答案】AB
【解析】
【分析】
本题考查非线性回归分析,线性回归方程,考查散点图,考查学生分析解决问题的能力,属于中档题.
根据题意得到z=1.3x+a的中心点为(4,5),进而得到k=1.3,lnc=a=−0.2即可.
【解答】
解:因为x=2+3+4+5+65=4,
z=1.5+4.5+5.5+6.5+75=5,
所以z=1.3x+a的中心点为(4,5),
代入z=1.3x+a,可得a=5−1.3×4=−0.2.
由z=ln y,y=cekx,
则z=lncekx=kx+lnc,
所以k=1.3,lnc=a=−0.2,即c=e−0.2.
故选AB.
13.【答案】(1)12,−32
(2)2;2.4
(3)①②③
(4)420
【解析】
(1)【分析】
本题考查复数运算以及几何意义,属于基础题.先将z1+i化简计算,再写出它复平面上对应的点坐标即可.
【解答】
解:复数z=2+i,则z=2−i,则z1+i=2−i1+i=1−i2−i2=2−i−2i−12=1−3i2=12−32i,所以z1+i在复平面上对应的点坐标为12,−32.
故答案为12,−32.
(2)【分析】
本题考查二项分布的均值与方差的求解,难度一般.
【解答】
解:因为随机变量X+η=8,若X~B(10,0.6),则EX=8×0.6=6,则E(η) =8−6=2,因为DX=10×0.6×0.4=2.4,所以D(η)=2.4.
故答案为2;2.4.
(3)【分析】
本题考查线性回归分析以及独立性检验的应用,难度一般.根据相关知识逐项分析判断即可.
【解答】
解:由线性回归分析知:①在线性回归模型中,相关指数R2表示解释变量x对于预报变量y的贡献率,R2越接近于1,表示回归效果越好,正确;
②两个变量相关性越强,则相关系数的绝对值就越接近于1,正确;
③在回归直线方程∧ =−0.5x+2中,当解释变量x每增加一个单位时,预报变量∧ 平均减少0.5个单位,正确;
④对分类变量X与Y,它们的随机变量K2的观测值k来说,k越小,“X与Y有关系”的把握程度越大,错误,k越小,“X与Y有关系”的把握程度越小.
故答案为①②③.
(4)【分析】
本题考查排列组合的应用,难度一般.分类讨论:①当1,2,3号区间共用2种颜色;
②当1,2,3共用3种颜色时,分别求出其方法种数,相加即可求解.
【解答】
解:将区域标注数字序号如下图:
当1,2,3号区间共用2种颜色,即1,3同色且与2异色时
共有涂色方法:A52C31C31=180种
当1,2,3共用3种颜色时,共有涂色方法:A53C21C21=240种
则不同的涂色方案总数为:180+240=420种.
故答案为420.
14.【答案】①④
【解析】
【分析】
本题以命题真假的判断为载体,着重考查了相关系数、命题的否定、独立性检验、回归直线方程等知识点,属于中档题.
根据性回归方程,独立性检验,相关关系,以及命题的否定等知识,选出正确的,得到结果.
【解答】
解:①线性回归方程y=bx+a必过样本中心点x,y,故①正确.
②命题“∀x⩾1,x2+3⩾4”的否定是“∃x⩾1,x2+3<4”故②错误
③相关系数r绝对值越小,表明两个变量相关性越弱,故③不正确;
④在一个2×2列联表中,由计算得K2=8.079>6.635,则有99%的把握认为这两个变量间有关系,故④正确.
故答案为①④.
15.【答案】e4
【解析】
【分析】
本题考查了线性回归方程,对数的运算性质,是中档题.
由y=c·ekx两边取对数,可得lny=lnc+kx,则z=lnc+kx,结合题意可得lnc=4,求出c的值.
【解答】
解:由y=cekx两边取对数,可得lny=ln(cekx)=lnc+lnekx=lnc+kx,
由z=lny,可得z=lnc+kx.
∵z=0.3x+4,∴lnc=4,∴c=e4.
故答案为e4.
16.【答案】y=e0.25x−2.58
【解析】
【分析】
本题考查了非线性回归分析,线性回归方程的应用问题,熟练掌握对数的运算性质,是解题的关键.
根据对数的运算性质,结合题意,求出k、a的值即可.
【解答】
解:∵y=ekx+a,
∴两边取对数,可得lny=ln(ekx+a)=(kx+a)lne=kx+a,
令z=lny,可得z=kx+a,
∵z=0.25x−2.58,
∴k=0.25,a=−2.58,
∴y=e0.25x−2.58.
故答案为y=e0.25x−2.58.
17.【答案】解:(1)x=15×2+3+4+5+6=4,
y=15×2.1+3.4+5.9+6.6+7=5.
b=i=15xi−xyi−yi=15xi−x2=1310=1.3.
∴a=y−bx=5−1.3×4=−0.2
∴线性回归方程为y=1.3x−0.2.
(2)设这台设备有x年状态正常,由已知得y≤19.3,即1.3x−0.2≤19.3.
解1.3x−0.2≤19.3得x≤15.
∴估计该设备有15年状态正常.
【解析】本题考查散点图以及线性回归方程,属中档题,
(1)根据表格信息求得x,y,即可得到b=i=15(xi−x)(yi−y)i=15(xi−x)2,a=y−bx,即可求解,
(2)设这台设备有x年状态正常,由(1)线性回归方程为y=1.3x−0.2,所以y≤19.3,求解即可,
18.【答案】解:散点图如图所示.
由表中数据可得
i=120xi=1036,i=120yi=972.2,i=120xiyi=51752.3,
i=120xi2=55314,i=120yi2=48590.2.
根据r=ni=1nxiyi−(i=1nxi)(i=1nyi)[ni=1nxi2−(i=1n(xi)2][ni=1nyi2−(i=1nyi)2],
可得相关系数为r≈0.9396.
【解析】本题考查散点图,计算相关系数的求解,属于中档题.
作出散点图,并根据公式求出相关系数r即可.
19.【答案】解:根据上表中的样本数据及其散点图得
(1)x=26+27+39+41+49+53+56+58+60+6110=47,
(2)r=i=1nxiyi−nxyi=1nxi2−nx2i=1nyi2−ny2
=13527.8−10×47×2723638−10×472·7759.6−10×272
=13527.8−1269023638−22090·7759.6−7290
=837.81548×469.6
=8378643×42935.
因为43≈6.56,2935≈54.18,所以r≈0.98.
由样本相关系数r≈0.98,可以推断人体脂肪含量和年龄的相关程度很强.
【解析】本题考查利用样本的相关系数判断相关性强弱,涉及平均数,属中档题.
(1)利用所给表格数据计算平均数即可;
(2)利用所给参考数据计算相关系数r,进而判断即可.
20.【答案】解:(1)画出散点图:
由已知条件得r=b·i=110xi2−10x2i=110yi2−10y2,
所以r=1.222×0.851.042=0.997,
这说明y与x正相关,且相关性很强.
(2)①由已知求得x=1.445,y=2.731,
a=y−bx=2.731−1.222×1.445=0.965,
故所求回归方程为y=1.222x+0.965;
②当x=1.98时,y=1.222×1.98+0.965=3.385万元,
估计某月产量为1.98万件时产品的总成本约为3.385万元.
【解析】本题考查了回归直线方程,相关系数,属于中档题.
(1)先画出散点图,r=1.222×0.851.042=0.997,这说明y与x正相关,且相关性很强;
(2)①由已知求得x=1.445,y=2.731,a=y−bx=2.731−1.222×1.445=0.965,得出回归方程;
②把x=1.98代入回归方程即可得出结果.
21.【答案】解:(1)散点图如图所示,
r=x1y1+x2y2+…+xnyn−nx−y−x12+x22+…+xn2−nx−2⋅y12+y22+…+yn2−ny−2
=368435−45×88.2×89.8367999−45×88.22⋅377629−45×89.82≈0.8.
故Y与X间的线性相关系数为0.8.
(2)由最小二乘法可得b≈0.726,a=25.767,
所以Y关于X的线性回归方程是Y=25.767+0.726X,
当X=110时,Y=25.767+0.726×110≈106.
【解析】(1)根据表格中的数据作出散点图即可,利用相关系数的计算公式求解即可;
(2)用最小二乘法可算得b≈0.726,a=25.767,然后得到线性回归方程,把X=110代入回归方程计算即可得解.
本题考查线性相关系数、线性回归方程,计算量越大,考查学生的作图能力和运算能力,属于中档题.
22.【答案】解:(1) ①依题意:x=2+4+6+8+10+126=7,
令z=log2y=bx+log2c;
再令a=log2c,则z=bx+a.
根据最小二乘估计可知:b=i=16(xi−x)(zi−z)i=16(xi−x)2=34.770≈0.5,
得a=z−bx=4.5−0.5×7=1,
所以回归方程为z=0.5x+1,即y=20.5x+1.
②设20.5x+1≥200,解得0.5x+1≥log2200,即x≥4+4log25≈13.2.
所以科技投入的费用至少要13.2百万元,下一年的收益才能达到2亿.
(2)甲建立的回归模型的残差为:
yi
5.6
6.5
12.0
27.5
80.0
129.2
yi
4
8
16
32
64
128
yi−yi
1.6
−1.5
−4
−4.5
16
1.2
则i=16(yi−yi)2=298.5,
从而R2=1−298.512730.4≈1−0.02=0.98>0.94.
所以甲建立的回归模型拟合效果更好.
【解析】本题考查回归分析及其应用,属于中档题.
(1) ①求出x,令z=log2y=bx+log2c,再令a=log2c,先求出z和x的回归直线方程,即可求得y关于x的回归方程;
②解20.5x+1≥200即可;
(2)列出残差表,求出R2,即可判断甲建立的回归模型拟合效果更好.
高中数学9.1线性回归分析优秀巩固练习: 这是一份高中数学9.1线性回归分析优秀巩固练习,文件包含高二数学下学期第二次月考模拟试卷选择性必修第二册含数列和导数原卷版docx、高二数学下学期第二次月考模拟试卷选择性必修第二册含数列和导数解析版docx等2份试卷配套教学资源,其中试卷共20页, 欢迎下载使用。
高中数学苏教版 (2019)选择性必修第二册9.1线性回归分析优秀习题: 这是一份高中数学苏教版 (2019)选择性必修第二册9.1线性回归分析优秀习题,文件包含912线性回归方程原卷版docx、912线性回归方程解析版docx等2份试卷配套教学资源,其中试卷共29页, 欢迎下载使用。
苏教版 (2019)选择性必修第二册9.1线性回归分析优秀综合训练题: 这是一份苏教版 (2019)选择性必修第二册9.1线性回归分析优秀综合训练题,文件包含911变量的相关性原卷版docx、911变量的相关性解析版docx等2份试卷配套教学资源,其中试卷共19页, 欢迎下载使用。