所属成套资源:新教材2023高中数学新人教A版选择性必修第三册分层演练(30份)
新教材2023高中数学第八章成对数据的统计分析章末复习课新人教A版选择性必修第三册 试卷
展开
这是一份新教材2023高中数学第八章成对数据的统计分析章末复习课新人教A版选择性必修第三册,共13页。
第八章 成对数据的统计分析
章末复习课
回顾本章学习过程,建构“基础知识、基本技能、基本思想、基本活动经验”之间的联系.
要点训练一 一元线性回归分析
在学习时,重点把握线性回归模型的思想方法.解题时注意以下几点:
(1)正确运用,的计算公式并准确计算,是求经验回归方程的关键.充分利用经验回归直线=x+必过样本点的中心(,)进行求值.
(2)可以通过残差图来刻画拟合效果,也可以用决定系数R2来反映回归模型的拟合效果,R2越大,表示残差平方和越小,即模型的拟合效果越好.
1.假定小麦基本苗数x与成熟期有效穗数y之间存在相关关系,今测得5组数据如下表.
x
15.0
25.8
30.0
36.6
44.4
y
39.4
42.9
42.9
43.1
49.2
(1)以x为自变量,y为因变量,作出散点图;
(2)求y与x之间的经验回归方程,对于苗数56.7求有效穗数;
(3)计算各组残差,并计算残差平方和.
解:(1)散点图如图所示.
(2)由散点图知,这两个变量有比较好的线性相关关系,因此可以用经验回归方程刻画它们之间的关系.
设经验回归方程为=x+,则=30.36,=43.5,
=5 101.56,=9 511.43, =1 320.66,
=1 892.25,=921.729 6,xiyi=6 746.76.
所以≈0.29,
=-≈43.5-0.29×30.36≈34.70.
故所求的经验回归方程为=34.70+0.29x.
当x=56.7时, =34.70+0.29×56.7=51.143.
所以有效穗数约为51.143.
(3)由=yi-得=0.35,=0.718,=-0.5,=-2.214,=1.624,
残差平方和:≈8.43.
2.为了迎接男篮世界杯,某协会组织了一次“手工制作助威旗”活动,将男篮世界杯的标志以手工刺绣的方式绣到红色的三角形的旗子上面.在10次制作中测得助威旗数x(单位:个)与加工时间y(单位:h)的数据如下表.
x
10
20
30
40
50
60
70
80
90
100
y
62
68
75
81
89
95
102
108
115
122
(1)x与y是否具有线性相关关系?
(2)如果x与y具有线性相关关系,求出y关于x的经验回归方程,并根据经验回归方程,预测加工2 010 个助威旗需多少天(精确到1).
注:每天工作8 h.
参考数据:=55,=91.7,=38 500,=87 777,
xiyi=55 950,38 500-10×552=8 250,≈91,
≈61.
解: (1)作散点图如图所示.
从图中可以看出,各点都散布在一条直线附近,即y与x线性相关.
(2)由所给数据求得
==
=≈0.668,
所以=-≈91.7-0.668×55=54.96,
所以y关于x的经验回归方程为=54.96+0.668x,
当x=2 010时,
=54.96+0.668×2 010=1 397.64,
所以1 397.64÷8=174.705≈175,
所以加工2 010个助威旗约需175天.
要点训练二 独立性检验
独立性检验是判断两个分类变量之间是否有关联的一种方法.在判断两个分类变量之间是否有关联时,作出等高堆积条形图只能近似地判断两个分类变量是否有关联,而独立性检验可以精确地得到可靠的结论.
1.通过随机询问100名不同性别的大学生是否爱好某项运动,得到列联表如下:
单位:名
爱好某项运动
性别
合计
男
女
爱好
35
55
不爱好
30
合计
100
(1)补全2×2列联表与等高堆积条形图,并判断爱好该项运动与性别是否有关联.
(2)根据小概率值α=0.005的独立性检验,能否认为爱好该项运动与性别有关联?
解:(1)补全2×2列联表如下:
单位:名
爱好某项运动
性别
合计
男
女
爱好
35
20
55
不爱好
15
30
45
合计
50
50
100
补全等高堆积条形图如图所示.
由图可知爱好该项运动与性别有关联.
(2)零假设为
H0:爱好该项运动与性别无关联.
根据列联表中的数据计算可得
χ2=≈9.091>7.879=x0.005.
根据小概率值α=0.005的独立性检验,
我们推断H0不成立,
即认为爱好该项运动与性别有关联,
此推断犯错误的概率不超过0.005.
2.某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线各抽取40件产品作为样本称出它们的质量(单位:g),质量值落在区间(495,510]上的产品为合格品,否则为不合格品.表1是甲流水线样本频数分布表,乙流水线样本的频率分布直方图如图所示.
表1
产品质量/g
频数
(490,495]
6
(495,500]
8
(500,505]
14
(505,510]
8
(510,515]
4
(1)根据表1中数据作出甲流水线样本的频率分布直方图.
(2)若以频率作为概率,试估计从乙流水线任取一件产品,该产品恰好是合格品的概率.
(3)由以上统计数据完成表2,根据小概率值α=0.1的χ2独立性检验,能否认为产品的质量与两条自动包装流水线的选择有关联?
表2
单位:件
质量
流水线
合计
甲流水线
乙流水线
合格品
不合格品
合计
附:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
解:(1)根据所给的每一组的频数和样本量得出每一组的频率,
作出甲流水线样本的频率分布直方图如图所示.
(2)由题图知,乙样本中合格品数为(0.06+0.09+0.03)×5×40=36,
故合格品的频率为=0.9,
据此可估计从乙流水线任取一件产品,
该产品恰是合格品的概率为0.9.
(3)补全列联表如下:
单位:件
质量
流水线
合计
甲流水线
乙流水线
合格品
30
36
66
不合格品
10
4
14
合计
40
40
80
零假设为
H0:产品的质量与两条自动包装流水线的选择无关联.
根据2×2列联表中的数据,计算可得
χ2=≈3.117>2.706=x0.1.
根据小概率值α=0.1的独立性检验,
推断H0不成立,
即认为产品的质量与两条自动包装流水线的选择有关联,
此推断犯错误的概率不超过0.1.
要点训练三 两个变量相关关系的判断
分析判断两个变量相关关系常用的方法:
(1)散点图法:把样本数据表示的点在平面直角坐标系中标出,得到散点图,由散点图的形状分析.
(2)样本相关系数法:利用r进行检验,在确认具有线性相关关系后,再求经验回归方程.
1.某地10户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元)的统计资料如下表:
x
2
4
4
6
6
6
7
7
8
10
y
0.9
1.4
1.6
2.0
2.1
1.9
1.8
2.1
2.2
2.3
根据表中数据,确定家庭的年收入和年饮食支出是否具有相关关系.
解:由题意作散点图如图所示.
从图中可以看出,年收入和年饮食支出有比较好的线性相关关系.
2.一散点图如图所示.
由散点图看出,可用线性回归模型拟合y与t的关系,请用样本相关系数加以说明.
参考数据:yi=9.32,tiyi=40.17,=0.55,≈2.646.
解:由题图中数据和参考数据得,
=4,(ti-)2=28,=0.55,
(ti-)(yi-)=tiyi-yi=40.17-4×9.32=2.89,
r≈≈0.99.
因为y与t的样本相关系数近似为0.99,所以y与t的线性相关程度很强,从而可用线性回归模型拟合y与t的关系.
要点训练四 非线性回归分析
非线性回归分析问题的处理方法:
(1)描点,选模.画出已知数据的散点图,把它与已经学过的各种函数(幂函数、指数函数、对数函数等)的图象作比较,挑选一种图象跟这些散点拟合最好的函数.
(2)解模.先对变量进行适当地变换,再利用线性回归模型来解模.
(3)比较检验.通过回归分析比较所建模型的优劣.
1.在某化学实验中,测得的6对数据如下表所示,其中x(单位:min)表示化学反应进行的时间,y(单位:mg)表示未转化物质的质量.
x
1
2
3
4
5
6
y
39.8
32.2
25.4
20.3
16.2
13.3
(1)设y与x之间具有关系y=cdx,试根据测量数据估计c和d的值(精确到0.001);
(2)化学反应进行到10 min时,估计未转化物质的质量(精确到0.1).
解:(1)在y=cdx两边取自然对数,令ln y=z,ln c=a,ln d=b,则z=a+bx.
由已知数据,得下表.
x/min
1
2
3
4
5
6
y/mg
39.8
32.2
25.4
20.3
16.2
13.3
z=ln y
3.684
3.472
3.235
3.011
2.785
2.588
由公式得≈3.905 7,≈-0.221 9,
则经验回归方程为=3.905 7-0.221 9x.
而ln c=3.905 7,ln d=-0.221 9,故c≈49.685,d≈0.801,
所以c,d的估计值分别为49.685和0.801.
(2)当x=10时,结合(1)可得y≈5.4.
故估计未转化物质的质量为5.4 mg.
2.在一次抽样调查中测得样本的5个样本点,数据如下表:
x
0.25
0.5
1
2
4
y
16
12
5
2
1
试建立y与x之间的经验回归方程.
解:由已知数据表作出散点图如图所示.
由图可知变量y与x近似地满足y=+a(b>0),
令t=,则y=bt+a.
由y与x的数据表可得y与t的数据表:
t
4
2
1
0.5
0.25
y
16
12
5
2
1
作出y与t的散点图如图所示.
由图可知y与t具有线性相关关系.
易知=1.55,=7.2,tiyi=94.25,=21.312 5,
==≈4.134 4,
=-≈7.2-4.134 4×1.55≈0.8,
所以=4.134 4t+0.8.
所以y与x的经验回归方程是=+0.8.
要点训练五 建模思想
(1)解决函数应用题的关键在于理解题意,并准确建立数学模型.因此,一方面要加强对常见函数模型的理解,弄清其产生的实际背景,把数学问题生活化;另一方面,要不断拓宽自己的知识面,提高生活阅历,培养实际问题数学化的意识和能力.
常见的解决方法:
①关系分析法:通过寻找实际问题中的关键词和关键量之间的数量关系来建立函数模型.
②列表分析法:通过列表的方法探求函数模型.
③图象分析法:通过对图象中的数量关系进行分析来建立函数模型.
(2)对于只是给出几组对应值,而变量关系不确定的应用题,求解函数模型的一般步骤如下:
①作散点图;
②选择函数模型;
③用待定系数法求函数模型;
④检验,若符合实际,则可用此函数模型解决问题,否则重复步骤②~④.
1.(2020·全国Ⅰ卷)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi, yi) (i=1,2,… ,20)得到下面的散点图:
由此散点图,在10℃至40℃之间,下面四个经验回归方程类型中最适宜作为发芽率y和温度x的经验回归方程类型的是( )
A.y=a+bx B.y=a+bx2
C.y=a+bex D.y=a+bln x
解析:由散点图可知,在10℃至40℃之间,发芽率y和温度x所对应的点(x,y)在一段对数型函数的图象附近,结合选项可知, y=a+bln x可作为发芽率y和温度x的经验回归方程类型.故选D.
答案:D
2.我国新能源产业迅速发展,以下是近几年某新能源产品的年销售量数据:
年份
2017
2018
2019
2020
2021
年份代码
1
2
3
4
5
新能源产品年销量/万个
1.6
6.2
17.7
33.1
55.6
(1)请画出上表中年份代码x与年销量y的数据对应的散点图,并根据散点图判断:y=ax+b与y=cx2+d中哪一个更适宜作为年销量y关于年份代码x的经验回归方程类型.
(2)根据(1)的判断结果及表中数据,建立y关于x的经验回归方程,并预测2022年该新能源产品的年销量.
参考公式: =, =t+.
参考数据:=3,=22.84,=11,(xi-)2=10,(ti-)2=374,
(xi-)(yi-)=134.9,(ti-)(yi-)=849.1,其中ti=.
解:(1)作散点图如图所示.
根据散点图,可知y=cx2+d更适宜作为年销量y关于年份代码x的经验回归方程类型.
(2)令t=x2,则y=ct+d.依题意,知 =22.84,=11,
==≈2.27,=-≈22.84-2.27×11=-2.13,
所以=2.27t-2.13,所以y关于x的经验回归方程为=2.27x2-2.13.
当x=6时, =2.27×62-2.13=79.59,
故预测2021年该新能源产品的年销量为79.59万个.
统计与概率的综合问题
(2020·新高考山东卷改编·12分)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
单位:μg/m3
PM2.5
SO2
[0,50]
(50,150]
(150,475]
[0,35]
32
18
4
(35,75]
6
8
12
(75,115]
3
7
10
(1)估计事件“该市一天空气中PM2.5浓度不超过75 μg/m3,且SO2浓度不超过150 μg/m3”的概率;
(2)根据所给数据,完成下面的2×2列联表:
单位:μg/m3
PM2.5
SO2
合计
[0,150]
(150,475]
[0,75]
(75,115]
合计
(3)根据(2)中的列联表,依据小概率值α=0.01的独立性检验,能否认为该市一天空气中PM2.5浓度与SO2浓度有关联?
附:χ2=.
α
0.05
0.01
0.001
xα
3.841
6.635
10.828
解:(1)由表格可知,该市100天中,空气中PM2.5浓度不超过 75 μg/m3,且SO2浓度不超过150 μg/m3的天数为32+6+18+8=64①,……………………2分
以该市一天空气中PM2.5浓度不超过75 μg/m3,且SO2浓度不超过150 μg/m3的概率约为=0.64②. …………………………………1分(累计3分)
(2)由所给数据,可得2×2列联表为:
单位:μg/m3③
PM2.5
SO2
合计
[0,150]
(150,475]
[0,75]
64
16
80
(75,115]
10
10
20
合计
74
26
100
………………………………………4分(累计7分)
(3)零假设为
H0:该市一天空气中PM2.5浓度与SO2浓度无关④. …………………………………1分(累计8分)
根据2×2列联表中的数据可得,
χ2=≈7.484 4>6.635=, …………………………………3分(累计11分)
根据小概率值α=0.01的独立性检验,推断H0不成立,即认为该市一天空气中PM2.5浓度与SO2浓度有关联,此推断犯错误的概率不大于0.01⑥.……1分(累计12分)
评分细则
第(1)题:
①有式子得1分,结果对得1分.
②概率结果正确得1分.
第(2)题:
③表格填写正确得4分.
第(3)题:
④提出零假设H0得1分.
⑤有式子χ2=
得1分,
有7.484 4得1分,
有>6.635得1分.
⑥结论正确得1分.
得分技巧
1.得步骤分:第(1)题①中式子得1分,结果得1分.
第(3)题⑤中运算过程每个步骤都有分值.
2.得规范分:第(3)题⑥要有结论,没有结论会失分.
3.得运算分:如第(1)题②中结果运算正确得1分,第(3)题结果错误会相应扣分.