![2023届高考一轮复习讲义(理科)第十一章 统计与统计案例 第3讲 高效演练分层突破学案01](http://m.enxinlong.com/img-preview/3/3/12655474/0/0.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![2023届高考一轮复习讲义(理科)第十一章 统计与统计案例 第3讲 高效演练分层突破学案02](http://m.enxinlong.com/img-preview/3/3/12655474/0/1.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![2023届高考一轮复习讲义(理科)第十一章 统计与统计案例 第3讲 高效演练分层突破学案03](http://m.enxinlong.com/img-preview/3/3/12655474/0/2.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
2023届高考一轮复习讲义(理科)第十一章 统计与统计案例 第3讲 高效演练分层突破学案
展开得到的线性回归方程为eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),则( )
A.eq \(a,\s\up6(^))>0,eq \(b,\s\up6(^))>0 B.eq \(a,\s\up6(^))>0,eq \(b,\s\up6(^))<0
C.eq \(a,\s\up6(^))<0,eq \(b,\s\up6(^))>0 D.eq \(a,\s\up6(^))<0,eq \(b,\s\up6(^))<0
解析:选B.根据给出的数据可发现:整体上y与x呈现负相关,所以eq \(b,\s\up6(^))<0,由样本点(3,4.0)及(4,2.5)可知eq \(a,\s\up6(^))>0,故选B.
2.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=eq \f(1,2)x+1上,则这组样本数据的样本相关系数为( )
A.-1 B.0
C.eq \f(1,2) D.1
解析:选D.所有点均在直线上,则样本相关系数最大,即为1,故选D.
3.(2020·山东德州模拟)已知某产品连续4个月的广告费xi(千元)与销售额yi(万元)(i=1,2,3,4)满足eq \i\su(i=1,4, )xi=15, eq \i\su(i=1,4, )yi=12.若广告费用x和销售额y之间具有线性相关关系,且回归直线方程为 eq \(y,\s\up6(^))= eq \(b,\s\up6(^))x+ eq \(a,\s\up6(^)), eq \(b,\s\up6(^))=0.6,当广告费用为5千元时,可预测销售额为( ),
A.3万元 万元
C.3.5万元 万元,
解析:选D.由已知 eq \(∑,\s\up6(4),\s\d4(i=1))xi=15, eq \(∑,\s\up6(4),\s\d4(i=1))y i=12,得eq \x\t(x)=eq \f(15,4)=3.75,eq \x\t(y)=eq \f(12,4)=3,所以3=3.75×0.6+eq \(a,\s\up6(^)),解得eq \(a,\s\up6(^))=0.75.所以回归直线方程为eq \(y,\s\up6(^))=0.6x+0.75.则当x=5时,y=3.75万元.故选D.
4.千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大复兴的中国梦奠定坚实基础,某校积极响应国家号召,不断加大拔尖人才的培养力度,据不完全统计
根据上表可得回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))中的eq \(b,\s\up6(^))为1.35,该校2018届同学在学科竞赛中获省级一等奖及以上的学生人数为63,据此模型预测该校今年被清华、北大等世界名校录取的学生人数为( )
A.111 B.117
C.118 D.123
解析:选B.因为eq \x\t(x)=53,eq \x\t(y)=103.5,所以eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x)=103.5-1.35×53=31.95,所以回归直线方程为eq \(y,\s\up6(^))=1.35x+31.95.当x=63时,代入解得eq \(y,\s\up6(^))=117,故选B.
5.随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.
由K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),
得K2=eq \f(100×(45×22-20×13)2,65×35×58×42)≈9.616.
参照下表,
下列结论正确的是( )
A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”
C.有99%以上的把握认为“生育意愿与城市级别有关”
D.有99%以上的把握认为“生育意愿与城市级别无关”
解析:选C.因为K2≈9.616>6.635,所以有99%以上的把握认为“生育意愿与城市级别有关”,故选C.
6.某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y与x具有线性相关关系,且回归方程为eq \(y,\s\up6(^))=0.6x+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为________.
解析:因为y与x具有线性相关关系,满足回归方程eq \(y,\s\up6(^))=0.6x+1.2,该城市居民人均工资为x=5,所以可以估计该城市的职工人均消费水平eq \(y,\s\up6(^))=0.6×5+1.2=4.2,所以可以估计该城市人均消费额占人均工资收入的百分比为eq \f(4.2,5)=84%.
答案:84%
7.已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如下表:
给出散点图如下:
根据以上信息,判断下列结论:
①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系;
②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;
③从全班随机抽取甲、乙两名同学,若甲同学数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩一定比乙同学的物理成绩高.
其中正确的个数为________.
解析:由散点图知,各点都分布在一条直线附近,故可以判断数学成绩与物理成绩具有线性相关关系,但不能判断数学成绩与物理成绩具有一次函数关系,故①正确,②错误;若甲同学的数学成绩为80分,乙同学数学成绩为60分,则甲同学的物理成绩可能比乙同学的物理成绩高,故③错误.综上,正确的个数为1.
答案:1
8.在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2-eq \f(1,3)附近波动.经计算eq \(∑,\s\up6(6),\s\d4(i=1))xi=11,eq \(∑,\s\up6(6),\s\d4(i=1))yi=13,eq \(∑,\s\up6(6),\s\d4(i=1))xeq \\al(2,i)=21,则实数b的值为________.
解析:令t=x2,则曲线的回归方程变为线性的回归方程,即y=bt-eq \f(1,3),此时eq \x\t(t)=eq \f(\(∑,\s\up6(6),\s\d4(i=1))xeq \\al(2,i),6)=eq \f(7,2),eq \x\t(y)=eq \f(\(∑,\s\up6(6),\s\d4(i=1))yi,6)=eq \f(13,6),代入y=bt-eq \f(1,3),得eq \f(13,6)=b×eq \f(7,2)-eq \f(1,3),解得b=eq \f(5,7).
答案:eq \f(5,7)
9.(2020·云南昆明诊断)某公司准备派出选手代表公司参加某职业技能挑战赛.经过层层选拔,最后集中在甲、乙两位选手在一项关键技能的区分上,选手完成该项挑战的时间越少越好.已知这两位选手在15次挑战训练中,完成该项关键技能挑战所用的时间t(单位:秒)及挑战失败(用“×”表示)的情况如表1:
据表1中的数据,应用统计软件得表2:
(1)根据上述回归方程,预测甲、乙分别在下一次完成该项关键技能挑战所用的时间;
(2)若该公司只有一个参赛名额,根据以上信息,判断哪位选手代表公司参加职业技能挑战赛更合适?请说明你的理由.
解:(1)当x=16时,eq \(t,\s\up6(^))甲=-1.59×16+99.31=73.87(秒),
eq \(t,\s\up6(^))乙=-1.73×16+100.26=72.58(秒).
(2)甲、乙两位选手完成关键技能挑战成功的次数都为10次,失败次数都为5次,所以,只需要比较他们完成关键技能挑战成功的情况即可,根据所给信息,结合(1)中预测结果,综合分析,选手乙代表公司参加技能挑战赛更合适,理由如下:
因为在相同次数的挑战练习中,两位选手在关键技能挑战的完成次数和失败次数都分别相同,x甲>x乙,乙选手用时更短;
由于Seq \\al(2,甲)
图1:设备改造前的样本的频率分布直方图
表1:设备改造后的样本的频数分布表
(1)完成下面的2×2列联表,并判断是否有99%的把握认为该企业生产的这种产品的质量指标值与设备改造有关.
(2)根据图1和表1提供的数据,试从产品合格率的角度对改造前后设备的优劣进行比较.
附
K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),其中n=a+b+c+d.
解:(1)根据题意填写2×2列联表
K2=eq \f(400×(172×8-192×28)2,364×36×200×200)≈12.210>6.635,
所以有99%的把握认为该企业生产的这种产品的质量指标值与设备改造有关.
(2)根据频率分布直方图和频数分布表知,设备改造前产品为合格品的概率为eq \f(172,200)=eq \f(43,50),
设备改造后产品为合格品的概率为eq \f(192,200)=eq \f(24,25)>eq \f(43,50),
显然设备改造后产品合格率更高,因此设备改造后性能更优.
[综合题组练]
1.中央政府为了应对因人口老龄化而造成的劳动力短缺等问题,拟定出台“延迟退休年龄政策”.为了了解人们对“延迟退休年龄政策”的态度,责成人社部进行调研.人社部从网上年龄在15~65岁的人群中随机调查100人,调查数据的频率分布直方图和支持“延迟退休”的人数与年龄的统计结果如下:
(1)由以上统计数据填写2×2列联表,并判断是否有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异;
(2)若以45岁为分界点,从不支持“延迟退休”的人中按分层抽样的方法抽取8人参加某项活动.现从这8人中随机抽2人.
①抽到1人是45岁以下时,求抽到的另一人是45岁以上的概率;
②记抽到45岁以上的人数为X,求随机变量X的分布列及数学期望.
参考数据及公式:
K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))
解:(1)列联表如下:
因为K2=eq \f(100×(35×5-45×15)2,50×50×80×20)=eq \f(25,4)=6.25>3.841,
所以有95%的把握认为以45岁为分界点的不同人群对“延迟退休年龄政策”的支持度有差异.
(2)从不支持“延迟退休”的人中抽取8人,则45岁以下的应抽6人,45岁以上的应抽2人.
①抽到1人是45岁以下的概率为eq \f(6,8)=eq \f(3,4),抽到1人是45岁以下且另一人是45岁以上的概率为eq \f(Ceq \\al(1,6)Ceq \\al(1,2),Ceq \\al(2,8))=eq \f(3,7).
故所求概率为eq \f(\f(3,7),\f(3,4))=eq \f(4,7).
②X=0,1,2.
P(X=0)=eq \f(Ceq \\al(2,6),Ceq \\al(2,8))=eq \f(15,28),P(X=1)=eq \f(Ceq \\al(1,6)Ceq \\al(1,2),Ceq \\al(2,8))=eq \f(12,28)=eq \f(3,7),
P(X=2)=eq \f(Ceq \\al(2,2),Ceq \\al(2,8))=eq \f(1,28).
可得随机变量X的分布列为
故E(X)=1×eq \f(3,7)+2×eq \f(1,28)=eq \f(1,2).
2.某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:
他们用两种模型①y=bx+a,②y=aebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由;
(2)残差绝对值大于2的数据被认为是异常数据,需要剔除.
(ⅰ)剔除异常数据后,求出(1)中所选模型的回归方程;
(ⅱ)广告投入量x=18时,(1)中所选模型收益的预报值是多少?
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))的斜率和截距的最小二乘估计分别为eq \(b,\s\up6(^))=
解:(1)应该选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,且模型①的带状区域比模型②的带状区域窄,所以模型①的拟合精度高,回归方程的预报精度高.
(2)(ⅰ)剔除异常数据,即3月份的数据后,得eq \x\t(x)=eq \f(1,5)×(7×6-6)=7.2,,
eq \x\t(y)=eq \f(1,5)×(30×6-31.8)=29.64.
所以y关于x的回归方程为eq \(y,\s\up6(^))=3x+8.04.
(ⅱ)把x=18代入(ⅰ)中所求回归方程得eq \(y,\s\up6(^))=3×18+8.04=62.04,
故预报值为62.04万元.
x
3
4
5
6
7
8
y
4.0
2.5
0.5
0.5
0.4
0.1
年份(届)
2014
2015
2016
2017
学科竞赛获省级一等奖
及以上的学生人数x
51
49
55
57
被清华、北大等世界名校录取的学生人数y
103
96
108
107
非一线
一线
总计
愿生
45
20
65
不愿生
13
22
35
总计
58
42
100
P(K2≥k0)
0.050
0.010
0.001
k0
3.841
6.635
10.828
学生编号
1
2
3
4
5
6
7
8
数学成绩
60
65
70
75
80
85
90
95
物理成绩
72
77
80
84
88
90
93
95
序号x
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
t甲
×
96
93
×
92
×
90
86
×
×
83
80
78
77
75
t乙
×
95
×
93
×
92
×
88
83
×
82
80
80
74
73
均值(单位:秒)
方差
线性回归方程
甲
85
50.2
eq \(t,\s\up6(^))甲=-1.59x+99.31
乙
84
54
eq \(t,\s\up6(^))乙=-1.73x+100.26
质量指标值
[15,20)
[20,25)
[25,30)
[30,35)
[35,40)
[40,45]
频数
4
36
96
28
32
4
设备改造前
设备改造后
合计
合格品
不合格品
合计
P(K2≥k0)
0.150
0.100
0.050
0.025
0.010
k0
2.072
2.706
3.841
5.024
6.635
设备改造前
设备改造后
合计
合格品
172
192
364
不合格品
28
8
36
合计
200
200
400
年龄
[15,25)
[25,35)
[35,45)
[45,55)
[55,65]
支持“延迟退休”的人数
15
5
15
28
17
45岁以下
45岁以上
总计
支持
不支持
总计
P(K2≥k0)
0.100
0.050
0.010
0.001
k0
2.706
3.841
6.635
10.828
45岁以下
45岁以上
总计
支持
35
45
80
不支持
15
5
20
总计
50
50
100
X
0
1
2
P
eq \f(15,28)
eq \f(3,7)
eq \f(1,28)
月份
1
2
3
4
5
6
广告投入量/万元
2
4
6
8
10
12
收益/万元
14.21
20.31
31.8
31.18
37.83
44.67
2023届高考一轮复习讲义(理科)第十一章 统计与统计案例 第2讲 高效演练分层突破学案: 这是一份2023届高考一轮复习讲义(理科)第十一章 统计与统计案例 第2讲 高效演练分层突破学案,共8页。
2023届高考一轮复习讲义(理科)第十一章 统计与统计案例 第1讲 高效演练分层突破学案: 这是一份2023届高考一轮复习讲义(理科)第十一章 统计与统计案例 第1讲 高效演练分层突破学案,共6页。
2023届高考一轮复习讲义(理科)第六章 数列 第3讲 高效演练分层突破学案: 这是一份2023届高考一轮复习讲义(理科)第六章 数列 第3讲 高效演练分层突破学案,共6页。