所属成套资源:2025届高考数学二轮专题复习与测试
2025届高考数学二轮专题复习与测试专题3成对数据的统计分析
展开
这是一份2025届高考数学二轮专题复习与测试专题3成对数据的统计分析,共15页。试卷主要包含了85×11=68,65+0,5=-1,75<6,06,,624>7等内容,欢迎下载使用。
(2024·济南三模)近年来,我国众多新能源汽车制造企业迅速崛起.某企业着力推进技术革新,利润稳步提高.统计该企业2020年至2024年的利润(单位:亿元),得到如图所示的散点图.其中2020年至2024年对应的年份代码依次为1,2,3,4,5.
(1)根据散点图判断,y=a+bx和y=c+dx2哪一个适合作为企业利润y(单位:亿元)关于年份代码x的回归方程模型?(给出判断即可,不必说明理由)
(2)根据(1)中的判断结果,建立y关于x的回归方程;
(3)根据(2)的结果,估计该企业2026年的利润.
参考公式及数据: eq \(b,\s\up6(^)) = eq \f(\i\su(i=1,n,x)iyi-n\(x,\s\up10(-))\(y,\s\up10(-)),\i\su(i=1,n,x) eq \\al(2,i) -n\(x,\s\up10(-))2) , eq \(a,\s\up6(^)) = eq \(y,\s\up10(-))- eq \(b,\s\up6(^)) eq \(x,\s\up10(-)),
eq \i\su(i=1,5,x) eq \\al(2,i) =55, eq \i\su(i=1,5,x) eq \\al(4,i) =979, eq \i\su(i=1,5,y) i=390, eq \i\su(i=1,5,x) iyi=1 221, eq \i\su(i=1,5,x) eq \\al(2,i) yi=4 607.9.
【解】 (1)由题中散点图的变化趋势,知y=c+dx2适合作为企业利润y(单位:亿元)关于年份代码x的回归方程模型.
(2)由题意得, eq \(x,\s\up10(-))2= eq \f(1,5) eq \i\su(i=1,5,x) eq \\al(2,i) =11,
eq \(y,\s\up10(-))= eq \f(1,5) eq \i\su(i=1,5,y) i=78,
eq \(d,\s\up6(^)) = eq \f(\i\su(i=1,5,x) eq \\al(2,i) yi-5×\(x,\s\up10(-))2 \(y,\s\up10(-)),\i\su(i=1,5, )(x eq \\al(2,i) )2-5×(\(x,\s\up10(-))2)2)
= eq \f(4 607.9-5×11×78,979-5×112) =0.85,
eq \(c,\s\up6(^)) = eq \(y,\s\up10(-))- eq \(d,\s\up6(^)) × eq \(x,\s\up10(-))2=78-0.85×11=68.65,
所以 eq \(y,\s\up6(^)) =68.65+0.85x2.
(3)令x=7, eq \(y,\s\up6(^)) =68.65+0.85×72=110.3,
估计该企业2026年的利润为110.3亿元.
求经验回归方程的方法
(1)若所求的经验回归方程是在选择题中,常利用经验回归直线 eq \(y,\s\up6(^)) = eq \(b,\s\up6(^)) x+ eq \(a,\s\up6(^)) 必经过样本点的中心( eq \(x,\s\up10(-)), eq \(y,\s\up10(-)))来快速选择.
(2)若所求的经验回归方程是在解答题中,则求经验回归方程的一般步骤如下:
(3)非线性回归问题的求解关键:①转化:通过取对数、取倒数、平方(开方)等,把非线性经验回归方程转化成线性经验回归方程;②判断:通过计算样本相关系数或决定系数,判断拟合效果.
(2024·苏州模拟)某学校研究性学习小组在学习生物遗传学的过程中,为验证高尔顿提出的关于儿子成年后身高y(单位:cm)与父亲身高x(单位:cm)之间的关系及存在的遗传规律,随机抽取了5对父子的身高数据,如下表:
参考数据及公式: eq \i\su(i=1,5,x) i=880, eq \i\su(i=1,5,x) eq \\al(2,i) =155 450, eq \i\su(i=1,5,y) i=885, eq \i\su(i=1,5,x) iyi=156 045, eq \(b,\s\up6(^)) = eq \f(\i\su(i=1,n,x)iyi-n\(x,\s\up10(-)) \(y,\s\up10(-)),\i\su(i=1,n,x) eq \\al(2,i) -n\(x,\s\up10(-))2) , eq \(a,\s\up6(^)) = eq \(y,\s\up10(-))- eq \(b,\s\up6(^)) eq \(x,\s\up10(-)).
(1)根据表中数据,求出y关于x的经验回归方程,并利用经验回归方程分别确定儿子比父亲高和儿子比父亲矮的条件,由此可得到怎样的遗传规律?
(2)记 eq \(e,\s\up6(^)) i=yi- eq \(y,\s\up6(^)) i=yi- eq \(b,\s\up6(^)) xi- eq \(a,\s\up6(^)) (i=1,2…,n),其中yi为观测值, eq \(y,\s\up6(^)) i为预测值, eq \(e,\s\up6(^)) i为对应(xi,yi)的残差.求(1)中儿子身高的残差的和,并探究这个结果是否对任意具有线性相关关系的两个变量都成立?若成立加以证明;若不成立说明理由.
解:(1) eq \(x,\s\up10(-))= eq \f(1,5) eq \i\su(i=1,5,x) i= eq \f(1,5) ×880=176,
eq \(y,\s\up10(-))= eq \f(1,5) eq \i\su(i=1,5,y) i= eq \f(1,5) ×885=177,
eq \(b,\s\up6(^)) = eq \f(\i\su(i=1,5,x)iyi-5\(x,\s\up10(-))\(y,\s\up10(-)),\i\su(i=1,5,x) eq \\al(2,i) -5\(x,\s\up10(-))2) = eq \f(156 045-5×176×177,155 450-5×1762) =0.5,
eq \(a,\s\up6(^)) = eq \(y,\s\up10(-))- eq \(b,\s\up6(^)) eq \(x,\s\up10(-))=177-0.5×176=89,
故经验回归方程为 eq \(y,\s\up6(^)) =0.5x+89,取 eq \(y,\s\up6(^)) =0.5x+89>x,解得x0.75,则认为两个变量具有较强的线性相关性);
(2)该纺织厂现有甲、乙两条流水线生产同一种产品.为对产品质量进行监控,质检人员先用简单随机抽样的方法从甲、乙两条流水线上分别抽取了4件、2件产品进行初检,再从中随机选取3件做进一步的质检,记抽到“甲流水线产品”的件数为X,试求X的分布列与均值.
参考数据及公式: eq \r(1 160) ≈34.06,
样本相关系数r= eq \f(\i\su(i=1,n, )(xi-\(x,\s\up10(-)))(yi-\(y,\s\up10(-))),\r(\i\su(i=1,n, )(xi-\(x,\s\up10(-)))2)\r(\i\su(i=1,n, )(yi-\(y,\s\up10(-)))2)) .
解:(1)因为 eq \(x,\s\up10(-))= eq \f(1+2+3+4+5,5) =3, eq \(y,\s\up10(-))= eq \f(27+23+20+17+13,5) =20,
eq \i\su(i=1,5, ) (xi- eq \(x,\s\up10(-)))2=10, eq \i\su(i=1,5, ) (yi- eq \(y,\s\up10(-)))2=116,
eq \i\su(i=1,5, ) (xi- eq \(x,\s\up10(-)))(yi- eq \(y,\s\up10(-)))=-34,
所以r= eq \f(\i\su(i=1,5, )(xi-\(x,\s\up10(-)))(yi-\(y,\s\up10(-))),\r(\i\su(i=1,5, )(xi-\(x,\s\up10(-)))2)\r(\i\su(i=1,5, )(yi-\(y,\s\up10(-)))2))
= eq \f(-34,\r(10)×\r(116)) ≈ eq \f(-34,34.06) ≈-0.998.
又|r|=0.998>0.75,
所以可以判断y与x具有较强的线性相关关系.
(2)X的可能取值有1,2,3,
因为P(X=1)= eq \f(C eq \\al(1,4) C eq \\al(2,2) ,C eq \\al(3,6) ) = eq \f(1,5) ,
P(X=2)= eq \f(C eq \\al(2,4) C eq \\al(1,2) ,C eq \\al(3,6) ) = eq \f(3,5) ,
P(X=3)= eq \f(C eq \\al(3,4) ,C eq \\al(3,6) ) = eq \f(1,5) ,
其分布列为
E(X)=1× eq \f(1,5) +2× eq \f(3,5) +3× eq \f(1,5) =2.
1.(2024·贵阳一模)某中学开展劳动主题德育活动,高一某班统计了本班学生1至7月份的人均月劳动时间(单位:h),并建立了人均月劳动时间y(单位:h)关于月份x的经验回归方程 eq \(y,\s\up6(^)) = eq \(b,\s\up6(^)) x+ eq \f(32,7) ,y与x的原始数据如表所示:
由于某些原因导致部分数据丢失,但已知 eq \i\su(i=1,7,x) iyi=448.
(1)求m,n的值;
(2)如果该月人均劳动时间超过13 h,则该月份“达标”.从表格中的7组数据中随机选5组,设ξ表示“达标”的数据组数,求ξ的分布列和均值.
参考公式:在经验回归方程 eq \(y,\s\up6(^)) = eq \(b,\s\up6(^)) x+ eq \(a,\s\up6(^)) 中, eq \(b,\s\up6(^)) = eq \f(\i\su(i=1,n,x)iyi-n\(x,\s\up10(-))\(y,\s\up10(-)),\i\su(i=1,n,x) eq \\al(2,i) -n\(x,\s\up10(-))2) .
解:(1) eq \(x,\s\up10(-))= eq \f(1,7) ×(1+2+3+4+5+6+7)=4, eq \(y,\s\up10(-))= eq \f(1,7) ×(8+9+n+12+m+19+22)= eq \f(70+m+n,7) ,
eq \i\su(i=1,7,x) iyi=1×8+2×9+3n+4×12+5m+6×19+7×22=448,则3n+5m=106,
而 eq \i\su(i=1,7,x) eq \\al(2,i) =1+4+9+16+25+36+49=140,
所以 eq \(b,\s\up6(^)) = eq \f(\i\su(i=1,7,x)iyi-7\(x,\s\up10(-))\(y,\s\up10(-)),\i\su(i=1,7,x) eq \\al(2,i) -7\(x,\s\up10(-))2) = eq \f(448-7×4×\(y,\s\up10(-)),140-7×42) ,整理得 eq \(b,\s\up6(^)) + eq \(y,\s\up10(-))=16,由 eq \(y,\s\up10(-))= eq \(b,\s\up6(^)) eq \(x,\s\up10(-))+ eq \f(32,7) ,
得 eq \(y,\s\up10(-))=4 eq \(b,\s\up6(^)) + eq \f(32,7) ,
联立解得 eq \(b,\s\up6(^)) = eq \f(16,7) , eq \(y,\s\up10(-))= eq \f(96,7) ,则m+n=26,又3n+5m=106,所以m=14,n=12.
(2)依题意,ξ的可能取值为1,2,3,
P(ξ=1)= eq \f(C eq \\al(1,3) C eq \\al(4,4) ,C eq \\al(5,7) ) = eq \f(1,7) ,P(ξ=2)= eq \f(C eq \\al(2,3) C eq \\al(3,4) ,C eq \\al(5,7) ) = eq \f(4,7) ,P(ξ=3)= eq \f(C eq \\al(3,3) C eq \\al(2,4) ,C eq \\al(5,7) ) = eq \f(2,7) ,
ξ的分布列为
所以E(ξ)=1× eq \f(1,7) +2× eq \f(4,7) +3× eq \f(2,7) = eq \f(15,7) .
2.(2024·菏泽模拟)随着牡丹花期结束,某市牡丹园为了更好地了解游客需求,优化自身服务,提高游客满意度,随机对200位游客进行了满意度调查,其中100位男性中有86位满意;100位女性中有94位满意.
(1)根据小概率值α=0.1的独立性检验,能否推断游客对该牡丹园的满意度与性别有关;
(2)若用频率估计概率,从该牡丹园的游客中随机选取3人,设3人中满意的人数为X,求X的分布列和均值.
附:χ2= eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)) ,n=a+b+c+d.
解:(1)将所给数据进行整理,得到男性和女性满意度的列联表,如表所示:
单位:人
零假设为H0:游客对该牡丹园的满意度与性别无关,即男性和女性的满意度没有差异.
根据列联表中的数据,经计算得到χ2= eq \f(200×(86×6-14×94)2,100×100×180×20) ≈3.556>2.706=x0.1.
根据小概率值α=0.1的独立性检验,我们推断H0不成立,即认为游客对该牡丹园的满意度与性别有关,此推断犯错误的概率不大于0.1.
(2)依题意,每个游客满意的概率为 eq \f(86+94,200) = eq \f(9,10) ,X的可能取值为0,1,2,3,且X~B eq \b\lc\(\rc\)(\a\vs4\al\c1(3,\f(9,10))) ,
因为P(X=0)= eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(1,10))) eq \s\up12(3) = eq \f(1,1 000) ,
P(X=1)=C eq \\al(1,3) × eq \f(9,10) × eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(1,10))) eq \s\up12(2) = eq \f(27,1 000) ,
P(X=2)=C eq \\al(2,3) × eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(9,10))) eq \s\up12(2) × eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(1,10))) eq \s\up12(1) = eq \f(243,1 000) ,
P(X=3)= eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(9,10))) eq \s\up12(3) = eq \f(729,1 000) .
所以X的分布列为
E(X)=3× eq \f(9,10) = eq \f(27,10) .
3.(2024·重庆模拟)某公司在产品研发领域逐年加大投入,以下是近年来该公司对产品研发年投入额x(单位:百万元)与其年销售量y(单位:千件)的数据统计表.
(1)公司拟用①y=bx+a和②y=enx+m两种方案作为年销售量y关于年投入额x的回归分析模型,请根据已知数据,确定方案①和②的经验回归方程;( eq \(a,\s\up6(^)) , eq \(b,\s\up6(^)) , eq \(m,\s\up6(^)) , eq \(n,\s\up6(^)) 计算过程保留到小数点后两位,最后结果保留到小数点后一位)
(2)根据下表数据,用决定系数R2(只需比较出大小)比较两种模型的拟合效果哪种更好,并选择拟合精度更高的模型,预测年投入额为7(单位:百万元)时,产品的年销售量是多少?
参考公式及数据: eq \(b,\s\up6(^)) = eq \f(\i\su(i=1,n,x)iyi-n\(x,\s\up10(-))\(y,\s\up10(-)),\i\su(i=1,n,x) eq \\al(2,i) -n\(x,\s\up10(-))2) , eq \(a,\s\up6(^)) = eq \(y,\s\up10(-))- eq \(b,\s\up6(^)) eq \(x,\s\up10(-)),R2=1- eq \f(\i\su(i=1,n, )(yi-\(y,\s\up6(^))i)2,\i\su(i=1,n, )(yi-\(y,\s\up10(-)))2) , eq \i\su(i=1,6,x) iyi=121, eq \i\su(i=1,6,x) eq \\al(2,i) =91,
eq \i\su(i=1,6,x) izi=28.9, eq \(z,\s\up10(-))=0.85,e2.8≈16.4,e3≈20.1.
解:(1) eq \(x,\s\up10(-))= eq \f(1+2+3+4+5+6,6) =3.5,
eq \(y,\s\up10(-))= eq \f(0.5+1+1.5+3+6+12,6) =4,
所以 eq \(b,\s\up6(^)) = eq \f(121-6×3.5×4,91-6×3.52) = eq \f(37,17.5) ≈2.11, eq \(a,\s\up6(^)) =4- eq \f(37,17.5) ×3.5=-3.40,
所以 eq \(y,\s\up6(^)) =2.1x-3.4.
由 eq \(y,\s\up6(^)) =e eq \(n,\s\up6(^)) x+ eq \(m,\s\up6(^)) ,两边取以e为底的对数得ln eq \(y,\s\up6(^)) = eq \(n,\s\up6(^)) x+ eq \(m,\s\up6(^)) ,即 eq \(z,\s\up6(^)) = eq \(n,\s\up6(^)) x+ eq \(m,\s\up6(^)) ,
eq \(n,\s\up6(^)) = eq \f(28.9-6×3.5×0.85,91-6×3.52) = eq \f(11.05,17.5) ≈0.63, eq \(m,\s\up6(^)) =0.85- eq \f(11.05,17.5) ×3.5=-1.36,
所以 eq \(z,\s\up6(^)) =0.63x-1.36,所以 eq \(y,\s\up6(^)) =e0.6x-1.4.
(2) eq \i\su(i=1,6, ) (yi- eq \(y,\s\up10(-)))2=(0.5-4)2+(1-4)2+(1.5-4)2+(3-4)2+(6-4)2+(12-4)2=96.5,
对于 eq \(y,\s\up6(^)) =2.1x-3.4,R eq \\al(2,1) =1- eq \f(18.29,96.5) ;
对于 eq \(y,\s\up6(^)) =e0.6x-1.4,R eq \\al(2,2) =1- eq \f(0.65,96.5) ,
因为R eq \\al(2,1) 7.879=x0.005,
所以根据小概率值α=0.005的独立性检验,我们推断H0不成立,即可以认为PM2.5的平均浓度与燃油车日流量有关,此推断犯错误的概率不大于0.005.
(2)①由题意,得 eq \(b,\s\up6(^)) = eq \f(\i\su(i=1,50, )(xi-\(x,\s\up10(-)))(yi-\(y,\s\up10(-))),\i\su(i=1,50, )(xi-\(x,\s\up10(-)))2) =0.12,
得 eq \i\su(i=1,50, ) (xi- eq \(x,\s\up10(-)))(yi- eq \(y,\s\up10(-)))=0.12 eq \i\su(i=1,50, ) (xi- eq \(x,\s\up10(-)))2,
由sx= eq \r(\f(1,50)\i\su(i=1,50, )(xi-\(x,\s\up10(-)))2) =249,
sy= eq \r(\f(1,50)\i\su(i=1,50, )(yi-\(y,\s\up10(-)))2) =36,
得r= eq \f(\i\su(i=1,50, )(xi-\(x,\s\up10(-)))(yi-\(y,\s\up10(-))),\r(\i\su(i=1,50, )(xi-\(x,\s\up10(-)))2\i\su(i=1,50, )(yi-\(y,\s\up10(-)))2)) =
eq \f(0.12\i\su(i=1,50, )(xi-\(x,\s\up10(-)))2,\r(\i\su(i=1,50, )(xi-\(x,\s\up10(-)))2\i\su(i=1,50, )(yi-\(y,\s\up10(-)))2)) =
0.12× eq \f(\r(\i\su(i=1,50, )(xi-\(x,\s\up10(-)))2),\r(\i\su(i=1,50, )(yi-\(y,\s\up10(-)))2)) =0.12× eq \f(249,36) =0.83>0.75,
所以该经验回归方程有价值.
②因为sx= eq \r(\f(1,50)\i\su(i=1,50, )(xi-\(x,\s\up10(-)))2) =249,
即 eq \r(\f(1,50)\b\lc\(\rc\)(\a\vs4\al\c1(\i\su(i=1,50,x) eq \\al(2,i) -50×\(x,\s\up10(-))2))) =249,
所以 eq \(x,\s\up10(-))= eq \r(\f(1,50)\i\su(i=1,50,x) eq \\al(2,i) -2492) ≈1 548.55,
又 eq \(y,\s\up10(-))=0.12 eq \(x,\s\up10(-))-73.86≈0.12×1 548.55-73.86=111.966≈112.0.
故可推算出这50天的PM2.5的平均浓度y的平均数 eq \(y,\s\up10(-))约为112.0.
父亲身高x
160
170
175
185
190
儿子身高y
170
174
175
180
186
性别
跑步项目
长跑
短跑
男同学
30
10
女同学
a
10
α
0.05
0.01
0.001
xα
3.841
6.635
10.828
性别
跑步项目
合计
长跑
短跑
男
30
10
40
女
10
10
20
合计
40
20
60
个性化错题本
期末统考中的数学成绩
合计
及格
不及格
建立
未建立
合计
α
0.01
0.005
0.001
xα
6.635
7.879
10.828
个性化
错题本
期末统考中的数学成绩
合计
及格
不及格
建立
20
4
24
未建立
4
8
12
合计
24
12
36
强化训练
成绩
合计
优秀
非优秀
前
后
合计
α
0.05
0.01
0.005
0.001
xα
3.841
6.635
7.879
10.828
强化训练
成绩
合计
优秀
非优秀
前
40
60
100
后
60
40
100
合计
100
100
200
月份
5月
6月
7月
8月
9月
月份编号x
1
2
3
4
5
利润y/万元
27
23
20
17
13
X
1
2
3
P
eq \f(1,5)
eq \f(3,5)
eq \f(1,5)
月份x
1
2
3
4
5
6
7
人均月劳动时间y
8
9
n
12
m
19
22
ξ
1
2
3
P
eq \f(1,7)
eq \f(4,7)
eq \f(2,7)
α
0.1
0.05
0.01
xα
2.706
3.841
6.635
性别
满意度
合计
满意
不满意
男
86
14
100
女
94
6
100
合计
180
20
200
X
0
1
2
3
P
eq \f(1,1 000)
eq \f(27,1 000)
eq \f(243,1 000)
eq \f(729,1 000)
x
1
2
3
4
5
6
y
0.5
1
1.5
3
6
12
z=ln y
-0.7
0
0.4
1.1
1.8
2.5
经验回归方程
eq \(y,\s\up6(^)) = eq \(b,\s\up6(^)) x+ eq \(a,\s\up6(^))
eq \(y,\s\up6(^)) =e eq \(n,\s\up6(^)) x+ eq \(m,\s\up6(^))
残差平方和 eq \i\su(i=1,6, ) (yi- eq \(y,\s\up6(^)) i)2
18.29
0.65
PM2.5的
平均浓度
燃油车日流量
合计
小于1 500
不小于1 500
小于100
16
24
不小于100
20
合计
22
α
0.01
0.005
0.001
xα
6.635
7.879
10.828
PM2.5的平均浓度
燃油车日流量
合计
小于1 500
不小于1 500
小于100
16
8
24
不小于100
6
20
26
合计
22
28
50
相关试卷
这是一份2025届高考数学二轮专题复习与测试专题强化练十四微专题3成对数据的统计分析,共7页。
这是一份高考数学专题五概率与统计 微专题33 统计与成对数据的统计分析课件PPT,共60页。PPT课件主要包含了考点二回归分析,所以可得如下数据,考点三独立性检验,由频数分布表知μ=,∴列联表为,临界值表,方法二调整后的等内容,欢迎下载使用。
这是一份微专题44 统计与成对数据的统计分析-2024高考数学二轮复习微专题,共34页。试卷主要包含了5%,所以A错误;,9,10)=0,635,,5万元的农户比率估计为6%,2,,484>6,9-7等内容,欢迎下载使用。