2025版高考数学一轮总复习第9章统计成对数据的统计分析第2讲成对数据的统计分析提能训练
展开一、单选题
1.(2023·广西柳州模拟)根据如下样本数据
得到了经验回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),则( C )
A.eq \(a,\s\up6(^))>0,eq \(b,\s\up6(^))>0 B.eq \(a,\s\up6(^))<0,eq \(b,\s\up6(^))>0
C.eq \(a,\s\up6(^))>0,eq \(b,\s\up6(^))<0 D.eq \(a,\s\up6(^))<0,eq \(b,\s\up6(^))<0
[解析] 画出散点图,易知选C.
2.(2023·浙江杭州统考二模)某兴趣小组研究光照时长x(h)和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,作如图所示的散点图.若去掉D(10,2)后,下列说法正确的是( D )
A.相关系数r变小
B.决定系数R2变小
C.残差平方和变大
D.解释变量x与预报变量y的相关性变强
[解析] 从图中可以看出D(10,2)较其他点,偏离直线远,故去掉D(10,2)后,回归效果更好,相关系数|r|越接近于1,模型的拟合效果越好,若去掉D(10,2)后,相关系数r变大,故A错误;决定系数R2越接近于1,模型的拟合效果越好,若去掉D(10,2)后,决定系数R2变大,故B错误;残差平方和越小,模型的拟合效果越好,若去掉D(10,2)后,残差平方和变小,故C错误;若去掉D(10,2)后,解释变量x与预报变量y的相关性变强,且是正相关,故D正确.
3.(2022·湖南长沙模拟)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y(单位:℃)存在着较强的线性相关关系.某地观测人员根据如表的观测数据,建立了y关于x的线性回归方程eq \(y,\s\up6(^))=0.25x+k,则下列说法不正确的是( D )
A.k的值是20
B.变量x,y呈正相关关系
C.若x的值增加1,则y的值约增加0.25
D.当蟋蟀52次/分鸣叫时,该地当时的气温预报值为33.5 ℃
[解析] 由题意,得eq \x\t(x)=eq \f(1,5)(20+30+40+50+60)=40,eq \x\t(y)=eq \f(1,5)(25+27.5+29+32.5+36)=30,则k=eq \x\t(y)-0.25eq \x\t(x)=30-0.25×40=20,故A正确;由线性回归方程可知,eq \(b,\s\up6(^))=0.25>0,变量x,y呈正相关关系,故B正确;若x的值增加1,则y的值约增加0.25,故C正确;当x=52时,eq \(y,\s\up6(^))=0.25×52+20=33,故D错误.故选D.
4.下列有关回归分析的论断不正确的是( C )
A.若相关系数r满足|r|越接近1,则这两个变量相关性越强
B.若相关指数R2越大,则模型的拟合效果越好
C.若所有样本点都在eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))上,则线性相关系数r=1
D.残差图的带状区域的宽度越窄,模型拟合的精度越高,回归方程的预报精度越高
[解析] 线性相关系数r的绝对值越接近1,表示两变量的相关性越强,不符合题意;相关指数R2越大,模型的拟合效果越好,不符合题意;若所有样本点都在eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))上,则线性相关系数r=1或-1,符合题意;残差图中,残差点的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高不符合题意.故选C.
5.(2023·广西柳州模拟)某高中调查学生对2022年冬奥会的关注是否与性别有关,随机抽样调查150人,进行独立性检验,经计算得χ2=eq \f(nad-bc2,a+bc+da+cb+d)≈5.879,临界值表如下:
则下列说法中正确的是( C )
A.有97.5%的把握认为“学生对2022年冬奥会的关注与性别无关”
B.有99%的把握认为“学生对2022年冬奥会的关注与性别有关”
C.在犯错误的概率不超过2.5%的前提下可认为“学生对2022年冬奥会的关注与性别有关”
D.在犯错误的概率不超过2.5%的前提下可认为“学生对2022年冬奥会的关注与性别无关”
[解析] 由题意可知,χ2=eq \f(nad-bc2,a+bc+da+cb+d)≈5.879>5.024,所以在犯错误的概率不超过2.5%的前提下可认为“学生对2022年冬奥会的关注与性别有关”.故选C.
6.(2024·江西智学联盟体联考)某校对学生记忆力x和判断力y进行统计分析,所得数据如表:
则y关于x的经验回归方程为( B )
eq \b\lc\(\rc\)(\a\vs4\al\c1(附:\(b,\s\up6(^))=\f(\i\su(i=1,n, )xi-\(x,\s\up6(-))yi-\(y,\s\up6(-)),\i\su(i=1,n, )xi-\(x,\s\up6(-))2),\(a,\s\up6(^))=\(y,\s\up6(-))-\(b,\s\up6(^)) \(x,\s\up6(-))))
A.eq \(y,\s\up6(^))=-1.4x+19.4 B.eq \(y,\s\up6(^))=1.4x+2.6
C.eq \(y,\s\up6(^))=1.4x-2.6 D.eq \(y,\s\up6(^))=-1.4x-19.4
[解析] 由表中数据知,随着x的增大,y增大,所以x与y正相关,排除A、D,又eq \(x,\s\up6(-))=eq \f(2+5+6+8+9,5)=6,eq \(y,\s\up6(-))=eq \f(7+8+10+12+18,5)=11,由回归直线过样本中心点(6,11),代入验证知B项正确.故选B.
7.(2023·福建宁德质检)某学校利用实践基地开展劳动教育活动,在其中一块土地上栽种某种蔬菜,并指定一位同学观测其中一棵幼苗生长情况,该同学获得前6天的数据如下:
经这位同学的研究,发现第x天幼苗的高度y(cm)的经验回归方程为eq \(y,\s\up6(^))=2.4x+eq \(a,\s\up6(^)),据此预测第10天这棵幼苗的高度大约为( C )
A.19 cm B.21 cm
C.23 cm D.25 cm
[解析] 由已知得:eq \x\t(x)=eq \f(1+2+3+4+5+6,6)=3.5,eq \x\t(y)=eq \f(1+4+7+9+11+13,6)=7.5,因为经验回归方程为eq \(y,\s\up6(^))=2.4x+eq \(a,\s\up6(^)),所以7.5=2.4×3.5+eq \(a,\s\up6(^)),解得eq \(a,\s\up6(^))=-0.9,当x=10时,eq \(y,\s\up6(^))=2.4×10-0.9=23.1,所以预测第10天这棵幼苗的高度大约为23 cm.
8.(2024·陕西、青海部分学校联考)第19届亚运会将于2023年9月23日至10月8日在杭州举行,某网络直播平台调研“大学生是否喜欢观看体育比赛直播与性别有关”,从某高校男、女生中各随机抽取100人进行问卷调查,得到如下数据(5≤m≤15,m∈N).
通过计算,有95%以上的把握认为大学生喜欢观看直播体育比赛与性别有关,则在被调查的100名女生中喜欢观看体育比赛直播的人数的最大值为( C )
附:χ2=eq \f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.
A.55 B.57
C.58 D.60
[解析] 因为χ2=eq \f(nad-bc2,a+bc+da+cb+d)
=eq \f(200[80-m50-m-20+m50+m]2,100×100×130×70)
=eq \f(815-m2,91)≥3.841,所以(15-m)2≥43.7,又5≤m≤15,m∈N,
所以15-m≥7,解得m≤8,故在被调查的100名女生中喜欢观看体育比赛直播的人数的最大值为58.
二、多选题
9.(2024·安徽A10联盟联考)电影《八角笼中》是由王宝强导演并参演的一部电影,讲述了年轻人为理想而努力奋斗的故事.该电影一上映就引起了广大观众的热议,票房也超出了预期,现随机抽取若干名观众进行调查,所得数据统计如下表所示,则( AC )
附:
A.若在被调查的观众中随机抽取1人,则抽到喜欢该电影的男性观众的概率为eq \f(2,5)
B.在被调查的观众中,男性不喜欢该电影的比例高于女性
C.根据小概率值α=0.05的独立性检验,可以认为被调查观众的性别与对电影的喜爱程度有差异
D.根据小概率值α=0.01的独立性检验,可以认为被调查观众的性别与对电影的喜爱程度有差异
[解析] 根据题意,喜欢该电影的男性观众有160人,可得eq \f(160,400)=eq \f(2,5),所以A正确;由男性不喜欢该电影的比例为eq \f(40,200),女性不喜欢该电影的比例为eq \f(60,200),可得eq \f(60,200)>eq \f(40,200),所以B错误;由χ2=eq \f(400×160×60-140×402,300×100×200×200)=eq \f(16,3)≈5.333,因为3.841<5.333<6.635,所以C正确,D错误.故选AC.
10.(2024·云南师大附中、江苏苏州中学开学考)已知变量x,y之间的经验回归方程为eq \(y,\s\up6(^))=7.6-0.4x,且变量x,y的数据如图所示,则下列说法正确的是( BC )
A.变量x,y之间呈正相关关系
B.实数m的值等于5
C.该回归直线必过(9,4)
D.相应于(10,3)的残差估计值为0.6
[解析] 由表格数据得,eq \(x,\s\up6(-))=eq \f(6+8+10+12,4)=9,eq \(y,\s\up6(-))=eq \f(6+m+3+2,4)=eq \f(11+m,4),将样本中心点eq \b\lc\(\rc\)(\a\vs4\al\c1(9,\f(11+m,4)))代入回归直线方程eq \(y,\s\up6(^))=7.6-0.4x得,eq \f(11+m,4)=7.6-0.4×9,解得m=5.所以B正确;又eq \f(11+m,4)=4,即样本中心点为(9,4),所以C正确;当变量x增加,变量y相应值减少,两个变量之间呈负相关关系,所以A错误;令x=10,得预测值eq \(y,\s\up6(^))=3.6,则相应于(10,3)的残差为3-3.6=-0.6,所以D错误.故选BC.
11.(2024·浙江绍兴诊断)由变量x和变量y组成的10个成对样本数据(x1,y1),(x2,y2),…,(x10,y10)得到的经验回归方程为eq \(y,\s\up6(^))=2x-0.1,设过点(x2,y2),(x9,y9)的直线方程为y=mx+n,记eq \x\t(x)=eq \f(1,10)eq \i\su(i=1,10,x)i,eq \(y,\s\up6(-))=eq \f(1,10)eq \i\su(i=1,10,y)i,则( ABD )
A.变量x,y正相关
B.若eq \x\t(x)=1,则eq \x\t(y)=1.9
C.经验回归直线eq \(y,\s\up6(^))=2x-0.1至少经过(xi,yi)(i=1,2,…,10)中的一个点
D.eq \i\su(i=1,10, )(yi-2xi+0.1)2≤eq \i\su(i=1,10, )(yi-mxi-n)2
[解析] 回归方程一次项系数大于零是正相关,A正确;eq \x\t(x)=1代入回归直线可得eq \x\t(y)=2×1-0.1=1.9,B正确;经验回归直线可以不经过任意一个点,C错误;根据回归直线的求法最小二乘法值,回归直线的残差平方和最小,D正确.故选ABD.
三、填空题
12.现从某市市民中随机抽取300人对是否使用互联网购物进行调查,得到下列2×2的列联表:
根据表中数据,我们得到的统计学的结论是:有 95% 的把握认为“使用互联网购物与年龄有关”.
附:
其中χ2=eq \f(nad-bc2,a+bc+da+cb+d),n=a+b+c+d.
[解析] 由条件可得如下表:
χ2=eq \f(300165×30-60×452,210×90×75×225)=eq \f(100,21)≈4.762>3.841,
所以有95%的把握认为“使用互联网购物与年龄有关”.
13.(2023·湖南郴州九校联盟适应性测试)已知某种商品的直播平台支出x(单位:万元)与农产品销售额y(单位:万元)之间有如下对应数据:
根据上表可得线性回归方程eq \(y,\s\up6(^))=6x+eq \(a,\s\up6(^)),但由于操作员不慎,导致一个数据丢失,但可以知道(eq \x\t(x),eq \x\t(y))在函数y=x2的图象上,据此估计,可以得到m的值为 19.5 ;当投入12万元时,销售额大约为 67 万元.
[解析] 由题表可知:eq \x\t(x)=eq \f(2+3+4+6+7+8,6)=5,∵(eq \x\t(x),eq \x\t(y))在函数y=x2的图象上,∴eq \x\t(y)=52=25,∴eq \x\t(y)=eq \f(7.5+11.5+m+31.5+36.5+43.5,6)=25,
解得m=19.5,
又(eq \x\t(x),eq \x\t(y))满足线性回归方程eq \(y,\s\up6(^))=6x+eq \(a,\s\up6(^)),
则eq \(a,\s\up6(^))=25-6×5=-5,∴eq \(y,\s\up6(^))=6x-5,
当x=12时,∴y=6×12-5=67(万元).
四、解答题
14.(2024·浙江县中联盟联考)为研究农药A对农作物成长的功效,在甲、乙两块试验田播种同一种农作物,甲试验田喷洒农药A,乙试验田没有喷洒农药A,经过一段时间后,从甲、乙两块试验田各随机选取100株幼苗,统计200株幼苗高度(单位:cm)如下表:
(1)分别求甲、乙两块试验田中幼苗的平均高度的估计值(同一组中的数据以该组区间的中点值为代表);
(2)分别统计样本中甲、乙两块试验田幼苗高度小于10 cm和不小于10 cm的株数,完成下列联表,并依据小概率α=0.01的独立性检验,分析是否喷洒农药A与幼苗生长的高度有关联?
附:
χ2=eq \f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d
[解析] (1)样本平均数为:
eq \x\t(x)甲=eq \f(1,100)×(10×7+15×9+55×11+20×13)=10.7,
eq \x\t(x)乙=eq \f(1,100)×(10×7+35×9+45×11+10×13)=10.1.
所以估计甲块试验田中幼苗的平均高度为10.7 cm;估计乙块试验田中幼苗的平均高度为10.1 cm.
(2)列联表为:
零假设为H0:喷洒农药A与幼苗生长的高度无关联.
根据列联表中数据,可得
χ2=eq \f(200×75×45-55×252,130×70×100×100)=eq \f(800,91)≈8.791>6.635=x0.01,
根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为喷洒农药A与幼苗生长的高度有关联,此推断犯错的概率不大于0.01.
15.(2023·河南郑州模拟)已知某种汽车新购入价格为14万元,但随着使用年限增加汽车会贬值.通过调查发现使用年限x(单位:年)与出售价y(单位:万元)之间的关系有如下一组数据:
(1)求y关于x的回归方程;
(2)已知R2=1-eq \f(\i\su(i=1,n, )yi-\(y,\s\up6(^))i2,\i\su(i=1,n, )yi-\(y,\s\up6(-))2),当R2≥0.9时,回归方程的拟合效果非常好;当0.8
[解析] (1)由题意,得eq \(x,\s\up6(-))=eq \f(1,5)×(1+2+4+8+10)=5,eq \(y,\s\up6(-))=eq \f(1,5)×(12+10+7+6+5)=8,eq \i\su(i=1,5,x)iyi-5eq \(x,\s\up6(-))·eq \(y,\s\up6(-))=158-200=-42,eq \i\su(i=1,5, )(xi-eq \(x,\s\up6(-)))2=60,eq \(b,\s\up6(^))=eq \f(\i\su(i=1,5,x)iyi-5\(x,\s\up6(-))·\(y,\s\up6(-)),\i\su(i=1,5, )xi-\(x,\s\up6(-))2)=-0.7,eq \(a,\s\up6(^))=8+0.7×5=11.5,所以所求回归方程是eq \(y,\s\up6(^))=-0.7x+11.5.
(2)列出残差表:
所以eq \i\su(i=1,5, )(yi-eq \(y,\s\up6(^))i)2=4.6,eq \i\su(i=1,5, )(yi-eq \(y,\s\up6(-)))2=34,R2≈0.865,∴0.8
B组能力提升
1.(2023·河北秦皇岛部分学校联考)某企业秉承“科学技术是第一生产力”的发展理念,投入大量科研经费进行技术革新,该企业统计了最近6年投入的年科研经费x(单位:百万元)和年利润y(单位:百万元)的数据,并绘制成如图所示的散点图.已知x,y的平均值分别为eq \x\t(x)=7,eq \x\t(y)=10.甲统计员得到的回归方程为eq \(y,\s\up6(^))=1.69x+eq \(a,\s\up6(^));乙统计员得到的回归方程为eq \(y,\s\up6(^))=;若甲、乙二人计算均未出现错误,则以下结论正确的为( ABD )
A.当投入年科研经费为20(百万元)时,按乙统计员的回归方程可得年利润估计值为75.6(百万元)(取e3.4=30)
B.eq \(a,\s\up6(^))=-1.83
C.方程eq \(y,\s\up6(^))=1.69x+eq \(a,\s\up6(^))比方程eq \(y,\s\up6(^))=拟合效果好
D.y与x正相关
[解析] 将x=20代入eq \(y,\s\up6(^))=得eq \(y,\s\up6(^))=75.6,A正确;
将eq \x\t(x)=7,eq \x\t(y)=10代入eq \(y,\s\up6(^))=1.69x+eq \(a,\s\up6(^))得eq \(a,\s\up6(^))=-1.83,B正确;
由散点图可知,回归方程eq \(y,\s\up6(^))=比eq \(y,\s\up6(^))=1.69x+eq \(a,\s\up6(^))的拟合效果更好,C错误;
因为y随x的增大而增大,所以y与x正相关,D正确.故选ABD.
2.(2024·贵州高三开学考试)某学校高三年级于2023年5月初进行了一次高三数学备考前测试.按照分数大于或等于120的同学评价为“优秀生”,其他分数的同学评价为“潜力生”进行整体水平评价,得到下面表(1)所示的列联表.已知在这105人中随机抽取1人,成绩优秀的概率为eq \f(2,7),根据表(2)的数据可断定下列说法正确的是( BC )
表(1)
表(2)
A.列联表中c的值为30,b的值为35
B.列联表中c的值为20,b的值为45
C.根据列联表中的数据,有95%的把握认为成绩与班级有关
D.根据列联表中的数据,没有95%的把握认为成绩与班级有关
[解析] 因为在这105人中随机抽取1人,成绩优秀的概率为eq \f(2,7),所以“优秀生”的人数为105×eq \f(2,7)=30,“潜力生”的人数为105-30=75,所以c=20,b=45,因为χ2=eq \f(105×10×30-20×452,30×75×55×50)≈6.11>3.84.所以有95%的把握认为成绩与班级有关,故选BC.
3.(2023·湖南岳阳模拟)国家发改委和住建部等六部门发布通知,提到:2025年,农村生活垃圾无害化处理水平将明显提升.现阶段我国生活垃圾有填埋、焚烧、堆肥等三种处理方式,随着我国生态文明建设的不断深入,焚烧处理已逐渐成为主要方式.根据国家统计局公布的数据,对2013~2020年全国生活垃圾焚烧无害化处理厂的个数y(单位:座)进行统计,得到如下表格:
(1)根据表格中的数据,可用一元线性回归模型刻画变量y与变量x之间的线性相关关系,请用相关系数加以说明(精确到0.01);
(2)求出y关于x的经验回归方程,并预测2022年全国生活垃圾焚烧无害化处理厂的个数;
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,还能用(2)所求的经验回归方程预测吗?请简要说明理由.
参考公式:相关系数r=eq \f(\i\su(i=1,n, )xi-\(x,\s\up6(-))yi-\(y,\s\up6(-)),\r(\i\su(i=1,n, )xi-\(x,\s\up6(-))2\i\su(i=1,n, )yi-\(y,\s\up6(-))2)),回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))中斜率和截距的最小二乘法估计公式分别为eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n, )xi-\(x,\s\up6(-))yi-\(y,\s\up6(-)),\i\su(i=1,n, )xi-\(x,\s\up6(-))2),eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))x
参考数据:eq \i\su(i=1,8,y)i=2 292,eq \i\su(i=1,8,x)eq \\al(2,i)=204,eq \i\su(i=1,8,y)eq \\al(2,i)=730 348,eq \i\su(i=1,8,x)iyi=12 041,5732=328 329,eq \r(105)≈10.25,eq \r(7 369)≈85.84
[解析] (1)eq \(x,\s\up6(-))=eq \f(1+2+3+4+5+6+7+8,8)=eq \f(9,2),eq \(y,\s\up6(-))=eq \f(2 292,8)=eq \f(573,2).
相关系数r=eq \f(\i\su(i=1,n, )xi-\(x,\s\up6(-))yi-\(y,\s\up6(-)),\r(\i\su(i=1,n, )xi-\(x,\s\up6(-))2\i\su(i=1,n, )yi-\(y,\s\up6(-))2))
=eq \f(\i\su(i=1,8,x)iyi-8\(x,\s\up6(-))·\(y,\s\up6(-)),\r(\i\su(i=1,8,x)\\al(2,i)-8\(x,\s\up6(-))2\i\su(i=1,8,y)\\al(2,i)-8\(y,\s\up6(-))2))
=eq \f(12 041-8×\f(9,2)×\f(573,2),\r(\b\lc\(\rc\)(\a\vs4\al\c1(204-8×\f(81,4)))\b\lc\(\rc\)(\a\vs4\al\c1(730 348-8×\f(328 329,4)))))
=eq \f(1 727,\r(42)×\r(73 690))≈eq \f(1 727,20.5×85.84)≈0.98,
因为y与x的相关系数r=0.98,接近1,所以y与x的线性相关程度很高,可用线性回归模型拟合y与x的关系.
(2)eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n, )xi-\(x,\s\up6(-))yi-\(y,\s\up6(-)),\i\su(i=1,n, )xi-\(x,\s\up6(-))2)=eq \f(\i\su(i=1,8,x)iyi-8\(x,\s\up6(-))·\(y,\s\up6(-)),\i\su(i=1,8,x)\\al(2,i)-8\(x,\s\up6(-))2)
=eq \f(12 041-8×\f(9,2)×\f(573,2),204-8×\f(81,4))=eq \f(1 727,42)≈41.12,
eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^)) eq \(x,\s\up6(-))≈eq \f(573,2)-41.12×eq \f(9,2)=101.46,
所以y与x的线性回归方程为eq \(y,\s\up6(^))=41.12x+101.46,
又2022年对应的年份代码x=10,当x=10时,eq \(y,\s\up6(^))=41.12×10+101.46=512.66≈513,
所以预测2022年全国生活垃圾焚烧无害化处理厂的个数为513.
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,不能由(2)所求的线性回归方程预测,理由如下(说出一点即可):
①线性回归方程具有时效性,不能预测较远情况;
②全国生活垃圾焚烧无害化处理厂的个数有可能达到上限,一段时间内不再新建;
③受国家政策的影响,可能产生新的生活垃圾无害化处理方式.
4.(2023·广东四校联考)每年的3月21日是世界睡眠日,保持身体健康的重要标志之一就是有良好的睡眠,某机构为了调查参加体育锻炼对睡眠的影响,从辖区内同一年龄层次的常参加体育锻炼和不常参加体育锻炼的人中,各抽取了100人,通过问询的方式得到他们在一周内的睡眠时间(单位:小时),并绘制出如下频率分布直方图.
若每周的睡眠时间不少于44小时的列为“睡眠足”,每周的睡眠时间在44小时以下的列为“睡眠不足”,请根据已知条件完成下列2×2列联表,并依据小概率值α=0.01的独立性检验,分析“睡眠足”与“常参加体育锻炼”是否有关?
[解析] 根据频率分布直方图可得:
常参加体育锻炼且睡眠足的人数为:
100×4×(0.042 5+0.062 5+0.062 5+0.02)=75,
常参加体育锻炼且睡眠不足的人数为:100-75=25,
不常参加体育锻炼且睡眠足的人数为:
100×4×(0.072 5+0.035+0.015+0.015)=55,
不常参加体育锻炼且睡眠不足的人数为:
100-55=45,
绘制列联表如下:
2=eq \f(200×75×45-25×552,100×100×130×70)≈8.791>6.635,
因此有99%的把握认为“睡眠足”与“常参加体育锻炼”有关.
5.(2023·福建泉州质检)港珠澳大桥海底隧道是当今世界上埋深最大、综合技术难度最高的沉管隧道,建设过程中突破了许多世界级难题,其建成标志着我国在隧道建设领域已达到世界领先水平.在开挖隧道施工过程中,若隧道拱顶下沉速率过快,无法保证工程施工的安全性,则需及时调整支护参数、某施工队对正在施工的隧道工程进行下沉量监控量测工作,通过对监控量测结果进行回归分析,建立前t天隧道拱顶的累加总下沉量z(单位:毫米)与时间t(单位:天)的回归方程,通过回归方程预测是否需要调整支护参数.已知该隧道拱顶下沉的实测数据如下表所示:
研究人员制作相应散点图,通过观察,拟用函数z=kebt进行拟合.令u=ln z,计算得:eq \(z,\s\up6(-))=1.24,eq \i\su(i=1,7, )(ti-eq \(t,\s\up6(-)))(zi-eq \(z,\s\up6(-)))=22.37,eq \i\su(i=1,7, )(zi-eq \(z,\s\up6(-)))2=27.5;eq \(u,\s\up6(-))=-1.2,eq \i\su(i=1,7, )(ti-eq \(t,\s\up6(-)))(ui-eq \(u,\s\up6(-)))=25.2,eq \i\su(i=1,7, )(ui-eq \(u,\s\up6(-)))2=30.
(1)请判断是否可以用线性回归模型拟合u与t的关系;(通常|r|>0.75时,认为可以用线性回归模型拟合变量间的关系)
(2)试建立z与t的回归方程,并预测前8天该隧道拱顶的累加总下沉量;
(3)已知当拱顶下沉速率超过9毫米/天,支护系统将超负荷,隧道有塌方风险.若规定每天下午6点为调整支护参数的时间,试估计最迟在第几天需调整支护参数,才能避免塌方.
附:①相关系数r=eq \f(\i\su(i=1,n, )xi-\(x,\s\up6(-))yi-\(y,\s\up6(-)),\r(\i\su(i=1,n, )xi-\(x,\s\up6(-))2\i\su(i=1,n, )yi-\(y,\s\up6(-))2));
②回归直线eq \(y,\s\up6(^))=eq \(a,\s\up6(^))+eq \(b,\s\up6(^))x中斜率和截距的最小二乘估计公式分别为:eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n, )xi-\(x,\s\up6(-))yi-\(y,\s\up6(-)),\i\su(i=1,n, )xi-\(x,\s\up6(-))2),eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^)) eq \(x,\s\up6(-));
③参考数据:eq \r(210)≈14.5,ln 10≈2.30.
[解析] (1)eq \(t,\s\up6(-))=eq \f(1+2+3+4+5+6+7,7)=4;
eq \i\su(i=1,7, )(ti-eq \(t,\s\up6(-)))2=32+22+12+0+12+22+32=28;
r=eq \f(\i\su(i=1,7, )ti-\(t,\s\up6(-))ui-\(u,\s\up6(-)),\r(\i\su(i=1,7, )ti-\(t,\s\up6(-))2\i\su(i=1,7, )ui-\(u,\s\up6(-))2))=eq \f(25.2,\r(28×30))=eq \f(25.2,2\r(210))≈eq \f(25.2,2×14.5)≈0.86.
∴|r|>0.75可以用线性回归模型拟合变量间的关系.
(2)设z=kebt,则u=ln z=bt+ln k.
b=eq \f(\i\su(i=1,7, )ti-\(t,\s\up6(-))ui-\(u,\s\up6(-)),\i\su(i=1,7, )ti-\(t,\s\up6(-))2)=eq \f(25.2,28)=0.9;
ln k=eq \(u,\s\up6(-))-beq \(t,\s\up6(-))=-1.2-0.9×4=-4.8;
∴k=e-4.8,
z=e0.9t-4.8,当t=8时,z=e0.9×8-4.8=e2.4.
所以预测前8天该隧道拱顶的累加总下沉量为e2.4毫米.
(3)z=e0.9t-4.8,
下沉速率:z′=-4.8,
所以设第n天下沉速率超过9毫米/天,
则:-4.8>9,e0.9n-4.8>10,0.9n-4.8>ln 10,0.9n>2.3+4.8,n>7.9,
所以第8天该隧道拱顶的下沉速率超过9毫米/天,
最迟在第7天需调整支护参数,才能避免塌方.x
3
4
5
6
7
8
y
4.0
2.5
-0.5
0.5
-2.0
-3.0
x(次数/分钟)
20
30
40
50
60
y(℃)
25
27.5
29
32.5
36
α
0.15
0.10
0.05
0.025
0.010
xα
2.072
2.076
3.841
5.024
6.635
记忆力x
2
5
6
8
9
判断力y
7
8
10
12
18
第x天
1
2
3
4
5
6
高度y(cm)
1
4
7
9
11
13
喜欢观看
不喜欢观看
男生
80-m
20+m
女生
50+m
50-m
α
0.15
0.10
0.05
0.010
0.001
xα
2.072
2.706
3.841
6.635
10.828
喜欢该电影
不喜欢该电影
男性观众
160
40
女性观众
140
60
α
0.10
0.05
0.01
0.001
xα
2.706
3.841
6.635
10.828
x
6
8
10
12
y
6
m
3
2
年轻人
非年轻人
总计
经常使用互联网购物
165
225
不常使用互联网购物
合计
90
300
α
0.15
0.10
0.050
0.025
0.010
χα
2.272
2.706
3.841
5.024
6.635
年轻人
非年轻人
总计
经常使用互联网购物
165
60
225
不常使用互联网购物
45
30
75
合计
210
90
300
x
2
3
4
6
7
8
y
7.5
11.5
m
31.5
36.5
43
幼苗高度
[6,8)
[8,10)
[10,12)
[12,14]
甲试验田
10
15
55
20
乙试验田
10
35
45
10
高度<10 cm
高度≥10 cm
喷洒农药A
没有喷洒农药A
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
高度<10 cm
高度≥10 cm
合计
喷洒农药
25
75
100
没有喷洒农药
45
55
100
合计
70
130
200
x
1
2
4
8
10
y
12
10
7
6
5
yi-eq \(y,\s\up6(^))i
1.2
-0.1
-1.7
0.1
0.5
yi-eq \(y,\s\up6(-))
4
2
-1
-2
-3
班级
战绩
合计
优秀生
潜力生
甲班
10
b
乙班
c
30
合计
105
α
0.05
0.01
0.001
xα
3.841
6.635
10.828
年份
2013
2014
2015
2016
2017
2018
2019
2020
年份代码x
1
2
3
4
5
6
7
8
垃圾焚烧无害化
处理厂的个数y
166
188
220
249
286
331
389
463
睡眠足
睡眠不足
总计
常参加体育锻炼人员
不常参加体育锻炼人员
总计
睡眠足
睡眠不足
总计
常参加体育锻炼人员
75
25
100
不常参加体育锻炼人员
55
45
100
总计
130
70
200
t
1
2
3
4
5
6
7
z
0.01
0.04
0.14
0.52
1.38
2.31
4.3
备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第3讲成对数据的统计分析: 这是一份备考2024届高考数学一轮复习分层练习第九章统计与成对数据的统计分析第3讲成对数据的统计分析,共10页。
备考2024届高考数学一轮复习强化训练第九章统计与成对数据的统计分析第3讲成对数据的统计分析: 这是一份备考2024届高考数学一轮复习强化训练第九章统计与成对数据的统计分析第3讲成对数据的统计分析,共3页。试卷主要包含了824 5,6万元等内容,欢迎下载使用。
微专题18 统计与成对数据的统计分析: 这是一份微专题18 统计与成对数据的统计分析,共12页。