2025年高考数学一轮复习-7.3-统计与成对数据的统计分析-专项训练【含答案】
展开一、单项选择题
1.根据分类变量X与Y的成对样本数据,计算得到χ2=6.147.依据α=0.01的独立性检验x0.01=6.635,结论为( )
A.变量x与y不独立
B.变量x与y不独立,这个结论犯错误的概率不超过0.01
C.变量x与y独立
D.变量x与y独立,这个结论犯错误的概率不超过0.01
2.研究变量x,y得到一组样本数据,进行回归分析,以下说法中错误的是( )
A.若变量x和y之间的相关系数为r=-0.992,则变量x和y之间的负相关很强
B.用决定系数R2来比较两个模型拟合效果,R2越大,表示残差平方和越小,即模型的拟合效果越好
C.在经验回归方程y=-2x+0.8中,当解释变量x每增加1个单位时,响应变量y平均减少2个单位
D.经验回归直线y=bx+a至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个
3.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( )
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
4.云计算是信息技术发展的集中体现,近年来,我国云计算市场规模持续增长.已知某科技公司2018年至2022年云计算市场规模数据,且市场规模y与年份代码x的关系可以用模型y=c1ec2x(其中e为自然对数的底数)拟合,设z=ln y,得到数据统计表如下:
由上表可得经验回归方程z=0.52x+a,则2025年该科技公司云计算市场规模y的估计值为( )
A.e5.08 B.e5.6
C.e6.12 D.e6.5
5.某新能源汽车生产公司,为了研究某生产环节中两个变量x,y之间的相关关系,统计样本数据得到如下表格:
由表格中的数据可以得到y与x的经验回归方程为y=14x+a,据此计算,下列选项中残差的绝对值最小的样本数据是( )
A.(30,4.6) B.(27,3)
C.(25,3) D.(23,2.4)
6.足球是一项大众喜爱的运动,为了解喜爱足球是否与性别有关,随机抽取了若干人进行调查,抽取女性人数是男性的2倍,男性喜爱足球的人数占男性人数的56,女性喜爱足球的人数占女性人数的13,若本次调查得出“在犯错误的概率不超过0.005的前提下认为喜爱足球与性别有关”的结论,则被调查的男性至少有( )
A.10人 B.11人
C.12人 D.13人
二、多项选择题
7.自然环境中,大气压受到各种因素的影响,如温度、湿度、风速和海拔等方面的改变,都将导致大气压发生相应的变化,其中以海拔的影响最为显著.如图是根据一组观测数据得到海拔6~15 km的大气压强散点图,根据一元线性回归模型得到经验回归方程为y1=-4.0x+68.5,决定系数为R12=0.99;根据非线性回归模型得到经验回归方程为y2=132.9e-0.163x,决定系数为 R22=0.99,则下列说法正确的是( )
A.由经验回归散点图可知,大气压强与海拔高度负相关
B.由经验回归方程y1=-4.0x+68.5可知,海拔每升高1 km,大气压强必定降低4.0 kPa
C.由经验回归方程y1=-4.0x+68.5可知,样本点(11,22.6)的残差为-1.9
D.对比两个回归模型,结合实际情况,经验回归方程y2=132.9e-0.163x的预报效果更好
8.“天宫课堂”是为发挥中国空间站的综合效益,推出的首个太空科普教育品牌.为了解学生对“天宫课堂”的喜爱程度,某学校从全校学生中随机抽取200名学生进行问卷调查,得到以下数据,则( )
参考公式及数据:
①χ2=nad−bc2a+bc+da+cb+d,n=a+b+c+d.
②当α=0.05时,xα=3.841.
A.从这200名学生中任选1人,已知选到的是男生,则他喜欢天宫课堂的概率为25
B.用样本的频率估计概率,从全校学生中任选3人,恰有2人不喜欢天宫课堂的概率为964
C.根据小概率值α=0.05的独立性检验,认为喜欢天宫课堂与性别没有关联
D.对抽取的喜欢天宫课堂的学生进行天文知识测试,男生的平均成绩为80,女生的平均成绩为90,则参加测试的学生成绩的均值为85
三、填空题
9.某工厂为研究某种产品产量x(单位:t)与所需某种原材料y(单位:t)的相关性,在生产过程中收集4组对应数据(x,y)如下表所示:
根据表中数据,得出y关于x的经验回归方程为y=0.7x+a.据此计算出在样本点(4,3)处的残差为-0.15,则a的值为________,表中m的值为________.
10.如图是调查某学校高一年级男、女学生是否喜欢徒步运动而得到的等高堆积条形图,阴影部分表示喜欢徒步的频率.已知该年级男生500人、女生400人(假设所有学生都参加了调查),现从所有喜欢徒步的学生中按分层随机抽样的方法抽取23人,则抽取的男生人数为________.
四、解答题
11.甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)依据小概率值α=0.1的独立性检验,能否以此推断甲、乙两城之间的长途客车是否准点与客车所属公司有关?
附:χ2=nad−bc2a+bc+da+cb+d,
12.移动物联网广泛应用于生产制造、公共服务、个人消费等领域.截至2022年底,我国移动物联网连接数达18.45亿户,成为全球主要经济体中首个实现“物超人”的国家.如图所示是2018-2022年移动物联网连接数w与年份代码t的散点图,其中年份2018-2022对应的t分别为1~5.
(1)根据散点图推断两个变量是否线性相关.计算样本相关系数(精确到0.01),并推断它们的相关程度;
(2)①假设变量x与变量Y的n对观测数据为(x1,y1),(x2,y2),…,(xn,yn),两个变量满足一元线性回归模型Y=bx+e,Ee=0,De=σ2,(随机误差ei=yi-bxi).请推导:当随机误差平方和Q=取得最小值时,参数b的最小二乘估计;
②令变量x=t-t,y=w-w,则变量x与变量Y满足一元线性回归模型Y=bx+e,Ee=0,De=σ2,利用①中结论求y关于x的经验回归方程,并预测2024年移动物联网连接数.
附:样本相关系数r=
参考数据:i=15wi−w2=76.9,i=15ti−t(wi-w)=27.2,i=15wi=60.8,769≈27.7.
13.随着全球新能源汽车市场蓬勃增长,在政策推动下,中国新能源汽车企业在10余年间实现了“弯道超车”,一跃成为新能源汽车产量连续7年居世界第一的全球新能源汽车强国.某新能源汽车企业基于领先技术的支持,改进并生产纯电动车、插电混合式电动车、氢燃料电池车三种车型,生产效益在短期内逐月攀升,该企业在1月份至6月份的生产利润y(单位:百万元)关于月份x的数据如下表所示,并根据数据绘制了如图所示的散点图.
(1)根据散点图判断,y=ax+b与y=cedx(a,b,c,d均为常数)哪一个更适宜作为利润y关于月份x的经验回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的结果及表中的数据,求出y关于x的回归方程.
(3)该车企为提高新能源汽车的安全性,近期配合中国汽车技术研究中心进行了包括跌落、追尾、多车碰撞等一系列安全试验项目,其中在实验场进行了一项甲、乙、丙三车同时去碰撞实验车的多车碰撞实验,测得实验车报废的概率为0.188,并且当只有一车碰撞实验车发生,实验车报废的概率为0.1,当有两车碰撞实验车发生,实验车报废的概率为0.2,由于各种因素,实验中甲、乙、丙三车碰撞实验车发生概率分别为0.7,0.5,0.4,且互不影响,求当三车同时碰撞实验车发生时实验车报废的概率.
参考数据:
其中,设u=ln y,ui=ln yi(i=1,2,3,4,5,6).
参考公式:对于一组具有线性相关关系的数据(xi,yi)(i=1,2,3,…,n),其经验回归方程y=βx+α的斜率和截距的最小二乘估计公式分别为β=,α=y-βx.
参考答案
1.C [按照独立性检验的知识及比对的参数值,当χ2=6.147,我们可以下结论变量x与y独立.故排除选项A,B;依据α=0.01的独立性检验(x0.01=6.635),6.147<6.635,所以我们不能得到“变量x与y独立,这个结论犯错误的概率不超过0.01”这个结论.故C正确,D错误.故选C.]
2.D [若变量x和y之间的相关系数为r=-0.992,则变量x和y之间的负相关很强,A正确;
用决定系数R2来比较两个模型拟合效果,R2越大,表示残差平方和越小,即模型的拟合效果越好,B正确;在经验回归方程y=-2x+0.8中,当解释变量x每增加1个单位时,响应变量y平均减少2个单位,C正确;经验回归直线y=bx+a必过(x,y),但不一定过样本点,D错误.故选D.]
3.C [因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z=by+a,b>0,则z=by+a=-0.1bx+b+a,故x与z负相关.故选C.]
4.B [因为x=3,z=3,
所以a=z-0.52x=3-3×0.52=1.44,
即经验回归方程z=0.52x+1.44,
当x=8时,z=0.52×8+1.44=5.6,
所以y=ez=e5.6,即2025年该科技公司云计算市场规模y的估计值为e5.6.
故选B.]
5.C [由表格数据知:x=20+23+25+27+305=25,y=2+2.4+3+3+4.65=3,
∴a=y−14x=3-254=-134,
∴经验回归方程为y=14x-134.
对于A,残差的绝对值为4.6−14 ×30−134=0.35;
对于B,残差的绝对值为3−14×27−134=0.5;
对于C,残差的绝对值为3−14×25−134=0;
对于D,残差的绝对值为2.4−14×23−134=0.1;
∴残差绝对值最小的样本数据是(25,3).故选C.]
6.C [设被调查的男性为x人,则女性为2x人,依据题意可得列联表如下表:
χ2=3x5x6·4x3−2x3·x623x2·3x2·x·2x=2x3,因为本次调查得出“在犯错误的概率不超过0.005的前提下认为喜爱足球与性别有关”的结论,所以有χ2≥7.879,即2x3≥7.879,
解得x≥11.818 5,又因为上述列联表中的所有数字均为整数,故x的最小值为12.故选C.]
7.ACD [由图象知,海拔高度越高,大气压强越低,所以大气压强与海拔高度负相关,A正确;
由经验回归直线得到的数据为估计值,而非精确值,B错误;
当x=11时,y1=-4.0×11+68.5=24.5,又由散点图知观测值为22.6,所以样本点(11,22.6)的残差为22.6-24.5=-1.9,C正确;
随着海拔高度的增加,大气压强越来越小,但不可能为负数,因此经验回归方程y2=132.9e-0.163x的预报效果更好,D正确.故选ACD.]
8.BC [从这200名学生中任选1人,已知选到的是男生,则他喜欢天宫课堂的概率P=8080+20=45,A错误;
样本中喜欢天宫课堂的频率为80+70200=34,从全校学生中任选3人,
恰有2人不喜欢天宫课堂的概率P1=C321−342×34=964,B正确;
因为χ2=200×80×30−70×202100×100×150×50≈2.667<3.841,所以根据小概率值α=0.05的独立性检验,认为喜欢天宫课堂与性别没有关联,C正确;
抽取的喜欢天宫课堂的学生男、女生人数分别为80,70,
又男生的平均成绩为80,女生的平均成绩为90,所以参加测试的学生成绩的均值为80×80+70×9080+70=2543,D错误.故选BC.]
9.0.35 4.5 [由在样本点(4,3)处的残差为-0.15,可得当x=4时,y=3.15,即3.15=0.7×4+a,解得a=0.35.又x=14(3+4+5+6)=4.5,y=14(2.5+3+4+m)=14(9.5+m),经验回归直线过点x,y,所以14(9.5+m)=0.7×4.5+0.35,解得m=4.5.]
10.15 [根据等高堆积条形图可知: 喜欢徒步的男生人数为0.6×500=300,喜欢徒步的女生人数为0.4×400=160,
所以喜欢徒步的总人数为300+160=460,
按分层随机抽样的方法抽取23人,则抽取的男生人数为300460×23=15.]
11.解:(1)根据表中数据,A家公司共有班次260次,准点班次有240次,设A家公司长途客车准点事件为M,
则P(M)=240260=1213.
B家公司共有班次240次,准点班次有210次,
设B家公司长途客车准点事件为N,
则P(N)=210240=78.
所以A家公司长途客车准点的概率为1213,
B家公司长途客车准点的概率为78.
(2)补充列联表如下.
零假设为H0:甲、乙两城之间的长途客车是否准点与客车所属公司无关.根据2×2列联表,可得χ2=nad−bc2a+bc+da+cb+d=500×240×30−210×202260×240×450×50≈3.205>2.706=x0.1.
根据小概率值α=0.1的独立性检验,我们推断H0不成立,即认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
12.解:(1)由散点图可以看出样本点都集中在一条直线附近,由此推断两个变量线性相关.
因为t=15(1+2+3+4+5)=3,所以
=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10,
所以r==27.210×76.9=27.2769≈27.227.7≈0.98,
所以这两个变量正线性相关,且相关程度很强.
(2)①Q=i=1nei2=i=1nyi−bxi2=i=1nyi2−2bxiyi+b2xi2=b2i=1nxi2−2bi=1nxiyi+i=1nyi2,
要使Q取得最小值,当且仅当b=
所以y关于x的经验回归方程为y=2.72x,
所以当t=7 时,
则x=7-3=4,w=y+w=2.72×4+12.16=23.04,
所以预测2024年移动物联网连接数为23.04亿户.
13.解:(1)散点图中的点的分布不是一条直线,相邻两点在y轴上的差距是增大的趋势,故选用y=cedx作为利润y关于月份x的经验回归方程更合适.
(2)由y=cedx,两边同时取对数得ln y=ln c=dx,
由u=ln y,则u=dx+ln c
x=1+2+3+4+5+66=3.5,i=16xi−x2=17.50,i=16xi−xui-u=6.30,u=2.80,
所以d==6.3017.5=0.36,
所以ln c=u-dx=2.80-0.36×3.5=1.54,
所以ln y=1.54+0.36x,
所以y=e1.54+0.36x.
(3)设事件B为“实验车报废”,事件A1为“只有一车碰撞试验车”,事件A2为“恰有两车碰撞试验车”,事件A3为“三车碰撞试验车”,
则P(A1)=(1-0.7)×(1-0.5)×0.4+(1-0.7)×0.5×(1-0.4)+0.7×(1-0.5)×(1-0.4)
=0.3×0.5×0.4+0.3×0.5×0.6+0.7×0.5×0.6=0.36,
P(A2)=(1-0.7)×0.5×0.4+0.7×(1-0.5)×0.4+0.7×0.5×(1-0.4)
=0.3×0.5×0.4+0.7×0.5×0.4+0.7×0.5×0.6=0.41,
P(A3)=0.7×0.5×0.4=0.14,
由已知得P(B|A1)=0.1,P(B|A2)=0.2,
利用全概率公式得
P(B)=P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3)
=0.36×0.1+0.41×0.2+0.14×P(B|A3)=0.188,
解得P(B|A3)=0.5,
所以当三车同时碰撞实验车发生时实验车报废的概率为0.5
年份
2018年
2019年
2020年
2021年
2022年
年份代码x
1
2
3
4
5
云计算市场规
模y/千万元
7.4
11
20
36.6
66.7
z=ln y
2
2.4
3
3.6
4
x
20
23
25
27
30
y
2
2.4
3
3
4.6
α
0.10
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
性别
天宫课堂
喜欢天宫课堂
不喜欢天宫课堂
男生
80
20
女生
70
30
x
3
4
5
6
y
2.5
3
4
m
运营公司
班次数
准点
未准点
A
240
20
B
210
30
α
0.100
0.050
0.010
xα
2.706
3.841
6.635
月份x
1
2
3
4
5
6
生产利润y/百万元
6.8
8.6
16.1
19.6
28.1
40.0
y
u
i=16(xi−x)2
i=16(xi−x)·yi-y
i=16(xi−x)·ui-u
19.87
2.80
17.50
113.75
6.30
足球
性别
合计
男性
女性
喜爱足球
5x6
2x3
3x2
不喜爱足球
x6
4x3
3x2
合计
x
2x
3x
运营公司
班次数
合计
准点
未准点
A
240
20
260
B
210
30
240
合计
450
50
500
2025年高考数学一轮复习-成对数据的统计分析-专项训练【含答案】: 这是一份2025年高考数学一轮复习-成对数据的统计分析-专项训练【含答案】,共7页。
2025年高考数学一轮复习-7.3-统计与成对数据的统计分析-专项训练【含答案】: 这是一份2025年高考数学一轮复习-7.3-统计与成对数据的统计分析-专项训练【含答案】,共12页。
2025版高考数学一轮总复习知识梳理训练题第9章统计成对数据的统计分析第2讲成对数据的统计分析: 这是一份2025版高考数学一轮总复习知识梳理训练题第9章统计成对数据的统计分析第2讲成对数据的统计分析,共6页。试卷主要包含了相关关系,散点图,正相关、负相关,变量的线性相关,样本相关系数等内容,欢迎下载使用。