所属成套资源:2026届高考数学一轮总复习提能训练练案(70份)
2026届高考数学一轮总复习提能训练练案62成对数据的统计分析
展开
这是一份2026届高考数学一轮总复习提能训练练案62成对数据的统计分析,共13页。试卷主要包含了单选题,多选题,填空题,解答题等内容,欢迎下载使用。
一、单选题
1.(2024·高考天津卷)下列图中,相关性系数最大的是( )
[答案] A
[解析] 观察4幅图可知,A图散点分布比较集中,且大体接近某一条直线,线性回归模型拟合效果比较好,呈现明显的正相关,|r|值相比于其他3图更接近1.故选A.
2.(2025·重庆乌江新高考协作体调研)以下关于统计分析的描述,哪一个是正确的( )
A.样本均值越接近总体均值,样本的代表性越好
B.样本标准差越大,数据的离散程度越小
C.相关系数的绝对值越接近1,表示两个变量的线性关系越弱
D.决定系数R2越接近1,模型的解释能力越强
[答案] D
[解析] 样本均值不能表示样本的代表性,A错;样本标准差越大,数据的离散程度越大,B错;相关系数的绝对值越接近1,表示两个变量的线性关系越强,C错;决定系数R2越接近1,模型的解释能力越强,D对.故选D.
3.(2023·广西柳州模拟)某高中调查学生对2022年冬奥会的关注是否与性别有关,随机抽样调查150人,进行独立性检验,经计算得χ2=eq \f(nad-bc2,a+bc+da+cb+d)≈5.879,临界值表如下:
则下列说法中正确的是( )
A.有97.5%的把握认为“学生对2022年冬奥会的关注与性别无关”
B.有99%的把握认为“学生对2022年冬奥会的关注与性别有关”
C.在犯错误的概率不超过2.5%的前提下可认为“学生对2022年冬奥会的关注与性别有关”
D.在犯错误的概率不超过2.5%的前提下可认为“学生对2022年冬奥会的关注与性别无关”
[答案] C
[解析] 由题意可知,χ2=eq \f(nad-bc2,a+bc+da+cb+d)≈5.879>5.024,所以在犯错误的概率不超过2.5%的前提下可认为“学生对2022年冬奥会的关注与性别有关”.故选C.
4.(2025·四川成都蓉城名校联考)某电影公司为了解某部电影宣传对票房的影响,在某市内随机抽取了5个大型电影院,得到其宣传费用x(单位:十万元)和销售额y(单位:十万元)的数据如下:
由统计数据知y与x满足线性回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),其中eq \(b,\s\up6(^))=6.5,当宣传费用x=10时,销售额y的估计值为( )
A.85.5 B.86.5
C.87.5 D.88.5
[答案] C
[解析] 因为eq \x\t(x)=7,eq \x\t(y)=eq \f(55+60+70+75+80,5)=68.由线性回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))经过点(7,68)且eq \(b,\s\up6(^))=6.5得:eq \(a,\s\up6(^))=68-6.5×7=22.5.所以eq \(y,\s\up6(^))=6.5x+22.5.当x=10时,eq \(y,\s\up6(^))=65+22.5=87.5.故选C.
5.(2024·陕西西安中学模拟)某车间加工零件的数量x与加工时间y的统计数据如表:
现已求得上表数据的回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))中的eq \(b,\s\up6(^))值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为102分钟,则m的值为( )
A.28 B.29
C.30 D.32
[答案] C
[解析] 由题意可知eq \(y,\s\up6(^))=0.9x+eq \(a,\s\up6(^)),且当x=100时,eq \(y,\s\up6(^))=0.9×100+eq \(a,\s\up6(^))=90+eq \(a,\s\up6(^))=102,解得eq \(a,\s\up6(^))=12,可知eq \(y,\s\up6(^))=0.9x+12,又因为eq \x\t(x)=eq \f(18+20+22,3)=20,eq \x\t(y)=eq \f(27+m+33,3)=eq \f(m+60,3),可知点eq \b\lc\(\rc\)(\a\vs4\al\c1(20,\f(m+60,3)))在eq \(y,\s\up6(^))=0.9x+12上,即20×0.9+12=eq \f(m+60,3),解得m=30.故选C.
6.(2025·山东济宁一中质检改编)下列说法错误的是( )
A.将一组数据的每一个数据减去同一个数后,新数据的方差与原数据方差相同
B.线性相关系数r越大,两个变量的线性相关性越强
C.若数据的频率分布直方图为单峰不对称,且在右边“拖尾”,则样本数据的平均数大于中位数
D.在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好
[答案] B
[解析] 由方差的性质可知,将一组数据的每一个数减去同一个数后,新数据的方差与原数据方差相同,故A正确;线性相关系数|r|越大,两个变量的线性相关性越强,故B错误;数据的频率分布直方图为单峰不对称,向右边“拖尾”,大致如下图,由于“右拖”时最高峰偏左,中位数靠近高峰处,平均数靠近中点处,此时平均数大于中位数,故C正确;在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好,故D正确.故选B.
7.(2024·宁夏银川一中模拟)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:
附:
已知在全部105人中随机抽取1人,成绩优秀的概率为eq \f(2,7),则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.根据列联表中的数据,若按97.5%的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,若按97.5%的可靠性要求,不能认为“成绩与班级有关系”
[答案] C
[解析] 由题意知,成绩优秀的学生数是105×eq \f(2,7)=30,成绩非优秀的学生数是75,所以c=20,b=45,故A、B错误;根据列联表中的数据,得到χ2=eq \f(105×10×30-20×452,55×50×30×75)≈6.109>5.024,因此有97.5%的把握认为“成绩与班级有关系”,故C正确,D错误,故选C.
二、多选题
8.(2024·辽宁部分重点高中模拟)已知由样本数据(xi,yi)(i=1,2,3,…,8)组成的一个样本,得到回归直线方程为eq \(y,\s\up6(^))=3x-3,且eq \x\t(x)=3,去除两个歧义点(-1,3)和(1,-3)后,得到新的回归直线的回归系数为2.5,则下列说法正确的是( )
A.相关变量x,y具有正相关关系
B.去除两个歧义点后,随x值增加相关变量y值增加
C.去除两个歧义点后,重新求得回归方程对应的直线一定过点(3,6)
D.去除两个歧义点后,重新求得的回归直线方程为eq \(y,\s\up6(^))=2.5x-2
[答案] ABD
[解析] 因为回归直线的斜率大于0,即相关变量x,y具有正相关关系,故A正确;斜率2.53.841=χ0.050,
所以有95%的把握认为“使用互联网购物与年龄有关”.
四、解答题
10.(2025·高考综合改革适应性演练)为考察某种药物A对预防疾病B的效果,进行了动物(单位:只)试验,得到如下列联表:
(1)求s,t;
(2)记未服用药物A的动物患疾病B的概率为P,给出P的估计值;
(3)根据小概率值α=0.01的独立性检验,能否认为药物A对预防疾病B有效?
附:χ2=eq \f(nad-bc2,a+bc+da+cb+d),
[解析] (1)由列联表知s=100+80=180,
t=80+70=150.
(2)由列联表知,未服用药物A的动物有s=180(只),
未服用药物A且患疾病B的动物有80(只),
所以未服用药物A的动物患疾病B的频率为eq \f(80,180)=eq \f(4,9),
所以未服用药物A的动物患疾病B的概率的估计值为P=eq \f(4,9).
(3)零假设为H0:药物A对预防疾病B无效,由列联表得到
χ2=eq \f(400100×70-150×802,180×220×250×150)=eq \f(2 000,297)≈6.734>6.635,
根据小概率值α=0.01独立性检验,推断H0不成立,
即认为药物A对预防疾病B有效,该推断犯错误的概率不超过0.01,所以根据小概率值α=0.01的独立性检验,能认为药物A对预防疾病B有效.
B组能力提升
1.(2025·福建泉州实验中学月考)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为5m(m∈N*)人,男生中喜欢短视频的人数占男生人数的eq \f(4,5),女生中喜欢短视频的人数占女生人数的eq \f(3,5).零假设为H0:喜欢短视频和性别相互独立.若依据α=0.05的独立性检验认为喜欢短视频和性别不独立,则m的最小值为( )
附:χ2=eq \f(nad-bc2,a+bc+da+cb+d),附表:
A.7 B.8
C.9 D.10
[答案] C
[解析] 根据题意,不妨设a=4m,b=m,c=3m,d=2m,于是χ2=eq \f(nad-bc2,a+bc+da+cb+d)=eq \f(10m·5m22,5m·5m·7m·3m)=eq \f(10m,21),由于依据α=0.05的独立性检验认为喜欢短视频和性别不独立,根据表格可知eq \f(10m,21)≥3.841,解得m≥8.066 1,于是m的最小值为9.故选C.
2.(多选题)(2024·广东东莞七校联考、陕西西安长安区一中质检)某手机商城统计了最近5个月手机的实际销量,如下表所示:
若y与x线性相关,且线性回归方程为eq \(y,\s\up6(^))=0.24x+eq \(a,\s\up6(^)),则下列说法不正确的是( )
A.由题中数据可知,变量y与x正相关
B.线性回归方程eq \(y,\s\up6(^))=0.24x+eq \(a,\s\up6(^))中eq \(a,\s\up6(^))=0.28
C.可以预测x=6时该商场手机销量约为1.72(千只)
D.当x=5时,残差为-0.02
[答案] ABC
[解析] 从数据可得y随着x的增加而增加,所以变量y与x正相关,所以A正确;由表中数据知eq \x\t(x)=eq \f(1+2+3+4+5,5)=3,eq \x\t(y)=eq \f(0.5+0.8+1+1.2+1.5,5)=1,则样本中心点为(3,1),将样本中心点(3,1),代入eq \(y,\s\up6(^))=0.24x+eq \(a,\s\up6(^))中,可得eq \(a,\s\up6(^))=1-3×0.24=0.28,所以B正确;当x=6时,该商场5G手机销售量约为eq \(y,\s\up6(^))=0.24×6+0.28=1.72(千只),所以C正确;线性回归方程为eq \(y,\s\up6(^))=0.24x+0.28,当x=5时,可得eq \(y,\s\up6(^))=0.24×5+0.28=1.48,残差为1.5-1.48=0.02,所以D错误.故选ABC.
3.(多选题)(2024·山东淄博模拟)下列命题为真命题的是( )
A.若样本数据x1,x2,x3,x4,x5,x6的方差为2,则数据3x1-1,3x2-1,3x3-1,3x4-1,3x5-1,3x6-1的方差为17
B.一组数据8,9,10,11,12的第80百分位数是11.5
C.用决定系数R2比较两个模型的拟合效果时,若R2越大,则相应模型的拟合效果越好
D.以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=ln y,求得线性回归方程为eq \(z,\s\up6(^))=2x+0.4,则c,k的值分别是e0.4和2
[答案] BCD
[解析] 若样本数据x1,x2,…,x6的方差为2,则数据3x1-1,3x2-1,3x3-1,3x4-1,3x5-1,3x6-1的方差为32×2=18≠17,故A错误;5×80%=4,则其第80百分位数是eq \f(11+12,2)=11.5,故B正确;根据决定系数的含义知R2越大,则相应模型的拟合效果越好,故C正确;以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=ln y,则z=ln y=ln c+ln ekx=ln c+kx,由题线性回归方程为eq \(z,\s\up6(^))=2x+0.4,则ln c=0.4,k=2,故c,k的值分别是e0.4和2,故D正确.故选BCD.
4.(多选题)(2024·湖北八市联考)某校为了解高一新生对数学是否感兴趣,从400名女生和600名男生中通过分层抽样的方式随机抽取100名学生进行问卷调查,将调查的结果得到如下等高堆积条形图和列联表,则( )
参考数据:本题中χ2=eq \f(nad-bc2,a+bc+da+cb+d)≈3.94.
A.表中a=12,c=30
B.可以估计该校高一新生中对数学不感兴趣的女生人数比男生多
C.根据小概率值α=0.05的χ2独立性检验,可以认为性别与对数学的兴趣有差异
D.根据小概率值α=0.01的χ2独立性检验,可以认为性别与对数学的兴趣没有差异
[答案] ACD
[解析] 由题可知,抽取男生人数为600×eq \f(100,1 000)=60人,女生抽取的人数400×eq \f(100,1 000)=40人,由等高条形图知,抽取男生感兴趣的人数为60×0.5=30人,抽取男生不感兴趣的人数为60×0.5=30人,抽取女生感兴趣的人数为40×0.3=12人,抽取女生不感兴趣的人数为40×0.7=28人,2×2的列联表如下
由此表可知,a=12,c=30,故A正确;
女生不感兴趣的人数约为400×eq \f(28,40)=280人,男生不感兴趣的人数约为600×eq \f(30,60)=300人,
所以估计该校高一新生中对数学不感兴趣的女生人数比男生少,故B错误;
零假设为H0:性别与对数学的兴趣没有差异,
χ2=eq \f(100×12×30-28×302,40×60×42×58)≈3.941>3.841,
依据小概率值α=0.05的独立性检验,有充分证据推断H0不成立,
因此可以认为不成立,即可以认为性别与对数学的兴趣有差异,故C正确;
零假设为H0:性别与对数学的兴趣没有差异χ2≈3.94110.828,所以依据α=0.001的独立性检验,推断H0不成立,即认为“周末自主学习与成绩进步”有关.α
0.15
0.10
0.05
0.025
0.010
xα
2.072
2.706
3.841
5.024
6.635
x(十万元)
5
6
7
8
9
y(十万元)
55
60
70
75
80
零件数x(个)
18
20
22
加工时间y(分)
27
m
33
优秀
非优秀
总计
甲班
10
b
乙班
c
30
合计
α
0.05
0.025
0.010
0.005
xα
3.841
5.024
6.635
7.879
年轻人
非年轻人
总计
经常使用互联网购物
165
225
不常使用互联网购物
合计
90
300
α
0.15
0.10
0.050
0.025
0.010
xα
2.272
2.706
3.841
5.024
6.635
年轻人
非年轻人
总计
经常使用互联网购物
165
60
225
不常使用互联网购物
45
30
75
合计
210
90
300
药物
疾病
合计
未患病
患病
未服用
100
80
s
服用
150
70
220
合计
250
t
400
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
α
0.05
0.01
xα
3.841
6.635
时间x
1
2
3
4
5
销售量y(千只)
0.5
0.8
1.0
1.2
1.5
性别
数学兴趣
合计
感兴趣
不感兴趣
女生
a
b
a+b
男生
c
d
c+d
合计
a+c
b+d
100
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
性别
数学兴趣
合计
感兴趣
不感兴趣
女生
12
28
40
男生
30
30
60
合计
42
58
100
编号
1
2
3
4
5
学习时间x
30
40
50
60
70
数学成绩y
65
78
85
99
108
没有进步
有进步
合计
参与周末在
校自主学习
35
130
165
未参与周末不
在校自主学习
25
30
55
合计
60
160
220
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
相关试卷 更多
- 1.电子资料成功下载后不支持退换,如发现资料有内容错误问题请联系客服,如若属实,我们会补偿您的损失
- 2.压缩包下载后请先用软件解压,再使用对应软件打开;软件版本较低时请及时更新
- 3.资料下载成功后可在60天以内免费重复下载
免费领取教师福利