高中数学苏教版 (2019)选择性必修第二册9.2独立性检验精品当堂达标检测题
展开9.2 独立性检验
【题型归纳目录】
题型一:用2×2列联表分析两分类变量间的关系
题型二:用等高堆积条形图分析两分类变量间的关系
题型三:有关“相关的检验”
题型四:有关“无关的检验”
题型五:独立性检验的综合应用
【知识点梳理】
1、分类变量
这里所说的变量和值不一定是具体的数值,例如:性别变量,其取值为男和女两种
我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量,分类变量的取值可以用实数表示.
2、2×2列联表
在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成表格加以保存,我们将这类数据统计表称为2×2列联表,2×2列联表给出了成对分类变量数据的交叉分类频数.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为
合计
a
b
c
d
合计
3、等高堆积条形图
等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
4、临界值
统计量也可以用来作相关性的度量.越小说明变量之间越独立,越大说明变量之间越相关
.忽略的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数,使得成立.我们称为的临界值,这个临界值就可作为判断大小的标准.
5、独立性检验
基于小概率值的检验规则是:
当时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过;
当时,我们没有充分证据推断H0不成立 ,可以认为X和Y独立.
这种利用的取值推断分类变量X和Y是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验(test of independence).
下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
6、应用独立性检验解决实际问题的大致步骤
(1)提出零假设:X和Y相互独立,并给出在问题中的解释;
(2)根据抽样数据整理出2×2列联表,计算的值,并与临界值比较;
(3)根据检验规则得出推断结论;
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
【典型例题】
题型一:用2×2列联表分析两分类变量间的关系
【方法技巧与总结】
(1)作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误.
(2)利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将与与的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.
例1.(2023·全国·高二单元测试)假设有两个分类变量与的列联表如下表:
对于以下数据,对同一样本能说明与有关系的可能性最大的一组为( )
A.,,, B.,,,
C.,,, D.,,,
【答案】D
【解析】
对于两个分类变量与而言,的值越大,说明与有关系的可能性最大,
对于A选项,,
对于B选项,,
对于C选项,,
对于D选项,,
显然D中最大,
故选:D.
例2.(2023·福建·厦门双十中学高二阶段练习(理))在一次独立性检验中,得出列联表如图:且最后发现,两个分类变量A和B没有任何关系,则a的可能值是( )
A
合计
B
200
800
1000
180
a
180+a
合计
380
800+a
1180+a
A.200 B.720 C.100 D.180
【答案】B
【解析】
解:因为两个分类变量A和B没有任何关系,
所以 ,
代入验证可知 .
故选:B.
题型二:用等高堆积条形图分析两分类变量间的关系
例3.(2023·全国·高二课时练习)下面的等高条形图可以说明的问题是( )
A.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的
B.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同
C.此等高条形图看不出两种手术有什么不同的地方
D.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有的把握
【答案】D
【解析】
由等高条形图可知“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的频率不同,
所以“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有的把握,所以选项D正确,
故选:D.
例4.(2023·全国·高三专题练习)观察下列各图,其中两个分类变量x,y之间关系最强的是( )
A. B.
C. D.
【答案】D
【解析】
观察等高条形图发现与相差很大,就判断两个分类变量之量关系最强.
故选:D
题型三:有关“相关的检验”
【方法技巧与总结】
独立性检验的具体做法
(1)根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界,然后查表确定临界值.
(2)利用公式计算.
(3)如果,则“与有关系”这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“与有关系”,或者在样本数据中没有发现足够的证据支持结论“与有关系”.
例5.(2023·全国·高二)微信和是中国最受欢迎的两个即时通讯软件,作为具有同样功能的软件,二者的业务不可避免地重叠,但是从大众分析调查来看,二者的受众人群有着一些小区别.某机构用简单随机抽样方法调查了100位社区网络员手机即时通讯软件的使用情况,结果如下表,
35岁以上
35岁以下
总计
微信
45
20
65
13
22
35
总计
58
42
100
附:,
0.050
0.010
0.001
3.841
6.635
10.828
则下列结论正确的是( )
A.在犯错误的概率不超过0.1%的前提下,认为“使用即时通讯工具与年龄有关”
B.在犯错误的概率不超过0.1%的前提下,认为“使用即时通讯工具与年龄无关”
C.有99%以上的把握认为“使用即时通讯工具与年龄有关”
D.有99%以上的把握认为“使用即时通讯工具与年龄无关”
【答案】C
【解析】
因为,所以有99%以上的把握认为“使用即时通讯工具与年龄有关”,
故选:C.
例6.(2023·浙江·模拟预测)某视频上传者为确定下一段时间的视频制作方向,在动态中发布投票,投票主题为“你希望我接下来更新哪个方向的视频”,共计人参与此投票,投票结果如下图所示(每位关注者仅选一项).
其中,投票游戏、动漫、生活的关注者之比为.
(1)求参与投票的关注者的性别比;
(2)以游戏与生活两个方向为例,依据小概率值的独立性检验,判断性别与关注者喜欢视频上传者上传视频的类型是否有关.
注:;临界值,.
【解析】
(1)解:根据统计图,男性关注者占比为,
女性关注者占比为,男女性别比为.
(2)解:根据统计图计算可得,选择游戏的关注者中,男性关注者的人数为人,女性关注者的人数为人;
选择生活的关注者中,男性关注者的人数为人,女性关注者的人数为人.
零假设性别对关注者喜欢视频上传者上传视频的类型有关.
由计算的数据可以得到下面的列联表:
男性关注者人数
女性关注者人数
游戏
生活
的观测值,
因此可以认为性别与关注者喜欢视频上传者上传视频的类型有关.
题型四:有关“无关的检验”
【方法技巧与总结】
独立性检验的关注点
在2×2列联表中,如果两个分类变量没有关系,则应满足,因此越小,关系越弱;越大,关系越强.
例7.(2023·湖南·高二课时练习)某工厂冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,该工厂进行了一项调查,结果如下表所示:
杂质高
杂质低
旧设备
37
121
新设备
22
202
试根据以上数据判断含杂质的高低与设备改造有无关系.
【解析】
由已知数据得到如下列联表:
杂质高
杂质低
合计
旧设备
37
121
158
新设备
22
202
224
合计
59
323
382
则,所以有的把握认为含杂质的高低与设备改造有关.
例8.(2023·湖南·高二课时练习)某企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了72名员工进行调查,所得数据如下表所示:
积极支持企业改革
不太赞成企业改革
合计
工作积极性高
28
8
36
工作积极性一般
16
20
36
合计
44
28
72
对于人力资源部研究的问题,根据上述数据你能得出什么结论?
【解析】
,故有的把握认为抽样员工对待企业改革的态度与工作积极性有关,从而认为企业的全体员工对待企业改革的态度与其工作积极性有关.
题型五:独立性检验的综合应用
【方法技巧与总结】
(1)解答此类题目的关键在于正确利用计算的值,再用它与临界值的大小作比较来判断假设检验是否成立,从而使问题得到解决.
例9.(2023春·陕西西安·高二校联考阶段练习)某年调查某桑场采桑人员和不采桑人员的桑毛虫皮炎发病情况,结果如表所示,利用列联表的独立性检验估计“患桑毛虫皮炎病与采桑”是否有关?认为两者有关系犯错误的概率是多少?
采桑
不采桑
合计
患者人数
18
12
30
健康人数
5
78
83
合计
23
90
113
参考公式及数据:
【解析】由表格知:.
因为,
所以有的把握认为“患桑毛虫皮炎病与采桑”有关,犯错误的概率为.
例10.(2023春·安徽芜湖·高二校考期末)某初中为了了解学生对消防安全知识的掌握情况,开展了网上消防安全知识考试.对参加考试的男生、女生各随机抽查40人,根据考试成绩,得到如下列联表:
男生
女生
合计
考试成绩合格
30
20
50
考试成绩不合格
10
20
30
合计
40
40
80
(1)根据上面的列联表,依据小概率值的独立性检验,能否认为考试成绩是否合格与性别有关;
(2)在考试成绩不合格的30人中按性别利用按比例分配的分层抽样的方法随机抽取6人,再从这6人中随机抽取3人,记这3人中男生的人数为,求的分布列和数学期望.
附:,其中.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【解析】(1)零假设为:分类变量与相互独立,即考试成绩是否合格与性别无关,根据表中数据计算可得,根据小概率值的独立性检验,我们推断不成立,即认为考试成绩是否合格与性别有关,此推断犯错的概率不大于0.05;
(2)这6人中男生有2人,女生有4人,
可得的可能取值为0,1,2,有,
,.
故随机变量的分布列为
0
1
2
有.
例11.(2023·全国·哈尔滨三中校联考一模)某学校号召学生参加“每天锻炼1小时”活动,为了了解学生参与活动的情况,随机调查了100名学生一个月(30天)完成锻炼活动的天数,制成如下频数分布表:
天数
[0,5]
(5,10]
(10,15]
(15,20]
(20,25]
(25,30]
人数
4
15
33
31
11
6
(1)由频数分布表可以认为,学生参加体育锻炼天数X近似服从正态分布,其中μ近似为样本的平均数(每组数据取区间的中间值),且,若全校有3000名学生,求参加“每天锻炼1小时”活动超过21天的人数(精确到1);
(2)调查数据表明,参加“每天锻炼1小时”活动的天数在(15,30]的学生中有30名男生,天数在[0,15]的学生中有20名男生,学校对当月参加“每天锻炼1小时”活动超过15天的学生授予“运动达人”称号.请填写下面列联表:
性别
活动天数
合计
[0,15]
(15,30]
男生
女生
合计
并依据小概率值的独立性检验,能否认为学生性别与获得“运动达人”称号有关联.如果结论是有关联,请解释它们之间如何相互影响.
附:参考数据:;;.
α
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【解析】(1)由频数分布表知
,则,,
,
,
参加“每天锻炼1小时”活动超过21天的人数约为476人.
(2)由频数分布表知,锻炼活动的天数在的人数为:,
参加“每天锻炼1小时”活动的天数在[0,15]的学生中有20名男生,
参加“每天锻炼1小时”活动的天数在[0,15]的学生中有女生人数:
由频数分布表知,锻炼活动的天数在的人数为,
参加“每天锻炼1小时”活动的天数在(15,30]的学生中有30名男生,
参加“每天锻炼1小时”活动的天数在[0,15]的学生中有女生人数:
列联表如下:
性别
活动天数
合计
男生
20
30
50
女生
32
18
50
合计
52
48
100
零假设为:学生性别与获得“运动达人”称号无关
依据的独立性检验,我们推断不成立,即:可以认为学生性别与获得“运动达人”称号有关;
而且此推断犯错误的概率不大于,根据列联表中的数据得到,男生、女生中活动天数超过15天的频率分别为:和,可见男生中获得“运动达人”称号的频率是女生中获得“运动达人”的称号频率的倍,于是依据频率稳定与概率的原理,我们可以认为男生获得“运动达人”的概率大于女生,即男生更容易获得运动达人称号.
变式1.(2023秋·辽宁·高二校联考期末)为了有针对性地提高学生体育锻炼的积极性,某校需要了解学生是否经常锻炼与性别因素有关,为此随机对该校100名学生进行问卷调查,得到如下列联表.
经常锻炼
不经常锻炼
总计
男
35
女
25
总计
100
已知从这100名学生中任选1人,经常锻炼的学生被选中的概率为.
(1)完成上面的列联表;
(2)根据列联表中的数据,判断能否有90%的把握认为该校学生是否经常锻炼与性别因素有关.
附:,其中,.
0.1
0.05
0.01
0.001
k
2.706
3.841
6.635
10.828
【解析】(1)设这100名学生中经常锻炼的学生有x人,则,解得.
列联表完成如下.
经常锻炼
不经常锻炼
总计
男
35
25
60
女
15
25
40
总计
50
50
100
(2)由(1)可知,,
因为,所以有90%的把握认为该校学生是否经常锻炼与性别因素有关.
变式2.(2023·广东广州·高三广东实验中学校考阶段练习)为了检测某种抗病毒疫苗的免疫效果,需要进行动物与人体试验.研究人员将疫苗注射到200只小白鼠体内,一段时间后测量小白鼠的某项指标值,按分组,绘制频率分布直方图如图所示,实验发现小白鼠体内产生抗体的共有160只,其中该项指标值不小于60的有110只,假设小白鼠注射疫苗后是否产生抗体相互独立.
抗体
指标值
合计
小于60
不小于60
有抗体
没有抗体
合计
(1)填写下面的2×2列联表,并根据列联表及的独立性检验,判断能否认为注射疫苗后小白鼠产生抗体与指标值不小于60有关.(单位:只)
(2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的40只小白鼠进行第二次注射疫苗,结果又有20只小自鼠产生抗体.
(i)用频率估计概率,求一只小白鼠注射2次疫苗后产生抗体的概率p;
(ii)以(i)中确定的概率p作为人体注射2次疫苗后产生抗体的概率,进行人体接种试验,记n个人注射2次疫苗后产生抗体的数量为随机变量X.试验后统计数据显示,当X =99时,P(X)取最大值,求参加人体接种试验的人数n.
参考公式:(其中为样本容量)
0.50
0.40
0.25
0.15
0.100
0.050
0.025
0.455
0.708
1.323
2.072
2.706
3.841
5.024
【解析】(1)由频率分布直方图,知200只小白鼠按指标值分布为:
在内有(只);
在内有(只);
在内有(只);
在内有(只),
在内有(只).
由题意,有抗体且指标值小于60的有50只;
而指标值小于60的小白鼠共有只,
所以指标值小于60且没有抗体的小白鼠有20只,
同理,指标值不小于60且没有抗体的小白鼠有20只,
故列联表如下:单位:只
抗体
指标值
合计
小于60
不小于60
有抗体
50
110
160
没有抗体
20
20
40
合计
70
130
200
零假设为:注射疫苗后小白鼠产生抗体与指标值不小于60无关联.
根据列联表中数据,得,
根据的独立性检验,推断不成立,
即认为注射疫苗后小白鼠产生抗体与指标值不小于60有关,
此推断犯错误的概率不大于0.05.
(2)(i)令事件A=“小白鼠第一次注射疫苗产生抗体”,
事件B=“小白鼠第二次注射疫苗产生抗体’’,
事件C=“小白鼠注射2次疫苗后产生抗体”,
记事件A,B,C发生的概率分别为,
则,,
,
所以一只小白鼠注射2次疫苗后产生抗体的概率,
(ii)由题意,知随机变量,
,
因为最大,
所以,
解得
是整数,所以或,
接受接种试验的人数为109或110.
变式3.(2023春·辽宁·高三朝阳市第一高级中学校联考阶段练习)随着科技的进步和人民生活水平的提高,电脑已经走进了千家万户,成为人们生活、学习、娱乐的常见物品,便携式电脑(俗称“笔记本”)也非常流行.某公司为了研究“台式机”与“笔记本”的受欢迎程度是否与性别有关,在街头随机抽取了50人做调查研究,调查数据如下表所示.
男性
女性
合计
喜欢“台式机”
20
5
25
喜欢“笔记本”
10
15
25
合计
30
20
50
(1)是否有99%的把握认为喜欢哪种机型与性别有关?
(2)该公司针对男性客户做了调查,某季度男性客户中有青年324人,中年216人,老年108人,按分层抽样选出12人,又随机抽出3人的调查结果进行答谢,这3人中的青年人数设为随机变量,请求出的分布列与数学期望.
附:,其中.
0.10
0.05
0.025
0.01
2.701
3.841
5.024
6.635
【解析】(1),
所以有的把握认为喜欢哪种机型与性别有关;
(2)由题意,,
所以人中有青年人人,中年人人,老年人人,
则的所有可能取值为,
,,
,,
则分布列为:
.
【同步练习】
一、单选题
1.(2023春·山西大同·高二山西省浑源中学校考期中)利用独立性检验来考察两个分类变量和是否有关系时,通过查列联表计算得4.964,那么认为与有关系,这个结论错误的可能性不超过( )
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.0.001 B.0.005 C.0.01 D.0.05
【答案】D
【解析】由,所以在犯错误的概率不超过0.05的前提下,认为与有关系.
故选:D
2.(2023·宁夏银川·校联考一模)考查棉花种子经过处理跟生病之间的关系得到如表数据:
项目
种子处理
种子未处理
总计
得病
32
101
133
不得病
192
213
405
总计
224
314
538
根据以上数据,则( )
A.种子是否经过处理决定是否生病
B.种子是否经过处理跟是否生病无关
C.种子是否经过处理跟是否生病有关
D.以上都是错误的
【答案】C
【解析】由列联表中的数据可知,
种子经过处理,得病的比例明显降低,
种子未经过处理,得病的比例要高些,
所以可得结论:种子是否经过处理跟是否生病有关.
故选:C
3.(2023秋·北京·高三校考期中)为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:
性别
光盘行动
合计
做不到“光盘”
能做到“光盘”
男
45
10
55
女
30
15
45
合计
75
25
100
附表:
0.10
0.05
0.01
2.706
3.841
6.635
.
参照附表,得到的正确结论是( )A.至少有99%认为“该市居民能否做到‘光盘’与性别有关”
B.在犯错误的概率不大于0.01的前提下,认为“该市居民能否做到‘光盘’与性别无关”
C.在犯错误的概率不大于0.1的前提下,推断“该市居民能否做到‘光盘’与性别无关”
D.至少有90%的把握,推断“该市居民能否做到‘光盘’与性别有关”
【答案】D
【解析】由列联表得到,则,
代入=.
因为,所以至少有的把握认为“该市居民能否做到‘光盘’与性别有关”,故D选项正确.
故选:D
4.(2023·高二课时练习)某工厂为了调查工人的文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表(单位:人):
文化程度月收入情况
月收入4000元以下
月收入4000元及以上
总计
高中文化以上
10
45
55
高中文化及以下
20
30
50
总计
30
75
105
则判断“文化程度与月收入有关系”的把握是( )A.95% B.99% C.100% D.5%
【答案】A
【解析】根据给定的的列联表,可得,
所以有95%的把握判断“文化程度与月收入有关系”.
故选:A.
5.(2023·高二课时练习)由下表得出结论:有95%的把握认为X与Y有关,则的值必须( )
0.10
0.05
0.01
k
2.706
3.841
6.635
A.小于3.841 B.大于等于3.841
C.小于6.635 D.大于等于2.706
【答案】B
【解析】查表可知,若有95%的把握认为X与Y有关,则.
故选:B.
6.(2023·高二单元测试)东江湖位于湖南省郴州市东北部的资兴市境内,被誉为“人间天上一湖水,万千景象在其中” .每年都吸引无数游客来此游玩,某调查机构在景区随机调查了10名青少年人和8名中老年人,并请他们谈谈是否有“二次游玩”的愿望,统计结果如下,则( )
“二次游玩”愿望情况
年龄段
有“二次游玩”的愿望
无“二次游玩”的愿望
总计
青少年
8
2
10
中老年
2
6
8
总计
10
8
18
A.有95%的把握判断有“二次游玩”的愿望与年龄有关
B.有95%的把握判断有“二次游玩”的愿望与年龄无关
C.有99%的把握判断有“二次游玩”的愿望与年龄有关
D.有99%的把握判断有“二次游玩”的愿望与年龄无关
【答案】A
【解析】∵,∴有95%的把握判断有“二次游玩”的愿望与年龄有关.
故选:A.
7.(2023·高二课时练习)某工科院校对A,B两个专业的男、女生人数进行调查统计,得到以下表格:
专业A
专业B
合计
女生
12
男生
46
84
合计
50
100
若认为工科院校中“性别”与“专业”有关,则犯错误的概率不会超过( )A.0.005 B.0.01 C.0.025 D.0.05
【答案】D
【解析】根据题意,填写列联表如下:
专业A
专业B
合计
女生
12
4
16
男生
38
46
84
合计
50
50
100
则.又,所以认为工科院校中“性别”与“专业”有关,犯错误的概率不会超过0.05,
故选:D.
8.(2023·全国·高三专题练习)假设有两个分类变量和的列联表:对同一样本,以下数据能说明与有关系的可能性最大的一组为( )
X Y
总计
10
30
总计
60
40
100
A. B. C. D.
【答案】A
【解析】 A. 时,;
B. 时,;
C. 时,;
D. 时,
因为选项A的最大,所以与有关系的可能性最大的一组为A.
故选:A.
二、多选题
9.(湖南省新高考教学教研联盟2023届高三下学期3月第一次联考数学试题)下列说法正确的有( )
A.若随机变量服从正态分布,则
B.数据的第70百分位数为8
C.回归分析中常用残差平方和来刻画拟合效果好坏,残差平方和越小,拟合效果越好
D.根据分类变量与的成对样本数据计算得到,依据的独立性检验,可判断与有关且犯错误的概率不超过0.05
【答案】ABC
【解析】由正态分布的对称性可知,
若,则,
所以,故正确;
数据重排后如下:共8个数,由可得第70百分位数为第6个数,即为8,故B正确;
回归分析中残差平方和越小,相关指数越接近于1,拟合效果越好,故C正确;
由独立性检验可知,犯错误的概率会超过0.05,即D错误.
故选:ABC.
10.(2023秋·广东潮州·高三统考期末)下列说法正确的是( )
A.,当不变时,越小,该正态分布对应的正态密度曲线越扁平
B.运用最小二乘法得到的线性回归直线一定经过点
C.相关系数r越大,y与x相关的程度就越强
D.利用进行独立性检验时,的值越大,说明有更大的把握认为两事件有关系
【答案】BD
【解析】对于A,根据正态曲线的几何特征,可知当不变时,即越小,该正态分布对应的正态密度曲线越瘦高,故A错误;
对于B,运用最小二乘法得到的线性回归直线-定经过样本中心,故B正确;
对于C,线性相关系数绝对值越接近1,表明2个随机变量相关性越强,故C错误;
对于D,因为随机变量的观测值越大,说明两个变量有关系的可能性越大,即犯错误的概率越小,故D正确.
故选:BD.
11.(2023·全国·高二专题练习)卡塔尔足球世界杯比赛于2022年11月揭开战幕,随机询问100人是否喜欢足球,得到如下的列联表:
喜欢足球
不喜欢足球
总计
男
35
15
50
女
25
25
50
总计
60
40
100
参考公式(其中)
常用小概率值和临界值表:
0.05
0.010
0.005
3.841
6.635
7.879
参照临界值表,下列结论正确的是( )A.根据小概率值的独立性检验,有95%的把握认为“喜欢足球与性别无关”
B.根据小概率值的独立性检验,有95%的把握认为“喜欢足球与性别有关”
C.根据小概率值的独立性检验,认为“喜欢足球与性别有关”
D.根据小概率值的独立性检验,认为“喜欢足球与性别无关”
【答案】BD
【解析】由题意可知,
,根据小概率值的独立性检验,有95%的把握认为“喜欢足球与性别有关”,故A错误,B正确;
,根据小概率值的独立性检验,认为“喜欢足球与性别无关”,故C错误,D正确,
故选:BD.
12.(2023秋·广东汕头·高三统考期末)为了提高学生体育锻炼的积极性,某中学需要了解性别因素与学生对体育锻炼的喜好是否有影响,为此对学生是否喜欢体育锻炼的情况进行普查,得到下表:
体育
性别
合计
男性
女性
喜欢
280
p
280+p
不喜欢
q
120
120+q
合计
280+q
120+p
400+p+q
附:,.
0.05
0.025
0.010
0.001
3.841
5.024
6.635
10.828
已知男生喜欢体育锻炼的人数占男生人数的,女生喜欢体育锻炼的人数占女生人数的,则下列说法正确的是( )A.列联表中q的值为120,p的值为180
B.随机对一名学生进行调查,此学生有90%的可能性喜欢体育锻炼
C.根据小概率值的独立性检验,男女生对体育锻炼的喜好有差异
D.根据小概率值的独立性检验,男女生对体育锻炼的喜好没有差异
【答案】ACD
【解析】A:由题意知,男生喜欢该项运动的人数占男生人数的,
女生喜欢该项运动的人数占女生人数的,
则,,解得,故A正确;
B:补全列联表如下:
男性
女性
合计
喜欢
280
180
460
不喜欢
120
120
240
合计
400
300
700
所以随机抽一名学生进行调查,喜欢该项运动的概率约为,故B错误;
C:,
而,
所以根据小概率值的独立性检验,男女生对体育锻炼的喜好有差异
D:由选项C知,根据小概率值的独立性检验,男女生对体育锻炼的喜好没有差异.
故选:ACD
三、填空题
13.(2023·全国·高三专题练习)在一次恶劣气候的飞行航程中,调查男女乘客在机上晕机的情况,如下表所示:
晕机
不晕机
合计
男
15
女
6
合计
28
46
则下列说法正确的是________.
①;
②;
③可以认为,“在恶劣气候飞行中,晕机与否跟男女性别有关”;
④没有理由认为,“在恶劣气候飞行中,晕机与否跟男女性别有关”.
【答案】②④
【解析】由表格数据可知:,于是可得:,
,,,
于是有,显然①不正确;
,没有的把握认为,在恶劣的气候飞行中,晕机与否跟男女的性别有关,因此②④正确,③不正确,
故答案为:②④
14.(2023·高二单元测试)为了了解高中学生对乡村音乐的态度和性别的关系,现随机抽取50名学生进行调查,根据调查结果得到,则由此认为“喜欢乡村音乐与性别有关”出错的概率不超过______.
附:,其中.
0.10
0.05
0.025
0.010
0.005
2.706
3.841
5.024
6.635
7.879
【答案】
【解析】由题意知,根据调查结果得到,
因为,
结合附表,所以认为“喜欢乡村音乐与性别有关”出错的概率不超过.
故答案为:.
15.(2023·高二课时练习)江苏省从2021年开始全面推行新高考制度,新高考“3+1+2”中的“1”要求考生从物理、历史中选一科,为了解学生选历史、物理与性别的关系,现随机抽取50名学生,得到结果如下表(单位:人):
性别科目
物理
历史
男
13
10
女
7
20
则我们有______%的把握判断选历史、物理与性别有关系.
【答案】95
【解析】根据表中数据,得到,
所以我们有95%的把握判断选历史、物理与性别有关系.
故答案为:.
16.(2023春·福建厦门·高二厦门海沧实验中学校考期中)某学校为了制定治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下的列联表:
同意限定区域停车
不同意限定区域停车
合计
男
20
5
25
女
10
15
25
合计
30
20
50
根据上述数据,推断同意限定区域停车与性别有关系,则这种推断犯错误的概率不超过________.
附:,其中.
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】0.005
【解析】因为,所以这种推断犯错误的概率不超过0.005.
故答案为:0.005.
四、解答题
17.(2023春·广东江门·高三江门市第一中学校考阶段练习)某数学兴趣小组为研究本校学生数学成绩与语文成绩的关系,采取有放回的简单随机抽样,从学校抽取样本容量为200的样本,将所得数学成绩与语文成绩的样本观测数据整理如下:
语文成绩
合计
优秀
不优秀
数学成绩
优秀
50
30
80
不优秀
40
80
120
合计
90
110
200
(1)根据的独立性检验,能否认为数学成绩与语文成绩有关联?
(2)在人工智能中常用表示在事件发生的条件下事件发生的优势,在统计中称为似然比.现从该校学生中任选一人,表示“选到的学生语文成绩不优秀”,表示“选到的学生数学成绩不优秀”请利用样本数据,估计的值.
(3)现从数学成绩优秀的样本中,按分层抽样的方法选出8人组成一个小组,从抽取的8人里再随机抽取3人参加数学竞赛,求这3人中,语文成绩优秀的人数的概率分布列及数学期望.
附:
【解析】(1)零假设:数学成绩与语文成绩无关.
据表中数据计算得:
根据小概率值的的独立性检验,我们推断不成立,而认为数学成绩与语文成绩有关;
(2)∵,
∴估计的值为;
(3)按分层抽样,语文成绩优秀的5人,语文成绩不优秀的3人,随机变量的所有可能取值为.
,,
,,
∴的概率分布列为:
0
1
2
3
∴数学期望.
18.(2023春·山西吕梁·高二校联考期中)某体育彩票站点为了预估2022年彩民购买彩票的情况,对2021年的购买情况进行随机调查并统计,得到如下数据:
购买金额/千元
人数/人
10
15
20
25
20
10
(1)根据以上数据完成下面的2×2列联表;
不少于6千元
少于6千元
合计
男
30
女
12
合计
(2)根据(1)中的2×2列联表,判断是否有90%的把握认为彩民的购买金额是否少于6千元与彩民的性别有关?
附:,(其中)
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【解析】(1)由所给数据可得2×2列联表如下:
不少于6千元
少于6千元
合计
男
18
30
48
女
12
40
52
合计
30
70
100
(2)根据2×2列联表中的数据可得,
因此根据临界值表可知,没有90%的把握认为彩民的购买金额是否少于6千元与彩民的性别有关.
19.(2023春·重庆沙坪坝·高二重庆八中校考期末)第24届冬季奥林匹克运动会于2022年2月在中国北京张家口举行.为调查不同地域青少年对冰雪运动的了解情况,某机构抽样调查了北京、天津、上海、重庆等四个城市的部分高中学生,调查问卷共20个题目.
(1)若某个参加调查的同学能确定其中10个题目的答案,其余10个题目中,有5个题目他能够答对的概率均为0.6,另外5个题目他能够答对的概率均为0.2,求该同学答对题目个数的均值;
(2)将重庆和上海并为“南方组”,北京和天津并为“北方组”,通过调查得到如下列联表:
地域
了解程度
合计
不了解
非常了解
南方组
53
112
165
北方组
96
139
235
合计
149
251
400
请在参考数据②中选择一个,根据的独立性检验,分析受调群体中对冰雪运动的了解程度是否存在南北差异.
参考公式:
参考数据:①,,
.
②独立性检验常用小概率值和相应临界值:
a
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.0828
【解析】(1)记答对概率为0.6的5个题目中,该同学答对的个数为;
答对概率为0.2的5个题目中,该同学答对的个数为,
则, ,
所以,该同学答对题目的均值为
(2)零假设为:对冰雪运动的了解程度与南北地域差异独立.
由条件及参考数据,得.
(i)若选择,则
根据小概率值的独立性检验,推断不成立,即认为对冰雪运动的了解程度与南北地域差异有关联,此推断犯错误的概率不大于0.1.
(ii)若选择,则
根据小概率值的独立性检验,没有充分证据推断不成立,即认为对冰雪运动的了解程度没有南北地域差异.
20.(2023秋·山西运城·高三校考阶段练习)足球比赛是一项深受球迷喜爱的运动项目.第22届足球世界杯在卡塔尔举行,这是历史上第一次在冬季举行的世界杯,为了解人们收看世界杯的意愿,随机对80个用户(其中女40人)进行问卷调查,得到如下列联表:
男生
女生
合计
有收看意愿
无收看意愿
10
30
合计
40
(1)补充上面的列联表,依据小概率值的独立性检验,能否认为“有收看意愿”与“性别”有关;
(2)在无收看意愿的30人中,按性别用分层抽样的方法随机抽取6人,再从选出的这6人中随机抽取3人,记这3人中男生的人数为,求的分布列和数学期望.
附:,其中.
【解析】(1)
男生
女生
合计
有收看意愿
30
20
50
无收看意愿
10
20
30
合计
40
40
80
零假设:“有收看意愿”与“性别”无关,
由.
依据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为成立,即“有收看意愿”与“性别”无关.
(2)无收看意愿的30人,男生人数与女生人数比为,所以用分层抽样抽取的这6个人中男生有2人,女生有4人,可得的可能取值为,
有,
,
,
故随机变量的分布列为
0
1
2
有.
21.(2023秋·山东滨州·高三统考期末)某芯片制造企业使用新技术对某款芯片进行生产.生产该款芯片有三道工序,这三道工序互不影响.已知批次甲的三道工序次品率分别为,,.
(1)求批次甲芯片的次品率;
(2)该企业改进生产工艺后,生产了批次乙的芯片.某手机厂商获得批次甲与批次乙的芯片,并在某款手机上使用.现对使用这款手机的100名用户回访,对开机速度进行调查.据统计,安装批次甲的有40名,其中对开机速度满意的有30名;安装批次乙的有60名,其中对开机速度满意的有55名.试整理出列联表(单位:名),并依据小概率值的独立性检验,分析芯片批次是否与用户对开机速度满意有关.
批次
是否满意
合计
满意
不满意
甲
乙
合计
附:
【解析】(1)由已知可得批次甲芯片的正品率,
所以批次甲芯片的次品率为.
(2)零假设为:芯片批次与用户对开机速度满意无关,得列联表如下:
批次
是否满意
合计
满意
不满意
甲
30
10
40
乙
55
5
60
合计
85
15
100
所以,
因为,所以依据的独立性检验,我们推断不成立,
所以认为芯片批次与用户对开机速度满意有关,此推断犯错误的概率不大于0.05.
22.(2023·河南信阳·河南省信阳市第二高级中学校联考一模)某校本着“我运动我快乐我锻炼我健康”精神积极组织学生参加足球、篮球、排球、羽毛球等球类活动.为了解学生参与情况,随机抽取100名学生对是否参与情况进行问卷调查.所得数据制成下表:
不参与
参与
合计
男生
15
35
50
女生
50
合计
100
若从这100人中任选1人恰好参与球类活动的概率为0.6.
(1)判断是否有95%的把握认为“参与球类活动”与性别有关;
(2)现从不参与球类活动的学生中按其性别比例采取分层抽样的方法选取8人,再在这8人中选取2人参加游泳,求恰好抽到2名女生的概率.
附:列联表参考公式:,其中.
临界值表:
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
【解析】(1)依题意,参与球类活动概率为0.6,即有60人参与球类活动,得列联表:
不参与
参与
合计
男生
15
35
50
女生
25
25
50
合计
40
60
100
于是得的观测值:,
所以有95%把握认为参与球类活动与性别有关.
(2)从不参与球类活动的40名学生中按其性别比例采取分层抽样的方法选取8人,有3名男生,5名女生,
因此从8人中任选2人,有种选取方法,而恰好抽到2名女生的抽法有种方法,
所以恰好抽到2名女生的概率为.
高中数学苏教版 (2019)选择性必修第二册9.1线性回归分析优秀巩固练习: 这是一份高中数学苏教版 (2019)选择性必修第二册9.1线性回归分析优秀巩固练习,文件包含91线性回归分析十大题型解析版docx、91线性回归分析十大题型原卷版docx等2份试卷配套教学资源,其中试卷共70页, 欢迎下载使用。
数学选择性必修第二册8.3 正态分布精品一课一练: 这是一份数学选择性必修第二册8.3 正态分布精品一课一练,文件包含83正态分布四大题型解析版docx、83正态分布四大题型原卷版docx等2份试卷配套教学资源,其中试卷共51页, 欢迎下载使用。
苏教版 (2019)选择性必修第二册8.1条件概率优秀同步测试题: 这是一份苏教版 (2019)选择性必修第二册8.1条件概率优秀同步测试题,文件包含81条件概率五大题型解析版docx、81条件概率五大题型原卷版docx等2份试卷配套教学资源,其中试卷共34页, 欢迎下载使用。