2020-2021学年第四章 概率与统计4.3 统计模型4.3.2 独立性检验同步测试题
展开一、选择题
1.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算得χ2=7.01,则认为“喜欢乡村音乐与性别有关系”的把握约为( )
A.0.1% B.1%
C.99% D.99.9%
C [易知χ2=7.01>6.635,对照临界值表知,有99%的把握认为喜欢乡村音乐与性别有关系.]
2.某研究所为了检验某血清预防感冒的作用,把500名使用了该血清的志愿者与另外500名未使用该血清的志愿者一年中的感冒记录作比较,提出假设H:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查临界值表知P(χ2≥3.841)=0.05.则下列叙述中正确的是( )
A.有95%的把握认为“这种血清能起到预防感冒的作用”
B.若有人未使用该血清,那么他一年中有95%的可能性得感冒
C.这种血清预防感冒的有效率为95%
D.这种血清预防感冒的有效率为5%
A [χ2≈3.918>3.841,因此有95%的把握认为“这种血清能起到预防感冒的作用”,故选A.]
3.给出下列实际问题:
①一种药物对某种病的治愈率;②两种药物治疗同一种病是否有区别;③吸烟者得肺病的概率;④吸烟是否与性别有关系;⑤网吧与青少年的犯罪是否有关系.
其中用独立性检验可以解决的问题有( )
A.①②③ B.②④⑤
C.②③④⑤D.①②③④⑤
B [独立性检验是判断两个分类变量是否有关系的方法,而①③都是概率问题,不能用独立性检验.]
4.下表是甲、乙两个班级进行数学考试,按学生考试及格与不及格统计成绩后的2×2列联表,则χ2的值为( )
B.0.456
C.0.443D.0.4
A [χ2=eq \f(90×12×36-33×92,45×45×21×69)≈0.559,故选A.]
5.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A.若χ2>6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病
B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病
C.若从χ2统计量中得出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误
D.以上三种说法都不正确
C [A,B是对χ2的误解,99%的把握认为吸烟和患肺病有关,是指通过大量的观察试验得出的一个数值,并不是100个人中必有99个人患肺病,也可能这100个人全健康.]
二、填空题
6.(一题两空)在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=7.63,根据这一数据分析,有______的把握说,打鼾与患心脏病是________的.(“有关”或“无关”)
99% 有关 [∵χ2=7.63,∴χ2>6.635,
因此,有99%的把握说,打鼾与患心脏病是有关的.]
7.若两个分类变量x和y的列联表为:
则x与y之间有关系的概率约为________.
0.999 [χ2=eq \f(5+15+40+105×10-40×152,5+1540+105+4015+10)
≈18.822.
∵18.822>10.828,
∴x与y之间有关系的概率约为1-0.001=0.999.]
8.某高校“统计初步”课程的教师随机调查了选该课程的一些学生情况,具体数据如下表:
为了判断主修统计专业是否与性别有关系,根据表中数据,得到χ2=eq \f(50×13×20-10×72,23×27×20×30)≈4.844>3.841,所以断定主修统计专业与性别有关系,那么这种判断出错的可能性约是________.
5% [∵P(χ2≥3.841)=0.05,故判断出错的可能性为5%.]
三、解答题
9.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
(1)根据表中数据,问是否有95%的把握认为南方学生和北方学生在选用甜品的饮食习惯方面有差异;
(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.
附:χ2=eq \f(nad-bc2,a+ba+cb+dc+d),
[解] (1)将2×2列表中的数据代入公式计算,得
χ2=eq \f(100×60×10-20×102,70×30×80×20)=eq \f(100,21)≈4.762.
由于4.762>3.841,所以有95%的把握认为南方学生和北方学生在选用甜品的饮食习惯方面有差异.
(2)从5名数学系学生中任取3人的一切可能结果所组成的基本事件空间Ω={(a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),(b1,b2,b3)},
其中ai表示喜欢甜品的学生,i=1,2,bj表示不喜欢甜品的学生,j=1,2,3.
基本事件空间Ω由10个基本事件组成,且这些基本事件的出现是等可能的.
用A表示“3人中至多有1人喜欢甜品”这一事件,则A={(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),(b1,b2,b3)}.
事件A由7个基本事件组成,因而P(A)=eq \f(7,10).
10.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附:χ2=eq \f(nad-bc2,a+bc+da+cb+d),
[解] (1)第二种生产方式的效率更高.
理由如下:
(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多80分钟.因此第二种生产方式的效率更高.
(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.
(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需平均时间高于80分钟;用第二种生产方式的工人完成生产任务所需平均时间低于80分钟.因此第二种生产方式的效率更高.
(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.
(以上给出了4种理由,答出其中任意一种或其他合理理由均可)
(2)由茎叶图知m=eq \f(79+81,2)=80.
列联表如下:
(3)因为χ2=eq \f(4015×15-5×52,20×20×20×20)=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.
11.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )
表1
表2
表3
表4
A.成绩 B.视力
C.智商 D.阅读量
D [A中,χ2=eq \f(52×6×22-10×142,20×32×16×36)=eq \f(13,1 440);
B中,χ2=eq \f(52×4×20-12×162,20×32×16×36)=eq \f(637,360);
C中,χ2=eq \f(52×8×24-8×122,20×32×16×36)=eq \f(13,10);
D中,χ2=eq \f(52×14×30-2×62,20×32×16×36)=eq \f(3 757,160).
因此阅读量与性别相关的可能性最大,所以选D.]
12.(多选题)有两个分类变量X,Y,其列联表如下所示,
其中a,15-a均为大于5的整数,若在犯错误的概率不超过0.05的前提下认为X,Y有关,则a的值为( )
A.6 B.7
C.8 D.9
CD [根据公式,得
χ2=eq \f(65×[a30+a-15-a20-a]2,20×45×15×50)
=eq \f(13×13a-602,20×45×3×2)>3.841,根据a>5且15-a>5,
a∈Z,求得当a=8或9时满足题意.]
13.(一题两空)为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:
设H:服用此药的效果与患者的性别无关,则χ2≈________(小数点后保留一位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.
4.9 5% [由公式计算得χ2≈4.9.∵χ2>3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.]
14.某一电视台对年龄高于40岁和不高于40岁的人是否喜欢足球进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:
若工作人员从所有统计结果中任取一个,取到喜欢足球的人的概率为eq \f(3,5),则有超过________的把握认为年龄与足球的被喜欢程度有关.
附:χ2=eq \f(nad-bc2,a+bc+da+cb+d).
95% [设“从所有人中任意抽取一个,取到喜欢足球的人”为事件A,由已知得P(A)=eq \f(q+35,100)=eq \f(3,5),
所以q=25,p=25,a=40,b=60.
χ2=eq \f(100×25×35-25×152,40×60×50×50)=eq \f(25,6)≈4.167>3.841.
故有超过95%的把握认为年龄与足球的被喜欢程度有关.]
15. 海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:
旧养殖法
新养殖法
(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关.
附:
χ2=eq \f(nad-bc2,a+bc+da+cb+d).
[解] (1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”,
由P(A)=P(BC)=P(B)P(C),
旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,
故P(B)的估计值为0.62,
新养殖法的箱产量不低于50 kg的频率为(0.068+0.046+0.010+0.008)×5=0.66,
故P(C)的估计值为0.66,
则事件A的概率估计值为P(A)=P(B)P(C)=0.62×0.66=0.409 2,
∴A发生的概率为0.409 2.
(2)根据箱产量的频率分布直方图得到列联表:
则χ2=eq \f(200×62×66-38×342,100×100×96×104)≈15.705,
由15.705>6.635,
故有99%的把握认为箱产量与养殖方法有关.不及格
及格
合计
甲班
12
33
45
乙班
9
36
45
合计
21
69
90
y
x
y1
y2
x1
5
15
x2
40
10
非统计专业
统计专业
男
13
10
女
7
20
喜欢甜品
不喜欢甜品
合计
南方学生
60
20
80
北方学生
10
10
20
合计
70
30
100
P(χ2≥k)
0.100
0.050
0.010
k
2.706
3.841
6.635
超过m
不超过m
第一种生产方式
第二种生产方式
P(χ2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
超过m
不超过m
第一种生产方式
15
5
第二种生产方式
5
15
成绩
性别
不及格
及格
总计
男
6
14
20
女
10
22
32
总计
16
36
52
视力
性别
好
差
总计
男
4
16
20
女
12
20
32
总计
16
36
52
智商
性别
偏高
正常
总计
男
8
12
20
女
8
24
32
总计
16
36
52
阅读量
性别
丰富
不丰富
总计
男
14
6
20
女
2
30
32
总计
16
36
52
Y1
Y2
X1
a
20-a
X2
15-a
30+a
无效
有效
合计
男性患者
15
35
50
女性患者
6
44
50
合计
21
79
100
不喜欢足球
喜欢足球
总计
高于40岁
p
q
50
不高于40岁
15
35
50
总计
a
b
100
P(χ2≥k)
0.05
0.025
0.010
0.001
k
3.841
5.024
6.635
10.828
箱产量<50 kg
箱产量≥50 kg
旧养殖法
新养殖法
P(χ2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
箱产量<50 kg
箱产量≥50 kg
总计
旧养殖法
62
38
100
新养殖法
34
66
100
总计
96
104
200
高中数学人教B版 (2019)选择性必修 第二册4.2.5 正态分布练习: 这是一份高中数学人教B版 (2019)选择性必修 第二册4.2.5 正态分布练习,共7页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
2020-2021学年第三章 排列、组合与二项式定理3.1 排列与组合3.1.2 排列与排列数课时作业: 这是一份2020-2021学年第三章 排列、组合与二项式定理3.1 排列与组合3.1.2 排列与排列数课时作业,共5页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
高中数学人教B版 (2019)选择性必修 第二册4.2.3 二项分布与超几何分布课堂检测: 这是一份高中数学人教B版 (2019)选择性必修 第二册4.2.3 二项分布与超几何分布课堂检测,共6页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。