![专题09 独立性检验(原卷版)第1页](http://m.enxinlong.com/img-preview/3/3/14374281/1/0.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![专题09 独立性检验(原卷版)第2页](http://m.enxinlong.com/img-preview/3/3/14374281/1/1.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![专题09 独立性检验(原卷版)第3页](http://m.enxinlong.com/img-preview/3/3/14374281/1/2.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![专题09 独立性检验(解析版)第1页](http://m.enxinlong.com/img-preview/3/3/14374281/0/0.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![专题09 独立性检验(解析版)第2页](http://m.enxinlong.com/img-preview/3/3/14374281/0/1.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![专题09 独立性检验(解析版)第3页](http://m.enxinlong.com/img-preview/3/3/14374281/0/2.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
所属成套资源:2022-2023学年高二数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019选择性必修第二册)
- 专题04 二项式定理——2022-2023学年高二数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019选择性必修第二册) 学案 1 次下载
- 专题07 二项分布、超几何分布与正态分布——2022-2023学年高二数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019选择性必修第二册) 学案 1 次下载
- 专题08 变量间的相关关系及回归模型——2022-2023学年高二数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019选择性必修第二册) 学案 1 次下载
- 高二数学下学期期末模拟卷01——2022-2023学年高二数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019选择性必修第二册) 学案 0 次下载
- 高二数学下学期期末模拟卷02——2022-2023学年高二数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019选择性必修第二册) 学案 0 次下载
专题09 独立性检验——2022-2023学年高二数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019选择性必修第二册)
展开
这是一份专题09 独立性检验——2022-2023学年高二数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019选择性必修第二册),文件包含专题09独立性检验解析版docx、专题09独立性检验原卷版docx等2份学案配套教学资源,其中学案共35页, 欢迎下载使用。
专题09 独立性检验
知识点1 分类变量
分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量;
知识点2 列联表
列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,X表示相互对立的两个事件{X=0}和{X=1},Y表示相互对立的两个事件{Y=0}和{Y=1},其中a,b,c,d是事件{X=x,Y=y}(x,y=0,1)的频数,n是样本量,其样本频数列联表(称为2×2列联表)如表所示:
关于分类变量X和Y的抽样数据的2×2列联表:
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
知识点3 独立性检验
(1)小概率值α的临界值:对于任何小概率值α,可以找到相应的正实数xα,使得关系P(χ2≥xα)=α成立.我们称xα为α的临界值,这个临界值可作为判断χ2大小的标准.概率值α越小,临界值xα越大;
(2)χ2的计算公式:χ2=;
(3)独立性检验:利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验;
(4)基于小概率值α的检验规则:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立(其中xα为α的临界值);
知识点4 应用独立性检验解决实际问题的步骤
①提出零假设H0:X和Y相互独立,并给出在问题中的解释;
②根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较;
③根据检验规则得出推断结论;
④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
(6)独立性检验中几个常用的小概率值和相应的临界值:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
考点1 分类变量与列联表
【例1】(多选)根据如图所示的等高堆积条形图,下列叙述正确的是 ( )
A.吸烟患肺病的频率约为0.2
B.吸烟不患肺病的频率约为0.8
C.不吸烟患肺病的频率小于0.05
D.吸烟与患肺病无关系
【答案】ABC
【解析】从等高堆积条形图上可以明显地看出,吸烟患肺病的频率远远大于不吸烟患肺病的频率.A、B、C都正确.
【总结】分类变量的两种统计表示形式
(1)等高堆积条形图:根据等高堆积条形图的高度差判断两分类变量是否有关联及关联强弱;
(2)2×2列联表:直接利用2×2列联表中的数据进行计算分析,用定量的方式判断两分类变量是否有关联及关联强弱.
【变式1-1】如下是一个2×2列联表,则m+n= .
X
Y
合计
y1
y2
x1
a
35
45
x2
7
b
n
合计
m
73
s
【答案】62
【解析】根据2×2列联表可知a+35=45,解得a=10,则m=a+7=17,又由35+b=73,解得b=38,则n=7+b=45,故m+n=17+45=62.
【变式1-2】为考察A,B两种药物预防某疾病的效果,进行药物实验,分别得到如下等高堆积条形图:
根据图中信息,在下列各项中,说法最佳的一项是( )
A.药物B的预防效果优于药物A的预防效果
B.药物A的预防效果优于药物B的预防效果
C.药物A,B对该疾病均有显著的预防效果
D.药物A,B对该疾病均没有预防效果
【答案】B
【解析】从等高堆积条形图可以看出,服用药物A后未患病的比例比服用药物B后未患病的比例大得多,预防效果更好.
【变式1-3】为了解某大学的学生是否爱好体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得到如下2×2列联表:
男
女
合计
爱好
a
b
73
不爱好
c
25
合计
74
则a-b-c等于( )
A.7 B.8 C.9 D.10
【答案】C
【解析】根据题意,可得c=120-73-25=22,a=74-22=52,b=73-52=21,
∴a-b-c=52-21-22=9.
【变式1-4】如表是2×2列联表,则表中的a,b的值分别为( )
y1
y2
合计
x1
a
8
35
x2
11
34
45
合计
b
42
80
A.27,38 B.28,38 C.27,37 D.28,37
【答案】A
【解析】a=35-8=27,b=a+11=27+11=38.
考点2 分类变量关联性的判断
【例2】某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表:
患心脏病
无心脏病
秃发
20
300
不秃发
5
450
根据表中数据得到χ2≈15.968,因为χ2>10.828,则断定秃发与患心脏病有关系.那么这种判断出错的可能性为 ( )
A.0.001 B.0.05
C.0.025 D.0.01
【答案】A
【解析】因为χ2>10.828=x0.001,因此判断出错的可能性为0.001,故选A.
【总结】如果χ2>xα,则“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.
【变式2-1】某市政府调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3 000人,计算得χ2=6.023,则市政府断言市民收入增减与旅游愿望有关系的可信程度是( )
A.90% B.95% C.99% D.99.5%
【答案】B
【解析】由临界值表,得6.023>3.841=x0.05,所以可断言市民收入增减与旅游愿望有关系的可信程度为95%.
【变式2-2】对甲、乙两个班级学生的数学考试成绩按照优秀和不优秀统计人数后,得到如下的列联表,则χ2约为 ( )
班级
数学成绩
合计
优秀
不优秀
甲班
11
34
45
乙班
8
37
45
合计
19
71
90
A.0.600 B.0.828
C.2.712 D.6.014
【答案】A
【解析】χ2=90×(11×37-34×8)219×71×45×45≈0.600,故选A.
【变式2-3】两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于97.5%,则c=( )
A.3 B.4
C.5 D.6
【答案】A
【解析】列2×2列联表如下:
X
Y
合计
y1
y2
x1
10
21
31
x2
c
d
35
合计
10+c
21+d
66
故χ2=66×[10(35-c)-21c]231×35×(10+c)(56-c)≥5.024.把选项A、B、C、D代入验证可知选A.
【变式2-4】(多选)千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了A地区的100天日落和夜晚天气,得到如下2×2 列联表,并计算得到χ2≈19.05,下列小波对A地区天气的判断正确的是( )
日落云里走
夜晚天气
下雨
未下雨
出现
25
5
未出现
25
45
A.夜晚下雨的概率约为12
B.未出现“日落云里走”,夜晚下雨的概率约为514
C.依据α=0.005 的独立性检验,认为“日落云里走”是否出现与夜晚天气有关
D.依据α=0.005 的独立性检验,若出现“日落云里走”,则认为夜晚一定会下雨
【答案】ABC
【解析】根据列联表可知,100天中有50天下雨,50天未下雨,因此夜晩下雨的概率约为50100=12,A正确;未出现“日落云里走”,夜晩下雨的概率约为2525+45=514,B正确;χ2≈19.05>7.879=x0.005,因此依据α=0.005 的独立性检验,认为“日落云里走”是否出现与夜晩天气有关,C正确;依据α=0.005的独立性检验,可判断“日落云里走,雨在半夜后”的说法犯错误的概率小于0.005,但不代表一定会下雨,D错误.
【变式2-5】(多选)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下所示的列联表,经计算χ2≈4.762,则可以推断出( )
满意
不满意
男
30
20
女
40
10
A.该学校男生对食堂服务满意的概率的估计值为35
B.调研结果显示,该学校男生比女生对食堂服务更满意
C.认为男、女生对该食堂服务的评价有差异此推断犯错误的概率不超过0.05
D.认为男、女生对该食堂服务的评价有差异此推断犯错误的概率不超过0.01
【答案】AC
【解析】对于A,该学校男生对食堂服务满意的概率的估计值为3030+20=35,故A正确;对于B,该学校女生对食堂服务满意的概率的估计值为4040+10=45>35,故B错误;因为χ2≈4.762>3.841=x0.05,认为男、女生对该食堂服务的评价有差异,此推断犯错误的概率不超过0.05,故C正确,D错误.
【变式2-6】(多选)有两个分类变量X,Y,其2×2列联表如下所示:
X
Y
合计
y1
y2
x1
a
20-a
20
x2
15-a
30+a
45
合计
15
50
65
其中a,15-a均为大于5的整数,若依据小概率值α=0.05的独立性检验,认为X,Y有关,则a的值为 ( )
A.6 B.7
C.8 D.9
【答案】CD
【解析】由题意可知χ2=13×(13a-60)220×45×3×2>3.841,根据a>5且15-a>5,a∈Z,求得当a=8或9时满足题意.
【变式2-7】某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出零假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,经查临界值表知x0.05=3.841.则下列结论中,正确结论的序号是 .
①认为“这种血清能起到预防感冒的作用”犯错误的概率不超过0.05;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.
【答案】①
【解析】χ2≈3.918>3.841=x0.05,所以认为“这种血清能起到预防感冒的作用”,这种推断犯错误的概率不超过0.05.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.
【变式2-8】某高校《统计初步》课程的教师随机调查了选该课的学生情况,调查数据如下表:
非统计专业
统计专业
男
13
10
女
7
20
为了判断是否主修统计专业与性别的关系,根据表中的数据,计算得到χ2≈ (保留三位小数),所以判定 (填“能”或“不能”)在犯错误的概率不超过0.05的前提下,认为是否主修统计专业与性别有关.
【答案】4.844 能
【解析】由题意可知,χ2=50×(13×20-7×10)223×27×20×30≈4.844>3.841=x0.05,所以能在犯错误的概率不超过0.05的前提下,认为是否主修统计专业与性别有关.
【变式2-9】(2021·全国甲卷·改编)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品
二级品
合计
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)依据小概率值α=0.01的独立性检验,能否以此推断甲机床的产品质量与乙机床的产品质量有差异?
【解析】(1)根据题表中数据知,甲机床生产的产品中一级品的频率是=0.75,乙机床生产的产品中一级品的频率是=0.6.
(2)零假设为H0:甲机床的产品质量与乙机床的产品质量无差异.根据2×2列联表,可得
χ2==
≈10.256>6.635=x0.01.
根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为甲机床的产品质量与乙机床的产品质量有差异.
【变式2-10】(多选)针对时下的“航天热”,某校团委对“是否喜欢航天与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢航天的人数占男生人数的45,女生中喜欢航天的人数占女生人数的35,若依据α=0.05的独立性检验,认为是否喜欢航天与学生性别有关,则被调查的学生中男生的人数可能为 ( )
A.25 B.45
C.60 D.75
【答案】BCD
【解析】设男生的人数为5n(n∈N*),根据题意列出2×2列联表如下所示:
是否喜欢航天
性别
合计
男生
女生
喜欢航天
4n
3n
7n
不喜欢航天
n
2n
3n
合计
5n
5n
10n
则χ2=10n×(4n×2n-3n×n)25n×5n×7n×3n=10n21,∵依据α=0.05的独立性检验,认为是否喜欢航天与学生性别有关,∴χ2≥3.841,即10n21≥3.841,得n≥8.066 1,∴5n≥40.330 5,又n∈N*,∴结合选项知B、C、D正确.故选B、C、D.
【变式2-11】某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:
性别
休闲方式
合计
读书
健身
女
24
31
55
男
8
26
34
合计
32
57
89
在犯错误的概率不超过 的前提下认为性别与休闲方式有关系.
【答案】0.1
【解析】由列联表中的数据,得χ2=89×(24×26-31×8)255×34×32×57≈3.689>2.706=x0.1,因此,在犯错误的概率不超过0.1的前提下认为性别与休闲方式有关系.
【变式2-12】某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55名学员中有50名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过 .
【答案】0.001
【解析】由题意,可得如下2×2列联表:
考试情况
培训方式
合计
集中培训
分散培训
一次考试通过
50
30
80
一次考试未通过
5
20
25
合计
55
50
105
则χ2=105×(50×20-5×30)255×50×80×25≈13.793>10.828=x0.001,故认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过0.001.
考点3 独立性检验的应用
【例3】(2022·全国甲卷·改编)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
准点班次数
未准点班次数
A
240
20
B
210
30
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)根据小概率值α=0.1的独立性检验,能否认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).
α
0.100
0.050
0.010
xα
2.706
3.841
6.635
【解析】(1)由题表可得A公司甲、乙两城之间的长途客车准点的概率为240240+20=1213,
B公司甲、乙两城之间的长途客车准点的概率为210210+30=78.
(2)零假设为H0:甲、乙两城之间的长途客车是否准点与客车所属公司无关,列联表如下表所示:
公司
班次是否准点
合计
准点班次数
未准点班次数
A
240
20
260
B
210
30
240
合计
450
50
500
χ2=500×(240×30-210×20)2260×240×450×50≈3.205>2.706=x0.1,
根据小概率值α=0.1的独立性检验我们推断H0不成立,即认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
【总结】独立性检验的一般步骤
(1)根据样本数据制成2×2列联表;
(2)根据公式χ2=计算;
(3)比较χ2与临界值的大小关系,作统计推断.
【变式3-1】为推行“新课堂”教学法,某化学老师分别用传统教学和“新课堂”两种不同的教学方式,在甲、乙两个平行班级进行教学实验.为了比较教学效果,期中考试后,分别从两个班级中各随机抽取20名学生的成绩进行统计,结果如下表.记成绩不低于70分的为“成绩优良”.
分数
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
甲班频数
5
6
4
4
1
乙班频数
1
3
6
5
5
由以上统计数据列出2×2列联表,并判断能否依据小概率值α=0.05的χ2独立性检验认为“成绩优良与教学方式有关”.
【解析】由题意,列联表如下:
成绩
班级
合计
甲班
乙班
优良
9
16
25
不优良
11
4
15
合计
20
20
40
零假设为H0:成绩优良与教学方式无关,
由列联表计算可得χ2=40×(9×4-16×11)225×15×20×20≈5.227>3.841,
依据独立性检验,有充分证据推断H0不成立,即依据小概率值α=0.05的独立性检验,可以认为“成绩优良与教学方式有关”.
【变式3-2】某城市地铁将于2024年6月开始运营,为此召开了一个价格听证会,拟定价格后又进行了一次调查,随机抽查了50人,他们的收入与态度如下:
月收入(单位:百元)
[15,25)
[25,35)
[35,45)
[45,55)
[55,65)
[65,75]
赞成定价者人数
1
2
3
5
3
4
认为价格偏高者人数
4
8
12
5
2
1
(1)若以区间的中点值为该区间内的人均月收入,求参与调查的人员中“赞成定价者”与“认为价格偏高者”的月平均收入的差距是多少(结果保留2位小数);
(2)由以上统计数据列出2×2列联表,依据小概率值α=0.01的独立性检验,可否认为“月收入以55百元为分界点对地铁定价的态度有差异”?
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
α
0.1
0.05
0.01
0.005
xα
2.706
3.841
6.635
7.879
【解析】(1)“赞成定价者”的月平均收入为x1=20×1+30×2+40×3+50×5+60×3+70×41+2+3+5+3+4≈50.56.
“认为价格偏高者”的月平均收入为x2=20×4+30×8+40×12+50×5+60×2+70×14+8+12+5+2+1=38.75,
∴“赞成定价者”与“认为价格偏高者”的月平均收入的差距是x1-x2=50.56-38.75=11.81(百元).
(2)根据条件可得2×2列联表如下:
对地铁定价的态度
人均月收入
合计
不低于55百元的人数
低于55百元的人数
认为价格偏高者
3
29
32
赞成定价者
7
11
18
合计
10
40
50
零假设为H0:月收入以55百元为分界点对地铁定价的态度无差异.
χ2=50×(3×11-7×29)210×40×18×32≈6.27<6.635=x0.01,
∴根据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为“月收入以55百元为分界点对地铁定价的态度没有差异”.
【变式3-3】一家大型超市委托某机构调查该超市的顾客使用移动支付的情况.调查人员从年龄在20岁至60岁的顾客中,随机抽取了200人,调查结果如图:
(1)补全下面列联表,并根据列联表判断在小概率值α=0.001的独立性检验下,能否推断使用移动支付与年龄有关?
移动支付
年龄
合计
年龄<40
年龄≥40
使用
不使用
合计
200
(2)现从该超市这200位顾客年龄在[55,60]的人中,随机抽取2人,记这两人中使用移动支付的顾客为X人,求X的分布列.
【解析】(1)补全列联表如下:
移动支付
年龄
合计
年龄<40
年龄≥40
使用
85
40
125
不使用
10
65
75
合计
95
105
200
零假设为H0:使用移动支付与年龄无关,则
χ2=200×(85×65-40×10)2125×75×95×105≈56.17>10.828=x0.001,
根据小概率值α=0.001的独立性检验,我们推断H0不成立,因此可以认为使用移动支付与年龄有关.
(2)X的可能取值为0,1,2,
P(X=0)=C222C292=3358,
P(X=1)=C221C71C292=1129,
P(X=2)=C72C292=358,
∴X的分布列为
X
0
1
2
P
3358
1129
358
【变式3-4】(多选)某医疗研究机构为了了解免疫与注射疫苗的关系,进行一次抽样调查,得到数据如表1.
免疫
不免疫
合计
注射疫苗
10
10
20
未注射疫苗
6
34
40
合计
16
44
60
(表1)
α
0.10
0.050
0.010
0.001
xα
2.706
3.841
6.635
10.828
(表2)
则下列说法中正确的是( )
A.χ2≈8.35
B.P(χ2≥6.635)≈0.001
C.依据小概率值α=0.01的独立性检验,我们认为免疫与注射疫苗有关系
D.依据小概率值α=0.001的独立性检验,我们认为免疫与注射疫苗有关系
【答案】AC
【解析】由表中数据,
得χ2=≈8.352≈8.35,所以A正确;
因为P(χ2≥6.635)≈0.01,所以B错误;
χ2≈8.352>6.635=x0.01,依据小概率值α=0.01的独立性检验,我们认为免疫与注射疫苗有关系,所以C正确;
χ2≈8.3526.635=x0.01,
根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为该市一天的空气质量与当天SO2的浓度有关.
【变式3-6】为进一步保护环境,加强治理空气污染,某市环保监测部门对市区空气质量进行调研,随机抽查了市区100天的空气质量等级与当天空气中SO2的浓度(单位:μg/m3),整理数据得到下表:
SO2的浓度
空气质量等级
[0,50]
(50,150]
(150,475]
1(优)
28
6
2
2(良)
5
7
8
3(轻度污染)
3
8
9
4(中度污染)
1
12
11
若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”,根据上述数据,回答以下问题.
(1)估计事件“该市一天的空气质量好,且SO2的浓度不超过150”的概率;
(2)完成下面的2×2列联表,
SO2的浓度
空气质量
[0,150]
(150,475]
合计
空气质量好
空气质量不好
合计
(3)根据(2)中的列联表,依据小概率值α=0.01的独立性检验,能否据此推断该市一天的空气质量与当天SO2的浓度有关?
【解析】(1)由表格可知,该市一天的空气质量好,且SO2的浓度不超过150的天数为28+6+5+7=46,则“该市一天的空气质量好,且SO2的浓度不超过150”的概率P==0.46.
(2)由表格数据可得列联表如下,
SO2的浓度
空气质量
[0,150]
(150,475]
合计
空气质量好
46
10
56
空气质量不好
24
20
44
合计
70
30
100
(3)零假设为H0:该市一天的空气质量与当天SO2的浓度无关.
由(2)知χ2=
≈8.936>6.635=x0.01,
根据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为该市一天的空气质量与当天SO2的浓度有关.
【变式3-7】某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55个学员中有45名学员一次考试通过,接受周末分散培训的学员一次考试通过的有30个.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过________.
附:χ2=,其中n=a+b+c+d;
α
0.05
0.025
0.010
0.001
xα
3.841
5.024
6.635
10.828
【答案】0.025
【解析】由题意可得列联表如下,
集中培训
分散培训
合计
一次考过
45
30
75
一次未考过
10
20
30
合计
55
50
105
χ2=≈6.109>5.024=x0.025.
考点4 独立性检验与概率的综合问题
【例4】某种疾病可分为A,B两种类型.为了解患该疾病的类型与患者性别是否相关,在某地区随机抽取了若干名该疾病的患者进行调查,发现女性患者总人数是男性患者总人数的2倍,男性患A型疾病的人数占男性患者总人数的56,女性患A型疾病的人数占女性患者总人数的13.
(1)若本次调查得出“依据小概率值α=0.005的χ2独立性检验,认为所患疾病类型与性别有关”的结论,求被调查的男性患者至少有多少人;
(2)某团队进行预防A型疾病的疫苗的研发试验,试验期间至多安排2个周期接种疫苗,每人每个周期接种3次,每次接种费用为m(m>0)元.该团队研发的疫苗每次接种后产生抗体的概率为p(0<p<1),如果一个周期内至少2次产生抗体,则该周期结束后终止试验,否则进入第二个周期.若p=23,试验人数为1 000,试估计该试验用于接种疫苗的总费用.
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中 n=a+b+c+d.
α
0.10
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
【解析】(1)设男性患者有x人,则女性患者有2x人,由题意得2×2列联表如下:
性别
所患疾病类型
合计
A型疾病
B型疾病
男性患者
5x6
x6
x
女性患者
2x3
4x3
2x
合计
3x2
3x2
3x
零假设为H0:患者所患疾病类型与性别之间无关联,
根据列联表中的数据可得χ2=3x5x6·4x3-x6·2x323x2·3x2·2x·x=2x3,
要使依据小概率值α=0.005的χ2独立性检验可以认为所患疾病类型与性别有关,
则2x3≥7.879,解得x≥11.818 5,
因为x6∈N,x3∈N,所以x的最小整数值为12,
所以被调查的男性患者至少有12人.
(2)设该试验每人的接种费用为ξ元,则ξ的可能取值为3m,6m.
则P(ξ=3m)=C32p2(1-p)+p3=-2p3+3p2,P(ξ=6m)=1-P(ξ=3m)=1+2p3-3p2,
所以E(ξ)=3m·(-2p3+3p2)+6m·(1+2p3-3p2)=3m(2p3-3p2+2),
因为p=23,试验人数为1 000,所以该试验用于接种疫苗的总费用为1 000E(ξ),
即1 000×3m2×233-3×232+2=34 0009m(元).
故估计该试验用于接种疫苗的总费用为34 0009m元.
【总结】独立性检验与概率综合问题的解题思路
本类题目以生活题材为背景,涉及独立性检验及概率问题的综合,解决该类问题首先收集数据列出2×2列联表,并按照公式求得χ2的值后进行比较,其次再按照随机变量满足的概率模型求解.
【变式4-1】北京时间2022年9月2日,经过约6小时的出舱活动,神舟十四号航天员陈冬、刘洋、蔡旭哲密切协同,完成出舱活动期间全部既定任务,陈冬、刘洋已安全返回问天实验舱,出舱活动取得圆满成功.为了了解某学校学生对此新闻事件的关注程度,从该校随机抽取了200名学生进行分析,得到如下2×2列联表:
性别
是否关注此新闻
合计
关注
不关注
男
90
30
120
女
30
50
80
合计
120
80
200
(1)利用以上数据,判断能否依据小概率值α=0.025的χ2独立性检验认为关注此新闻与性别有关;
(2)将此样本频率视为总体的概率,从该校随机抽取4名男生,记这4人中不关注此新闻的人数为Y,求随机变量Y=2时的概率和随机变量Y的数学期望E(Y).
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中 n=a+b+c+d.
α
0.10
0.05
0.025
xα
2.706
3.841
5.024
【解析】(1)零假设为H0:关注此新闻与性别相互独立,
根据列联表数据,得χ2=200×(90×50-30×30)2120×80×120×80=2258=28.125>5.024=x0.025,
所以根据独立性检验,可以认为零假设H0不成立,
即可以依据小概率值α=0.025的χ2独立性检验认为关注此新闻与性别有关.
(2)由题意,男生不关注此新闻的频率为30120=14,将频率视为概率,每个男生不关注此新闻的概率为14,因为每次抽取的结果是相互独立的,所以Y~B4,14,
所以P(Y=k)=C4k14k1-144-k,k=0,1,2,3,4,
所以P(Y=2)=C421421-144-2=27128,E(Y)=4×14=1.
【变式4-2】机动车行经人行横道时,应当减速慢行.遇行人正在通过人行横道,应当停车让行,俗称“礼让行人”.下表是某市一主干路口监控设备所抓拍的1~5月份驾驶员不“礼让行人”行为统计数据:
月份
1
2
3
4
5
违章驾驶员人数
120
105
100
95
80
(1)请利用所给数据求违章人数y与月份x之间的经验回归方程y=bx+a,并预测该路口10月份的不“礼让行人”违章驾驶员人数;
(2)交警从这5个月内通过该路口的驾驶员中随机抽查70人,调查驾驶员不“礼让行人”行为与驾龄的关系,如下表所示:
驾龄
是否礼让行人
合计
不礼让行人
礼让行人
驾龄不超过1年
24
16
40
驾龄1年以上
16
14
30
合计
40
30
70
依据小概率值α=0.1的独立性检验,能否据此判断“礼让行人”行为与驾龄有关?
【解析】(1)由表中的数据可知,x=1+2+3+4+55=3,
y=120+105+100+95+805=100,
所以b=∑i=1nxiyi-nxy∑i=1nxi2-nx2=1 410-1 50055-45=-9,
故a=y-bx=100-(-9)×3=127,
所以所求的经验回归方程为y=-9x+127,
令x=10,则y=-9×10+127=37.
(2)零假设为H0:“礼让行人”行为与驾龄无关,
由表中的数据可得χ2=70×(24×14-16×16)240×30×40×30=1445≈0.311<2.706=x0.1,
根据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即依据小概率值α=0.1的独立性检验,不能判断“礼让行人”行为与驾龄有关.
【变式4-3】某病毒主要是在人与人之间进行传播,可以通过飞沫、粪便、接触等进行传染,感染人群主要是年龄在40岁以上的群体.该病毒进入人体后有潜伏期(潜伏期是指病原体侵入人体至最早出现临床症状的这段时期),潜伏期越长,感染到他人的可能性越高.现对200个病例的潜伏期Z(单位:天)进行调查,统计发现潜伏期的中位数为5,平均数为7.1,方差为5.06.一般认为超过8天的潜伏期就属于“长潜伏期”,按照年龄统计样本病例人数,如下表所示:
长潜伏期
非长潜伏期
40岁以上
30
110
40岁及40岁以下
20
40
(1)依据α=0.05的独立性检验,能否认为“长潜伏期”与年龄有关?
(2)假设潜伏期服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差.
①为有效防止该病毒的传播,很多省份对入境人员一律要求隔离14天,请用概率和统计的知识解释其合理性;
②将频率近似当作概率,设从这200个病例中另随机抽取的25个病例中属于“长潜伏期”的病例个数是X,X=k(k∈N*,0≤k≤25)的概率记作P(X=k)(k∈N*,0≤k≤25),试求X的数学期望以及当P(X=k)取最大值时k的值.
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
α
0.1
0.05
0.01
xα
2.706
3.841
6.635
若随机变量Z服从正态分布N(μ,σ2),则P(μ-σ≤Z≤μ+σ)≈0.682 7,P(μ-2σ≤Z≤μ+2σ)≈0.954 5,P(μ-3σ≤Z≤μ+3σ)≈0.997 3,5.06≈2.25.
【解析】(1)零假设为H0:长潜伏期与年龄无关,由列联表中数据得,χ2=200×(30×40-110×20)2140×60×50×150=20063≈3.17<3.841=x0.05.
根据小概率值α=0.05的独立性检验,我们没有充分证据推断H0不成立,即认为“长潜伏期”与年龄无关.
(2)①若潜伏期服从N(7.1,5.06),由P(Z≥13.85)≈1-0.997 32=0.001 35,
得潜伏期超过14天的概率很低,因此隔离14天是合理的.
②200个病例中有50个属于“长潜伏期”,将样本频率近似当作概率,则一个患者属于“长潜伏期”的概率是14,
所以另随机抽取的25个病例中属于“长潜伏期”的病例个数X~B25,14,
则E(X)=254,且P(X=k)=C25k14k3425-k(k∈N*,0≤k≤25).
由C25k14k3425-k≥C25k-114k-13426-k,C25k14k3425-k≥C25k+114k+13424-k,得112≤k≤132,
又k∈N*,所以k=6.
故X的数学期望是254,P(X=k)取最大值时k的值为6.
【变式4-4】某中学调查了高一年级学生的选科倾向,随机抽取300人,其中选考物理的有220人,选考历史的有80人,统计各选科人数如表,则下列说法正确的是( )
选择科目
选考类别
思想政治
地理
化学
生物
物理类
80
100
145
115
历史类
50
45
30
35
α
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.706
3.841
5.024
6.635
7.879
10.828
A.物理类的学生中选择政治的比例比历史类的学生中选择政治的比例高
B.物理类的学生中选择地理的比例比历史类的学生中选择地理的比例高
C.根据小概率值α=0.1的独立性检验,我们认为选择生物与选考类别无关
D.根据小概率值α=0.1的独立性检验,我们认为选择生物与选考类别有关
【答案】C
【解析】对于A,物理类的学生中选择政治的比例为=,
历史类的学生中选择政治的比例为=,因为
相关学案
这是一份高二数学下学期期末模拟卷02——2022-2023学年高二数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019选择性必修第二册),文件包含高二数学下学期期末模拟卷02解析版docx、高二数学下学期期末模拟卷02原卷版docx等2份学案配套教学资源,其中学案共15页, 欢迎下载使用。
这是一份高二数学下学期期末模拟卷01——2022-2023学年高二数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019选择性必修第二册),文件包含高二数学下学期期末模拟卷01解析版docx、高二数学下学期期末模拟卷01原卷版docx等2份学案配套教学资源,其中学案共12页, 欢迎下载使用。
这是一份专题08 变量间的相关关系及回归模型——2022-2023学年高二数学下学期期末知识点精讲+训练学案+期末模拟卷(苏教版2019选择性必修第二册),文件包含专题08变量间的相关关系及线性回归分析解析版docx、专题08变量间的相关关系及线性回归分析原卷版docx等2份学案配套教学资源,其中学案共28页, 欢迎下载使用。
![文档详情页底部广告位](http://m.enxinlong.com/img/images/257d7bc79dd514896def3dc0b2e3f598.jpg)