北师大版 (2019)选择性必修 第一册3.1 独立性检验导学案
展开[笔记教材]
知识点一 2×2列联表
设A,B为两个变量,每一个变量都可以取两个值,
变量A:A1,A2=eq \x\t(A)1;
变量B:B1,B2=eq \x\t(B)1.
将下面的一张2行2列的表,称为2×2列联表.
知识点二 统计量χ2
1.独立性检验的计算公式
χ2=eq \f(nad-bc2,a+bc+ba+cb+d).
(其中n=a+b+c+d)
2.作用:通过其值的大小对变量的独立性进行判断,常用结论有:
(1)当χ2≤2.706时,没有充分的证据判断变量A,B有关联,可以认为变量A,B是没有关联的;
(2)当χ2>2.706时,有90%的把握判断变量A,B有关联;
(3)当χ2>3.841时,有95%的把握判断变量A,B有关联;
(4)当χ2>6.635时,有99%的把握判断变量A,B有关联.
[重点理解]
1.2×2列联表的理解
(1)2×2列联表主要用于研究两个事件之间是相互独立的还是存在某种关联性,它适用于分析两个事件之间的关系.
(2)2×2列联表有助于直观地观测数据之间的关系.
(3)可以通过2×2列联表中eq \f(a,a+b)与eq \f(c,c+d)值的大小粗略地判断两个事件之间有无关系.一般其值相差越大,两个事件有关系的可能性越大.
2.独立性检验的公式与定义的理解
(1)利用χ2进行独立性检验,可以对推断的正确性的概率作出估计,样本容量n越大,这个估计值越准确,如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性,所以使用χ2统计量作2×2列联表的独立性检验时,通常要求表中的a,b,c,d都大于5,在选取样本容量时一定要注意这一点.
(2)随机事件A与B独立时,也称为A与B无关.当χ2≤k时,一般不直接说A与B无关,而是表述为没有1-α的把握认为A与B有关.当χ2>k时,可以认为有1-α的把握认为A与B有关,或者在犯错误的概率不超过α的前提下认为A与B有关.
[自我排查]
1.判断正误.(正确的打“√”,错误的打“”)
(1)2×2列联表中的数据是两个分类变量的频数.(√)
(2)分类变量中的变量与函数中的变量是同一概念.()
(3)独立性检验的方法就是反证法.()
(4)独立性检验中可通过统计表从数据上说明两分类变量的相关性的大小.(√)
(5)若由一个2×2列联表中的数据计算得χ2=4.013,那么有95%的把握认为两个变量之间有关系.(√)
2.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )
A.平均数与方差
B.回归分析
C.独立性检验
D.概率
答案:C
3.对分类变量X与Y的统计量χ2的值的说法正确的是( )
A.χ2越大,“X与Y有关系”的把握性越小
B.χ2越小,“X与Y有关系”的把握性越小
C.χ2越接近于0,“X与Y无关系”的把握性越小
D.χ2越接近于0,“X与Y无关系”的把握性越大
答案:B
4.在一个2×2列联表中,通过数据计算得χ2=8.325,则这两个变量间有关系的可能性为________.
答案:99%
5.下面是2×2列联表:
则a+b=________________.
答案:106
研习1 2×2列联表
[典例1] 在调查的480名男性中有38名患有色盲,520名女性中有6名患有色盲,试作出性别与色盲的列联表.
[解] 根据题目所给的数据作出如下的列联表:
[巧归纳] 1.作2×2列联表时,关键是分清涉及的变量类别.注意应该是4行4列,计算时要准确无误.
2.利用2×2列联表分析两变量间的关系时,首先要根据题中数据获得2×2列联表,然后可以根据频率特征,即将eq \f(a,a+b)与eq \f(c,c+d)eq \b\lc\(\rc\)(\a\vs4\al\c1(或\f(b,a+b)与\f(d,c+d)))的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.
3.2×2列联表中X,Y对应的数据是从总体中抽取样本的统计数据,所以即使X,Y独立,ad-bc一般也不恰好等于零.
4.2×2列联表中,|ad-bc|越小,说明“X,Y独立”正确的可能性越大;|ad-bc|越大,说明“X,Y有关联”(即X,Y不独立)正确的可能性越大.
[练习1](2022山西临汾古县一中模拟)下面是2×2列联表:
则表中a,b的值分别为( )
A.94,72 B.52,50
C.52,74 D.74,52
答案:C
解析:∵a+21=73,∴a=52,又a+22=b,∴b=74.
研习2 独立性检验
[典例2] 有两个变量X与Y,有一组观测的2×2列联表如下,其中,a,15-a均为大于5的整数,则a=________时,有90%以上的把握认为“X与Y之间有关联”.
答案:8或9
[解析] 要使有90%以上的把握认为X与Y之间有关联,则χ2>2.706.
χ2=eq \f(65[a30+a-20-a15-a]2,20×45×15×50)=eq \f(1313a-602,60×90)>2.706,
解得a>7.19或a<2.04.又因为a>5,且15-a>5,a∈Z,所以a的值为8或9,即当a取8或9时,有90%以上的把握认为“X与Y之间有关联”.
[巧归纳] 1.熟练掌握χ2统计量的数值计算,根据计算得出χ2的值,对比三个临界值2.706,3.841和6.635,作出统计推断.
2.独立性检验的一般步骤:
(1)根据样本数据列2×2列联表.
(2)计算χ2=eq \f(nad-bc2,a+bc+da+cb+d)的值.
(3)将χ2的值与临界值进行比较,若χ2大于临界值,则认为X与Y有关,否则没有充分的理由说明这个假设不成立.
[练习2]在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:能否在犯错误的概率不超过1%的前提下认为该种血清能起到预防感冒的作用.
解:由列联表中的数据,求得χ2=eq \f(1 000×258×284-242×2162,474×526×500×500)≈7.075.
χ2=7.075≥6.635,查表得P(χ2≥6.635)=0.01,
故能在犯错误的概率不超过1%的前提下,认为该种血清能起到预防感冒的作用.
研习3 独立性检验基本思想的应用
[典例3] 为了解某市创建文明城市过程中,学生对创建工作的满意情况,相关部门对某中学的100名学生进行调查,其中有50名男生对创建工作表示满意,有15名女生对创建工作表示不满意.已知在全部100名学生中随机抽取1人,其对创建工作表示满意的概率为eq \f(4,5).是否有充足的证据说明,学生对创建工作的满意情况与性别有关?
[解] 由题意得2×2列联表如下:
χ2=eq \f(100×50×15-30×52,80×20×55×45)≈9.091>6.635,
∴我们有99%的把握认为学生对创建工作的满意情况与性别有关.
[巧归纳] 1.独立性检验的基本思想是要确认两个变量有关系这一结论成立的可信程度,首先假设结论“两个变量没有关系”成立,在该假设下我们构造的统计量χ2应该很小,如果用观测数据计算的统计量χ2很大,则在一定程度上说明假设不合理.由χ2与临界值的大小关系,作出判断.
2.独立性检验仍然属于用样本估计总体,由于样本抽取具有随机性,因而作出的推断可能正确,也可能错误,有95%(或99%)的把握认为事件A与B有关,则推断结论为错误的可能性仅为5%(或1%).
[练习3](2022陕西渭南模拟)在对吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A.若χ2>6.635,我们有99%的把握认为吸烟与患肺病有关,则如果某人吸烟,那么他99%可能患肺病
B.若由随机变量χ2求出有99%的把握认为吸烟与患肺病有关,则在100人中有99人患肺病
C.若由随机变量χ2求出有95%的把握认为吸烟与患肺病有关,那么有5%的可能性使得推断错误
D.以上说法都不正确
答案:C
解析:∵随机变量χ2求出有95%的把握说吸烟与患肺病有关,
∴有5%的可能性使得推断错误,认为吸烟与患肺病无关,故选C.
1.下面是一个2×2列联表:则表中a,b处的值分别为( )
A.32,40 B.42,50
C.74,82 D.64,72
答案:A
解析:a=53-21=32,b=a+8=40.
2.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算χ2=8.01,则有多大的把握认为喜欢乡村音乐与性别有关系( )
A.0.1% B.1%
C.99% D.99.9%
答案:C
解析:因为χ2>6.635,所以有99%以上的把握认为“喜欢乡村音乐与性别有关系”.
3.在2×2列联表中,两个比值eq \f(a,a+b)与________相差越大,两个分类变量有关系的可能性越大.
答案:eq \f(c,c+d)
解析:根据2×2列联表可知,比值eq \f(a,a+b)与eq \f(c,c+d)相差越大,则|ad-bc|就越大,那么两个分类变量有关系的可能性就越大.
4.以下关于独立性检验的说法中,正确的是________.(填序号)
①独立性检验依据小概率原理;
②独立性检验得到的结论一定正确;
③样本不同,独立性检验的结论可能有差异;
④独立性检验不是判断两分类变量是否相关的唯一方法.
答案:①③④
解析:独立性检验得到的结论不一定正确,故②错,①③④正确.
5.某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:
根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
答案:①③④
解析:独立性检验得到的结论不一定正确,故②错,①③④正确.
解:将2×2列联表中的数据代入公式计算,得
χ2=eq \f(nad-bc2,a+bc+da+cb+d)
=eq \f(100×60×10-20×102,70×30×80×20)=eq \f(100,21)≈4.762.
因为4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
[误区警示]
对χ2公式记忆不清致错
[示例] 下列关于χ2的说法正确的是( )
A.χ2在任何相互独立问题中都可以用来检验有关还是无关
B.χ2的值越大,两个分类变量的相关程度就越大
C.χ2是用来判断两个分类变量是否有关系的随机变量,只对两个分类变量适用
D.χ2的计算公式为χ2=eq \f(nad-bc,a+bc+da+cb+d)
[错解] B
[错因分析] χ2的值越大,只是说明两个分类变量有关系的可能性较大.
[正解] C
[题后总结] χ2只是能判断两个分类变量有关系的可能性大小,不能判断两变量相关程度的大小.
新课程标准
新学法解读
1.通过实例,理解2×2列联表的统计意义.
2.通过实例,了解2×2列联表独立性检验及其应用.
1.理解独立性检验的基本思想及其实施步骤.
2.能利用2×2列联表探讨两个分类变量的关系.
3.了解χ2的含义及其应用.
B
A
B1
B2
总计
A1
a
b
a+b
A2
c
d
c+d
总计
a+c
b+d
n=a+b+c+d
α
0.100
0.050
0.025
0.010
0.001
k
2.706
3.841
5.024
6.635
10.828
y
x
y1
y2
总计
x1
a
21
73
x2
2
25
27
总计
b
46
100
患色盲情况
性别
患色盲
不患色盲
总计
男
38
442
480
女
6
514
520
总计
44
956
1 000
y1
y2
总计
x1
a
21
73
x2
22
25
47
总计
b
46
120
Y
X
y1
y2
x1
a
20-a
x2
15-a
30+a
未感冒
感冒
总计
使用血清
258
242
500
未使用血清
216
284
500
总计
474
526
1 000
满足情况
性别
满意
不满意
总计
男生
50
5
55
女生
30
15
45
总计
80
20
100
y1
y2
总计
x1
a
21
53
x2
8
25
33
总计
b
46
α
0.100
0.050
0.025
0.010
0.001
k
2.706
3.841
5.024
6.635
10.828
喜欢甜品
不喜欢甜品
总计
南方学生
60
20
80
北方学生
10
10
20
总计
70
30
100
高中数学北师大版 (2019)选择性必修 第一册2.1 排列与排列数导学案: 这是一份高中数学北师大版 (2019)选择性必修 第一册2.1 排列与排列数导学案,共12页。
北师大版 (2019)选择性必修 第一册3.1 组合学案: 这是一份北师大版 (2019)选择性必修 第一册3.1 组合学案,共15页。
高中第四章 概率与统计4.3 统计模型4.3.2 独立性检验学案设计: 这是一份高中第四章 概率与统计4.3 统计模型4.3.2 独立性检验学案设计,共3页。学案主要包含了学习目标,学习过程等内容,欢迎下载使用。