







数学选修1-21.2独立性检验的基本思想及其初步应用图文ppt课件
展开我们经常听到这些说法:吸烟对患肺癌有影响;数学好的人物理一般也很好;性别与是否喜欢数学课程之间有关系;人的血型会决定人的性格;星座与人的命运之间有某种联系;这些说法都有道理吗?
1.理解独立性检验的基本思想.(重点)2.会从列联表、等高条形图直观判断吸烟与患肺癌有关.(难点)3.了解随机变量K2的含义,理解独立性检验的基本思想及实施步骤.(难点)
探究点1 独立性检验的基本思想
对于性别变量,其取值为男和女两种.这种变量的不同“值”表示个体所属的不同类别,这样的变量称为 .
分类变量在现实生活中是大量存在的,如是否吸烟、是否患肺癌、宗教信仰、国别、年龄、出生月份等.
问题:为了研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)
在吸烟者中患肺癌的比重是_______.
说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大.
在不吸烟者中患肺癌的比重是_______,
通过图形直观判断两个分类变量是否相关:
通过数据和图形分析,得到结论是:吸烟与患肺癌有关,那么这种判断是否可靠呢?我们可以通过统计分析回答这个问题.
假设H0: 吸烟与患肺癌之间没有关系,
如果“吸烟与患肺癌没有关系”,那么吸烟样本中不患肺癌的比例应该与不吸烟样本中相应的比例差不多.
它是检验在多大程度上可以认为“两个变量有关系”的标准.
︱ad-bc︱越小,说明吸烟与患肺癌之间的关系越弱,
︱ad-bc︱越大,说明吸烟与患肺癌之间的关系越强.
其中n=a+b+c+d为样本容量.
即在 成立的情况下,K2的观测值大于6.635的概率非常小,近似为0.010,是一个小概率事件.
思考:这个值到底告诉我们什么呢?
现在K2的观测值k≈56.632,远远大于6.635,所以有理由断定H0不成立,即认为“吸烟与患肺癌有关系”.
利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.
(1)假设两个分类变量X与Y没有关系;
(2)计算出K2的观测值k;
(3)把k的值与临界值比较确定X与Y有关的程度或无 关系.
设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
如P(k0>10.828)= 0.001表示在犯错误的概率不超过0.001的前提下,认为“X与Y有关系”.
如P(k0>6.635)= 0.01表示在犯错误的概率不超过0.01的前提下,认为“X与Y有关系”.
独立性检验的基本思想类似反证法
(1)假设结论不成立,即“两个分类变量没有关系”.(2)在此假设下随机变量K2应该很小,如果由观测数据计算得到K2的观测值k很大,则在一定程度上说明假设不合理.(3)根据随机变量K2的含义,可以通过评价该假设不合理的程度,如由实际计算出的k>10.828.说明假设不合理的程度为99.9%,即“两个分类变量有关系”这一结论成立的可信度为约为99.9%.
在一次独立性相关检验中,若能在犯错误的概率不超过0.005的前提下认为两个分类变量X与Y有关系,则k的取值范围是( )A.[5.024,6.635) B.[6.635,7.879)C.[7.879,10.828) D.[7.879,+ )
探究点2 独立性检验的初步应用
例1.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶.而另外772名不是因为患心脏病而住院的男性病人中,有175人秃顶.利用图形判断秃顶与患心脏病是否有关系.能否在犯错误的概率不超过0.010的前提下认为秃顶与患心脏病有关系?
解:根据题目所给数据得到如下列联表:
相应的等高条形图如下所示,
因此,在犯错误的概率不超过0.010的前提下,认为秃顶与患心脏病有关系.
根据列联表中的数据,得到
根据独立性检验原理,如何用W构造一个判断X和Y是否有关系的规则,使得在该规则下把“X和Y没有关系”错判成“X和Y有关系”的概率不超过0.010?
由W的定义可以发现:它越大,越有利于结论“X和Y有关系”;它越小,越有利于结论“X和Y没有关系”.因此可以建立如下的判断规则:
当W的观测值ω≥ ω0时,就判断“X和Y有关系”;否则,判断“X和Y没有关系”.这里ω0为正实数,满足如下条件:在“X和Y没有关系”的前提下,
思考:若在“X和Y没有关系”的情况下有
例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中,有175人秃顶.利用图形判断秃顶与患心脏病是否有关系.能否在犯错误的概率不超过0.01的前提下认为秃顶与患心脏病有关系?
【解题关键】由题意列出2×2列联表,利用公式求得K2后与临界值比较,得出结论后要注意这组数据是来自于住院的病人,而不是随机对全体人群采样.
【解析】由题意列出2×2列联表如下:由公式得K2≈16.373. K2 >6.635.所以有99.9%的把握认为“秃顶与患心脏病有关”.
有甲乙两个班级进行一门课程的考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表:
能否在犯错误的概率不超过0.01的前提下认为成绩与班级有关?
【解析】假设H0 :成绩与班级无关.根据列联表中的数据得:
因此不能在犯错误的概率不超过0.01的前提下认为成绩与班级有关.
1.下列说法中正确的是( )①独立性检验的基本思想是带有概率性质的反证法;②独立性检验就是选取一个假设H0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H0的推断;③独立性检验一定能给出明确的结论. A.①② B.①③ C.②③ D.①②③
2.在2×2列联表中,两个比值________相差越大,两个分类变量之间的关系越强( )
3.如果在犯错误的概率不超过0.05的前提下认为事件A和B有关,那么具体算出的数据满足( )A.K2>3.841 B.K2<>6.635 D.K2<6.635
4.下列变量中不属于分类变量的是( )A.性别 B.吸烟 C.宗教信仰 D.国籍
5.有两个分类变量X与Y的一组数据,由其列联表计算得K2≈4.523,则认为X与Y有关系是错误的可信度为( )A.95% B.90% C.5% D.10%
6.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表.(2)判断休闲方式与性别是否有关系.
高中数学第二章 推理与证明2.1合情推理与演绎推理背景图ppt课件: 这是一份高中数学第二章 推理与证明2.1合情推理与演绎推理背景图ppt课件,共30页。PPT课件主要包含了所以铀能够导电,即时训练,所以铜能够导电,大前提,小前提,一般性的原理,特殊情况,演绎推理的“三段论”,已知的一般性原理,所研究的特殊情况等内容,欢迎下载使用。
高中数学人教版新课标A选修1-22.1合情推理与演绎推理背景图ppt课件: 这是一份高中数学人教版新课标A选修1-22.1合情推理与演绎推理背景图ppt课件,共48页。PPT课件主要包含了猜座位,财主的儿子怎么写的,探究点1归纳推理,哥德巴赫猜想,哥德巴赫猜想的过程,具体的材料,观察分析,猜想出一般性的结论,归纳推理,部分对象等内容,欢迎下载使用。
数学第一章 统计案例1.2独立性检验的基本思想及其初步应用说课课件ppt: 这是一份数学第一章 统计案例1.2独立性检验的基本思想及其初步应用说课课件ppt,共60页。PPT课件主要包含了不同类别,频数表,a+b,c+d,a+c,b+d,a+b+c+d,相互影响,频率特征,随机变量等内容,欢迎下载使用。