![8.3.2独立性检验课件PPT01](http://m.enxinlong.com/img-preview/3/3/12990191/0/0.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![8.3.2独立性检验课件PPT02](http://m.enxinlong.com/img-preview/3/3/12990191/0/1.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![8.3.2独立性检验课件PPT03](http://m.enxinlong.com/img-preview/3/3/12990191/0/2.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![8.3.2独立性检验课件PPT04](http://m.enxinlong.com/img-preview/3/3/12990191/0/3.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![8.3.2独立性检验课件PPT05](http://m.enxinlong.com/img-preview/3/3/12990191/0/4.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![8.3.2独立性检验课件PPT06](http://m.enxinlong.com/img-preview/3/3/12990191/0/5.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![8.3.2独立性检验课件PPT07](http://m.enxinlong.com/img-preview/3/3/12990191/0/6.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![8.3.2独立性检验课件PPT08](http://m.enxinlong.com/img-preview/3/3/12990191/0/7.jpg?x-oss-process=image/resize,w_794/sharpen,100)
高中数学8.3 分类变量与列联表授课课件ppt
展开我们将下表这种形式的数据统计表称为2×2列联表(cntingency table).
2×2列联表给出了成对分类变量数据的交叉分类频数,以下表为例, 它包含了X和Y的如下信息:最后一行的前两个数分别是事件{Y=0}和{Y=1}中样本点的个数;最后一列的前两个数分别是事件{X=0}和{X=1}中样本点的个数;
中间的四个格中的数是表格的核心部分,给出了事件{X=x,Y=y}(x,y=0,1)中样本点的个数;右下角格中的数是样本空间中样本点的总数。
两个分类变量之间关联关系的定性分析的方法:
(2)图形分析法:与表格相比,图形更能直观地反映出两个分类变量间是否互相影响,常用等高堆积条形图展示列联表数据的频率特征.将列联表中的数据用高度相同的两个条形图表示出来,其中两列的数据分别对应不同的颜色,这就是等高堆积条形图.
“两校学生的数学成绩优秀率存在差异”这个结论是根据两个频率间存在差异推断出来的.有可能出现这种情况:在随机抽取的这个样本中,两个频率间确实存在差异,但两校学生的数学成绩优秀率实际上是没有差别的.对于随机样本而言,因为频率具有随机性,频率与概率之间存在误差,所以我们的推断可能犯错误,而且在样本容量较小时,犯错误的可能性会较大.因此,需要找到一种更为合理的推断方法,同时也希望能对出现错误推断的概率有一定的控制或估算.
注意到(X=0)和(X=1)为对立事件,于是P(X=0)=1-P(X=1).再由概率的性质,我们有P(X=0,Y=1)=P(Y=1)-P(X=1,Y=1).由此推得①式等价于P(X=1)P(Y=1)=P(X=1,Y=1).因此,零假设H0等价于{X=1}与{Y=1}独立。
答:P(X=0,Y=1)P(X=1)=P(X=1,Y=1)(1-P(X=1))=P(X=1,Y=1)-P(X=1,Y=1)P(X=1)得:P(X=0,Y=1)P(X=1)+P(X=1,Y=1)P(X=1)=P(X=1,Y=1)得(P(X=0,Y=1)+P(X=1,Y=1))P(X=1)=P(X=1,Y=1)因为P(X=0,Y=1)+P(X=1,Y=1)=P(Y=1)得P(Y=1)P(X=1)=P(X=1,Y=1)
{X=0}与{Y=0}独立;{X=0}与{Y=1}独立;{X=1}与{Y=0}独立;{X=1}与{Y=1}独立。
根据已经学过的概率知识,下面的四条性质彼此等价:
以上性质成立,我们就称分类变量X和Y独立,这相当于下面四个等式成立;P(X=0,Y=0)=P(X=0)P(Y=0); P(X=0,Y=1)=P(X=0)P(Y=1);P(X=1,Y=0)=P(X=1)P(Y=0); P(X=1,Y=1)=P(X=1)P(Y=1).我们可以用概率语言,将零假设改述为H0:分类变量X和Y独立.假定我们通过简单随机抽样得到了X和Y的抽样数据列联表,如下表所示。
对于随机样本,表中的频数a,b,c,d 都是随机变量,而表中的相应数据是这些随机变量的一次观测结果。
表是关于分类变量X和Y的抽样数据的2×2列联表:最后一行的前两个数分别是事件{Y=0}和{Y=1}的频数;最后一列的前两个数分别是事件{X=0}和{X=1}的频数;中间的四个数a,b,c,d是事件{X=x,Y=y}(x, y=0,1)的频数;右下角格中的数n是样本容量。
思考:如何基于②中的四个等式及列联表中的数据,构造适当的统计量,对成对分类变量X和Y是否相互独立作出推断?
P(X=0,Y=0)=P(X=0)P(Y=0); P(X=0,Y=1)=P(X=0)P(Y=1);P(X=1,Y=0)=P(X=1)P(Y=0); P(X=1,Y=1)=P(X=1)P(Y=1).
综合②中的四个式子,如果零假设H0成立,下面四个量的取值都不应该太大:
反之,当这些量的取值较大时,就可以推断H0不成立。
分别考虑③中的四个差的绝对值很困难,我们需要找到一个既合理又能够计算分布的统计量,来推断H0是否成立.一般来说,若频数的期望值较大,则③中相应的差的绝对值也会较大;而若频数的期望值较小,则③中相应的差的绝对值也会较小.为了合理地平衡这种影响,我们将四个差的绝对值取平方后分别除以相应的期望值再求和,得到如下的统计量:
对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α成立,我们称xα为α的临界值,这个临界值可作为判断χ2大小的标准,概率值α越小,临界值xα越大.
χ2独立性检验中几个常用的小概率值和相应的临界值.
基于小概率值α的检验规则:
当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2
例1:为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生.通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀.试分析两校学生中数学成绩优秀率之间是否存在差异.
解:零假设为H0:分类变量X与Y相互独立,即两校学生的数学成绩优秀率无差异.
思考:例1和例2都是基于同一组数据的分析,但却得出了不同的结论,你能说明其中的原因吗?
当我们接受零假设H0时,也可能犯错误。我们不知道犯这类错误的概率p的大小,但是知道,若α越大,则p越小
解:零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.
将所给数据进行整理,得到两种疗法治疗数据的列联表,
解:
因此可以推断乙种疗法的效果比甲种疗法好。
例4:为了调查吸烟是否对肺癌有影响,某肿瘤研究所采取有放回简单随机抽样,调查了9965人,得到如下结果(单位:人)依据小概率值α=0.001的独立性检验,分析吸烟是否会增加患肺癌的风险。
解:零假设为H0:吸烟和患肺癌之间没有关系根据列联表中的数据,经计算的
根据小概率值α=0.001的独立性检验,推断H0不成立,即认为吸 烟与患肺癌有关联,此推断犯错误的概率不大于0.001,即我们有99.9%的把握认为“吸烟与患肺癌有关系”.
根据表中的数据计算不吸烟者中不患肺癌和患肺癌的频率分别为
吸烟者中不患肺癌和患肺癌的评率分别为
可见,在被调查者中,吸烟者患肺癌的频率是不吸烟者患肺癌频率的4倍以上。于是,根据频率稳定于概率的原理,我们可以认为吸烟者患肺癌的概率明显大于不吸烟者患肺癌概率,即吸烟更容易引发肺癌。
应用独立性检验解决实际问题大致应包括以下几个主要环节:
注意:上述几个环节的内容可以根据不同情况进行调整,例如,在有些时候,分类变量的抽样数据列联表是问题中给定的.
先假设两个分类变量X与Y无关系,利用上述公式根据观测数据求出K2的观测值k,再得出X与Y有关系的程度.(1)如果k≥10.828,就有______的把握认为“X与Y有关系” (2)如果k≥7.879,就有______的把握认为“X与Y有关系”;
(3)如果k≥_____,就有99%的把握认为“X与Y有关系” (4)如果k≥5.024,就有97.5%的把握认为“X与Y有关系” (5)如果k≥3.841,就有_____的把握认为“X与Y有关系” (6)如果k≥2.706,就有_____的把握认为“X与Y有关系”.
不渴望能够一跃千里,只希望每天能够前进一步。
高中数学人教A版 (2019)选择性必修 第三册8.3 分类变量与列联表完美版ppt课件: 这是一份高中数学人教A版 (2019)选择性必修 第三册<a href="/sx/tb_c4000365_t3/?tag_id=26" target="_blank">8.3 分类变量与列联表完美版ppt课件</a>,文件包含832《独立性检验》课件-人教版高中数学选修三pptx、832《独立性检验》分层作业原卷版-人教版高中数学选修三docx、832《独立性检验》分层作业解析版-人教版高中数学选修三docx等3份课件配套教学资源,其中PPT共39页, 欢迎下载使用。
数学选择性必修 第三册8.3 分类变量与列联表获奖课件ppt: 这是一份数学选择性必修 第三册8.3 分类变量与列联表获奖课件ppt,共32页。PPT课件主要包含了人教版高中数学选修三,复习导入,新知探索,课堂总结等内容,欢迎下载使用。
高中数学人教A版 (2019)选择性必修 第三册8.3 分类变量与列联表集体备课课件ppt: 这是一份高中数学人教A版 (2019)选择性必修 第三册8.3 分类变量与列联表集体备课课件ppt,共10页。PPT课件主要包含了复习回顾,新课导入,问题情境,新知探究,概念生成,典例解析,巩固练习,方法归纳,课堂小结等内容,欢迎下载使用。