高中数学人教版新课标B选修1-21.1独立性检验练习题
展开浅谈独立性检验在数学解题中的应用 独立性检验就是利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量K2应该很小.如果由观测数据计算得到的K2解的观测值K很大,则在一定程度上说明假设不合理. 若要推断的论述为H1:“X与Y有关系”, 可以按如下步骤判断结论H1成立的可能性:(1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.①在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上两个柱形高度的乘积bc相差越大,H1成立的可能性就越大。②在二维条形图中,可以估计满足条件X= x1的个体中具有Y=y1的个体所占的比例,也可以估计满足条件X= x2的个体中具有Y=y1的个体所占的比例.两个比例的值相差越大,H1成立的可能性就越大. (2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是:根据观测数据计算由K2=(其中n=a+b+c+d)给出的检验随机变量K2的值K,其值越大,说明“X与Y有关系”成立的可能性越大.当得到的观测数据a,b,c,d都不小于5时,可以通过查阅下表来确定结论“X与Y有关系”的可信程度. 说明:当观测数据a,b,c,d中有小于5的数时,需采用很复杂的精确的检验方法。题型一.独立性检验的概念及方法所谓独立性检验,就是根据采集的样本数据,利用公式计算K2的值,比较K2与临界值的大小关系,来判定A与B是否无关问题,是一种假设检验.例1.在独立性检验中,选用K2作统计量,当K2满足条件_ 时,我们有99%的把握说明事件A与B有关.解析:当K2>10.828时,有99.9%的把握认为A与B有关系;当K2 > 6.635时,有99%的把握认为A与B有关系.所以填:K2>6.635.题型三:独立性检验的应用独立性检验在生物统计、医学统计等学科中有广泛的应用,在处理社会调查问题时,也常常用到独立性检验,在2×2列联表中,通过计算K2与临界值的大小,推断事件是否独立.具体步骤:(1)采集样本数据.(2)根据公式计算K2的观测值.(3)作统计判断.例2.某科技小组的活动记录显示,过去的10项活动都在星期一、三或五. (1)你能否判定科技小组的活动日有规定? (2)你能否判定科技小组星期二不活动?解:(1)假设科技小组的活动日无规定,而周一至周日七天每天都可能活动, 则10次活动都在周一、周三或周五的概率为()10≈0.000209041,它是一个小概率事件,因此原假设是错误的,即活动日是有规定的.(2)计算“10次活动都不在星期二”这一事件的概率为()10≈0.2141,这不是小概率事件,所以不能判定星期二不活动.例3. 打鼾不仅影响别人休息,而且可能与患某种疾病有芜下表是一次调查所得的数据,试问:每一晚都打鼾与患心脏病有关系吗?有多大的把握认为你的结论成立? 解:假设“每一晚都打鼾与患心脏病没有关系”,由题意可知:a=30,b=224,c=24,d=1355,a+b=254,c+d=1379,a+c=54,b+d=1579,n=1633.代人公式 因为K2≈68.033>10.828,所以我们有99.9%的把握认为每一晚都打鼾与患心脏病有关系.注意:我们都有较大的把握认为结论成立.但我们所说的“每一晚都打鼾与患心脏病有关”或“患慢性气管炎与吸烟习惯有关”指的都是统计上的关系,不要误以为这里面存在因果关系,具体到某一个每一晚都打鼾的人,并不能说他一定患有心脏病,从列联表中也可以看出,每一晚都打鼾的人群中,患心脏病的概率也只有,稍微超过了十分之一,至于他患不患心脏病,应该由医学检查来确定,这已经不是统计学研究的范畴了.例4. 有甲、乙两个班级进行一门课程的考试,按照学生考试成绩优秀和不优秀统计成绩后,得到下表,请画出列联表的二维条形图,并通过图形判断成绩与班级是否有关,利用列联表的独立性检验估计判断“成绩与班级有关”犯错误的概率.解:根据列联表的数据,作出二维条形图,如下图所示.从条形图中可以看出,甲班学生中优秀的人数的比例数为.乙班中学生优秀的人数的比例数为,二者差别不是很大,因此我们可以认为优秀与所在班级没有关系用独立性检验来判断:由题意知a=l0,b=35,c=7,d=38,a+b=45,c+d=45,a+c=17,b+d=73,n=90,代入公式因为0.65<2.706.所以我们没有理由认为成绩优秀与所在班级有关系,我们可以断言“成绩与班级有关”犯错误的概率超过10%.解题心得:用二维条形图只能粗略地判断两个事件之间的关系,独立性检验更准确,但有时得到的结论或许是错误的,但我们可以利用统计分析的结果去预测实际问题的结果.例5.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究.调查他们是否又发作过心脏病.调查结果如下表所示:试根据上述数据比较这两种手术对病人又发作心脏病的影响有没有差别.点拨:从所给的列联表中可知病人有两种类型:做过心脏搭桥手术和做过血管清障手术,每种类型又有两种情况,又发作心脏病,未发作心脏病,问题是用表中所给出数据来检验上述两种状态是否有关系,因此,这是一个独立性检脸问题,解决的方法是先计算随机变量K2的观测值k,用k的大小来决定是否又发作心脏病与心脏搭桥手术有关还是无关.解析:假设做过心脏搭桥手术与又发作心脏病没有关系.由于a=39,b=157,c=29,d=167,a+b=196,c+d=196,a+c=68,b十d=324,n=392,由公式可得K2的观测值为=1.78,因为k=1.78<2.706, 所以我们没有理由说心脏搭桥手术与又发作心脏病有关系.点评:本题是利用求出k的值,再利用临界值的大小关系来判断假设是否成立,解题时应注意准确代数与计算,不可错用公式,要准确进行比较与判断.例6.研究某基因A对某种病人的影响,调查得到以下四格表.具有某基因A对某种病人的影响有多大?解:用公式可计算 K2≈355.79>10.828,因此有99.9%的把握认为具有某基因A对某种病人有影响.点评:在使用K2统计量作2×2列联表的独立性检验时, 要求表中的4个数据大于等于5,为此在选取样本的容量时一定要注意这一点.本例中4个数据144,96,456,304都大于5,是满足这一要求的.思想方法小结:在写出a,b,c,d的值时,注意一定要按顺序.这类题目的解法通常是先根据采集的样本数据列出列联表, 从表格中可以直观的得到结论.也可以利用三维柱形图和二维条形图来判断,但是作图比较麻烦,而且三维柱形图和二维条形图所表示的关系也只是一种粗略的估计,所以通常是利用公式计算出K2的值,与临界值的大小作比较来判断分类变量X与Y是否无关。y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+dP(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828有病无病合计有A14496240无A456304760合计6004001000
高中数学人教版新课标B选修1-21.1独立性检验巩固练习: 这是一份高中数学人教版新课标B选修1-21.1独立性检验巩固练习,
人教版新课标B选修1-21.1独立性检验当堂达标检测题: 这是一份人教版新课标B选修1-21.1独立性检验当堂达标检测题,共2页。
选修1-21.1独立性检验练习题: 这是一份选修1-21.1独立性检验练习题,共2页。