- 新教材高中数学第4章概率与统计4.2随机变量4.2.4随机变量的数字特征第1课时离散型随机变量的均值导学案新人教B版选择性必修第二册 学案 0 次下载
- 新教材高中数学第4章概率与统计4.2随机变量4.2.4随机变量的数字特征第2课时离散型随机变量的方差导学案新人教B版选择性必修第二册 学案 0 次下载
- 新教材高中数学第4章概率与统计4.2随机变量4.2.5正态分布导学案新人教B版选择性必修第二册 学案 0 次下载
- 新教材高中数学第4章概率与统计4.2随机变量4.3.1一元线性回归模型导学案新人教B版选择性必修第二册 学案 0 次下载
- 新教材高中数学第4章概率与统计4.4数学探究活动了解高考鸭科目的确定是否与性别有关导学案新人教B版选择性必修第二册 学案 0 次下载
高中数学人教B版 (2019)选择性必修 第二册4.3.2 独立性检验学案设计
展开4.3.2 独立性检验
(教师独具内容)
课程标准:通过实例,了解2×2列联表的统计意义、独立性检验及其应用.
教学重点:掌握2×2列联表的方法,理解独立性检验的基本思想及实施步骤.
教学难点:1.独立性检验的基本思想和χ2的含义.2.解决独立性检验的简单实际问题.
知识点一 2×2列联表
随机事件A与B的样本数据如下表,核心的数据是中间的4个格子,这样的表格通常称为2×2列联表.
A
总计
B
a
b
a+b
c
d
c+d
总计
a+c
b+d
a+b+c+d
记n=a+b+c+d,则由表可知:
(1)事件A发生的概率可估计为P(A)=;
(2)事件B发生的概率可估计为P(B)=;
(3)事件AB发生的概率可估计为P(AB)=.
知识点二 独立性检验
为了使不同样本容量的数据有统一的评判标准,我们构造一个随机变量χ2=,其中n=a+b+c+d为样本容量.
任意给定一个α(称为显著性水平),可以找到满足条件P(χ2≥k)=α的数k(称为显著性水平α对应的分位数).若χ2≥k成立,就称在犯错误的概率不超过α的前提下,可以认为A与B不独立(也称为A与B有关);或说有1-α的把握认为A与B有关.若χ2
α=P(χ2≥k)
0.50
0.40
0.25
0.15
0.10
k
0.455
0.708
1.323
2.072
2.706
α=P(χ2≥k)
0.05
0.025
0.010
0.005
0.001
k
3.841
5.024
6.635
7.879
10.828
注意:查表时不是查最大允许值,而是先根据题目要求的百分比找到第一行对应的数值,再将该数值对应的k值与求得的χ2相比较.
独立性检验是数据统计的一种方法,是数学中的一种基本理论,是数学体系中对数据关系进行探索的一种基本思想.判断两个随机事件是否相关可以通过独立性检验来考查,利用公式χ2=计算出随机变量χ2的值,通过查表确定分位数k.若χ2≥k,说明X与Y有关系,否则没有关系.
1.判一判(正确的打“√”,错误的打“×”)
(1) 根据统计学中常用的显著性水平α以及对应的分位数k,当χ2<2.706时,我们有90%的把握认为随机事件A与B有关系.( )
(2)事件A与B的独立性检验无关,即两个事件互不影响.( )
(3)χ2的大小是判断事件A与B是否相关的统计量.( )
答案 (1)× (2)× (3)√
2.做一做(请把正确的答案写在横线上)
(1)为了调查高中生的性别与是否喜欢踢足球之间有无关系,一般需要收集以下数据:___________________________________________________________________.
(2)若χ2≈7.8,得到的正确结论是在犯错误的概率不超过________的前提下认为“爱好该项运动与性别有关”.
(3)某校为了检验高中数学新课程改革的成果,在两个班进行教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如下面2×2列联表所示(单位:人),则其中m=________,n=________.
80分及以上
80分以下
合计
试验班
32
18
50
对照班
24
m
50
合计
56
44
n
答案 (1)男、女生中喜欢和不喜欢踢足球的人数
(2)1% (3)26 100
题型一 绘制2×2列联表
例1 在一项有关医疗保健的社会调查中,调查的男性为530人,女性为670人,发现其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.
[解] 作2×2列联表如下:
喜欢吃甜食
不喜欢吃甜食
合计
男
117
413
530
女
492
178
670
合计
609
591
1200
点睛
对问题中的不同数据分成不同的类别,然后列表.注意列联表中的类别书写格式与数据也要对应清晰.
某电视公司为了研究体育迷是否与性别有关,在调查的100人中,体育迷75人,其中女生30人,非体育迷25人,其中男生15人.请作出性别与体育迷的列联表.
解 2×2列联表如下:
体育迷
非体育迷
合计
男
45
15
60
女
30
10
40
合计
75
25
100
题型二 独立性检验的基本思想
例2 在吸烟与患肺病这两个随机事件中,下列说法正确的是( )
A.若χ2=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99个人患有肺病
B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病
C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误
D.以上三种说法都不正确
[解析] 独立性检验的结果是一种相关关系,不是确定性关系,反映的是有关或无关的概率的大小,故A错误,B错误,C正确.答案选C.
[答案] C
点睛
本例考查独立性检验的基本思想,相关性检验的结果是一种相关关系,而不是确定性关系,是反映有关和无关的概率.本例考查学生对基本知识的理解.
(1)给出下列实际问题,其中不可以用独立性检验解决的是 ( )
A.喜欢参加体育锻炼与性别是否有关
B.喝酒者得胃病的概率
C.喜欢喝酒与性别是否有关
D.青少年犯罪与上网成瘾是否有关
(2)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由χ2=算得,
χ2=≈7.8.
附表:
P(χ2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
参照附表,得到的正确结论是( )
A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
C.有99%以上的把握认为“爱好该项运动与性别有关”
D.有99%以上的把握认为“爱好该项运动与性别无关”
答案 (1)B (2)C
解析 (1)独立性检验主要是对两个随机事件是否有关进行检验,故不可用独立性检验解决的问题是B.故选B.
(2)根据独立性检验的定义,由χ2≈7.8>6.635可知在犯错误的概率不超过0.01的前提下,认为“爱好该项运动与性别有关”,即有99%以上的把握认为“爱好该项运动与性别有关”.故选C.
题型三 由χ2进行独立性检验
例3 某校对学生课外活动进行调查,结果整理成下表:
体育
文娱
合计
男生
21
23
44
女生
6
29
35
合计
27
52
79
试用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下认为“喜欢体育还是文娱与性别有关”?
[解] 假设“喜欢体育还是文娱与性别没有关系”,
∵a=21,b=23,c=6,d=29,n=79.
∴χ2=
=
≈8.106.
且P(χ2≥7.879)=0.005,即我们得到的χ2≈8.106,超过7.879,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是文娱与性别有关.”
点睛
独立性检验的具体做法
(1)根据实际问题的需要确定允许推断“两个随机事件有关系”犯错误的概率的上界α,然后查表确定临界值k.
(2)利用公式χ2=计算随机变量χ2.
(3)如果χ2≥k,推断“X与Y有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.
某地区甲校高二年级有1100人,乙校高二年级有900人,为了统计两个学校高二年级在学业水平考试中的数学学科成绩,采用分层抽样的方法在两校共抽取了200名学生的数学成绩,如下表:(已知本次测试合格线是50分,两校合格率均为100%)
甲校高二年级数学成绩:
分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
10
25
35
30
x
乙校高二年级数学成绩:
分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
15
30
25
y
5
(1)计算x,y的值,并分别估计以上两所学校数学成绩的平均分(精确到1分);
(2)若数学成绩不低于80分为优秀,低于80分为非优秀,根据以上统计数据填写下面的2×2列联表,并回答能否在犯错误的概率不超过0.05的前提下认为“两个学校的数学成绩有差异?”
甲校
乙校
总计
优秀
非优秀
总计
解 (1)依题意知甲校应抽取110人,乙校应抽取90人,
所以x=10,y=15,
估计两个学校的平均分,甲校的平均分为
≈75.
乙校的平均分为
≈71.
(2)数学成绩不低于80分为优秀,低于80分为非优秀,得到列联表:
甲校
乙校
总计
优秀
40
20
60
非优秀
70
70
140
总计
110
90
200
χ2=≈4.714,
又因为4.714>3.841,故能在犯错误的概率不超过0.05的前提下认为“两个学校的数学成绩有差异”.
1.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并有99%以上的把握认为这个结论是成立的,下列说法中正确的是( )
A.100个吸烟者中至少有99个患有肺癌
B.1个人吸烟,那么这个人一定患有肺癌
C.在100个吸烟者中一定有患肺癌的人
D.在100个吸烟者中可能一个患肺癌的人也没有
答案 D
解析 独立性检验的结论是一个数学统计量,它与实际问题中的问题的确定性是存在差异的,故A错误,C错误,D正确;χ2与概率的含义不同,有99%的把握不能说明有99%的可能,故B错误.故选D.
2.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:
文化程度与月收入列联表(单位:人)
月收入2000元以下
月收入2000元及以上
总计
高中文化以上
9
44
53
高中文化及以下
19
30
49
总计
28
74
102
由上表中数据计算得χ2=≈6.073,则认为“文化程度与月收入有关系”的把握为( )
A.1% B.99% C.2.5% D.97.5%
答案 D
解析 由于6.073>5.024,故在犯错误的概率不超过0.025的前提下,即有97.5%的把握认为“文化程度与月收入有关系”.
3.(多选)下列关于χ2统计量的说法正确的是( )
A.可以为负值
B.χ2的值越大,两个事件有关系的把握越大
C.当χ2的值很小时,不能推定两个事件不相关
D.χ2=
答案 BC
解析 χ2的值不可能为负值,故A错误;易知B正确;χ2的值很小时,只能说两个事件的相关程度低,不能推定两个事件不相关,故C正确;χ2=
,故D错误.故选BC.
4.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:
喜爱打篮球
不喜爱打篮球
总计
男生
20
5
25
女生
10
15
25
总计
30
20
50
则在犯错误的概率不超过________的前提下认为喜爱打篮球与性别有关(请用百分数表示).
答案 0.5%
解析 χ2==
≈8.333>7.879,所以在犯错误的概率不超过0.5%的前提下认为喜爱打篮球与性别有关.
5.湖北省武汉市等多个地区陆续出现感染新型冠状病毒肺炎的患者,为及时有效地对疫情数据进行流行病学统计分析,某地研究机构针对该地实际情况,根据该地患者是否有武汉旅行史与是否有确诊病例接触史,将新冠肺炎患者分为四类:有武汉旅行史(无接触史),无武汉旅行史(无接触史),有武汉旅行史(有接触史)和无武汉旅行史(有接触史),统计得到以下相关数据.
(1)请将列联表填写完整:
有接触史
无接触史
总计
有武汉旅行史
27
无武汉旅行史
18
总计
27
54
(2)能否在犯错误的概率不超过0.025的前提下认为有武汉旅行史与有确诊病例接触史有关系?
附:χ2=,n=a+b+c+d.
P(χ2≥k)
0.15
0.10
0.05
0.025
0.010
k
2.072
2.706
3.841
5.024
6.635
解 (1)填表如下:
有接触史
无接触史
总计
有武汉旅行史
9
18
27
无武汉旅行史
18
9
27
总计
27
27
54
(2)χ2==6>5.024,
因此在犯错误的概率不超过0.025的前提下认为有武汉旅行史与有确诊病例接触史有关系.
A级:“四基”巩固训练
一、选择题
1.对于随机事件X与Y的随机变量χ2,下列说法正确的是( )
A.χ2越大,“X与Y有关系”的可信程度越小
B.χ2越小,“X与Y有关系”的可信程度越小
C.χ2越接近于0,“X与Y没有关系”的可信程度越小
D.χ2越大,“X与Y没有关系”的可信程度越大
答案 B
解析 χ2越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大.即χ2越小,“X与Y有关系”的可信程度越小.故选B.
2.利用独立性检验对两个随机事件是否有关系进行研究时,若有99.5%的把握认为事件A和B有关系,则具体计算出的数据应该是( )
A.χ2≥6.635 B.χ2<6.635
C.χ2≥7.879 D.χ2<7.879
答案 C
解析 有99.5%的把握认为事件A和B有关系,即犯错误的概率为0.5%,对应的k的值为7.879,由独立性检验的思想可知应为χ2≥7.879.
3.某高校《统计》课程的教师随机给出了选该课程的一些情况,具体数据如下:
非统计专业
统计专业
男
13
10
女
7
20
为了判断选修统计专业是否与性别有关,根据表中数据,得χ2≈4.844,因为χ2>3.841,所以可以判定选修统计专业与性别有关.那么这种判断出错的可能性为( )
A.5% B.95% C.1% D.99%
答案 A
解析 若χ2>3.841,说明有95%的把握认为选修统计专业与性别有关,即有5%的把握认为选修统计专业与性别无关,也就是“选修统计课程与性别有关”出错的可能性为5%.
4.利用独立性检验的方法调查高中生的写作水平与喜好阅读是否有关,通过随机询问120名高中生是否喜好阅读,利用2×2列联表,由计算可得χ2=4.236.
α=P(χ2≥k)
0.1
0.05
0.025
0.01
0.001
k
2.706
3.841
5.024
6.635
10.828
参照附表,可得正确的结论是( )
A.有95%的把握认为“写作水平与喜好阅读有关”
B.有97.5%的把握认为“写作水平与喜好阅读有关”
C.有95%的把握认为“写作水平与喜好阅读无关”
D.有97.5%的把握认为“写作水平与喜好阅读无关”
答案 A
解析 ∵4.236>3.841,∴有95%的把握认为“写作水平与喜好阅读有关”.故选A.
5.某单位为了了解员工喜欢户外运动是否与性别有关,随机抽取了50人进行调查,数据如下表:
喜欢户外运动
不喜欢户外运动
总计
男性
18
9
27
女性
8
15
23
总计
26
24
50
则认为喜欢户外运动与性别有关系的把握大约为( )
A.99% B.95%
C.90% D.无充分依据
答案 B
解析 由表中数据得χ2=≈5.059>3.841,所以约有95%的把握认为两变量之间有关系.
二、填空题
6.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:
文艺节目
新闻节目
总计
20至40岁
40
18
58
大于40岁
15
27
42
总计
55
45
100
由表中数据直观分析,收看新闻节目的观众是否与年龄有关?________(填“是”或“否”).
答案 是
解析 因为在20岁至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即=,=,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.
7.在2×2列联表中,若每个数据变为原来的2倍,则χ2的值变为原来的________倍.
答案 2
解析 公式χ2=中所有值变为原来的2倍,则=2χ2,故χ2也变为原来的2倍.
8.为考察某种药物预防疾病的效果,进行动物试验,得到如下药物效果与动物试验列联表:
患病
未患病
总计
服用药
10
45
55
没服用药
20
30
50
总计
30
75
105
则________(填“能”或“不能”)在犯错误的概率不超过0.025的前提下认为药物有效.
附:χ2=;
P(χ2≥k)
0.05
0.025
0.010
0.005
k
3.841
5.024
6.635
7.879
答案 能
解析 根据列联表,计算χ2==≈6.109>5.024,所以能在犯错误的概率不超过0.025的前提下认为药物有效.
三、解答题
9.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”,下表是一次针对高三文科学生的调查所得的数据:
总成绩好
总成绩不好
合计
数学成绩好
478
a
490
数学成绩不好
399
24
423
合计
b
c
913
(1)计算a,b,c的值;
(2)文科学生总成绩不好与数学成绩不好有关系吗?
解 (1)由478+a=490,得a=12.
由a+24=c,得c=12+24=36.
由b+c=913,得b=913-36=877.
(2)计算随机变量χ2=≈6.233>5.024,
因为P(χ2≥5.024)=0.025,
所以有97.5%的把握认为文科学生总成绩不好与数学成绩不好有关系.
10.电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.
根据已知条件完成下面的2×2列联表,并据此资料,你是否认为“体育迷”与性别有关?
非体育迷
体育迷
合计
男
女
10
55
合计
解 由所给的频率分布直方图知,“体育迷”人数为100×(10×0.020+10×0.005)=25.
“非体育迷”人数为75,则据题意完成2×2列联表:
非体育迷
体育迷
合计
男
30
15
45
女
45
10
55
合计
75
25
100
将2×2列联表的数据代入公式计算:
χ2=≈3.030>2.706.
所以在犯错误的概率不超过0.10的前提下可以认为“体育迷”与性别有关.
B级:“四能”提升训练
1.(多选)有两个变量X与Y,其2×2列联表如下所示:
其中a为正整数,若有95%以上的把握认为X与Y之间有关系,则a的值可以为( )
A.7 B.8 C.9 D.10
答案 BCD
解析 令χ2==3.841,解得a≈7.688或a≈1.543.由题意知χ2>3.841,所以只要a>7.688,就有95%以上的把握认为X与Y之间有关系,又a∈N*.故选BCD.
2.甲、乙两台机床生产同一型号零件.记生产的零件的尺寸为t(cm),相关行业质检部门规定:若t∈(2.9,3.1],则该零件为优等品;若t∈(2.8,2.9]∪(3.1,3.2],则该零件为中等品;其余零件为次品.现分别从甲、乙机床生产的零件中各随机抽取50件,经质量检测得到下表数据:
(1)设生产每件产品的利润为:优等品3元,中等品1元,次品亏本1元.若将频率视为概率,试根据样本估计总体的思想,估算甲机床生产一件零件的利润的数学期望;
(2)对于这两台机床生产的零件,在排除其他因素影响的情况下,试根据样本估计总体的思想,估计约有多大的把握认为“零件优等与否和所用机床有关”,并说明理由.
参考公式:χ2=
参考数据:
P(χ2≥k)
0.25
0.15
0.10
0.05
0.025
0.010
k
1.323
2.072
2.706
3.841
5.024
6.635
解 (1)设甲机床生产一件零件获得的利润为X元,它的分布列为
X
3
1
-1
P
0.8
0.14
0.06
则有E(X)=3×0.8+1×0.14+(-1)×0.06=2.48.
所以甲机床生产一件零件的利润的数学期望为2.48元.
(2)由表中数据可知,甲机床优等品40件,非优等品10件;乙机床优等品30件,非优等品20件.
制作2×2列联表如下:
甲机床
乙机床
合计
优等品
40
30
70
非优等品
10
20
30
合计
50
50
100
计算χ2==≈4.762.
考察参考数据并注意到3.841<4.762<5.024,可知:对于这两台机床生产的零件,在排除其他因素影响的情况下,根据样本估计总体的思想,约有95%的把握认为“零件优等与否和所用机床有关”.
高中数学人教B版 (2019)选择性必修 第二册4.3.1 一元线性回归模型学案设计: 这是一份高中数学人教B版 (2019)选择性必修 第二册4.3.1 一元线性回归模型学案设计,共23页。
数学选择性必修 第二册4.2.5 正态分布导学案及答案: 这是一份数学选择性必修 第二册4.2.5 正态分布导学案及答案,共13页。
人教B版 (2019)选择性必修 第二册4.2.4 随机变量的数字特征第2课时导学案: 这是一份人教B版 (2019)选择性必修 第二册4.2.4 随机变量的数字特征第2课时导学案,共13页。