高中数学人教A版 (2019)选择性必修 第三册8.3 分类变量与列联表习题
展开第八章 成对数据的统计分析
8.3 列联表与独立性检验
基础过关练
题组一 分类变量与列联表
1.(2022重庆南开中学月考)为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如图所示的等高堆积条形图,根据图中的信息,下列结论中不正确的是 ( )
A.样本中的男生人数多于女生人数
B.样本中喜欢手机支付的人数多于喜欢现金支付的人数
C.样本中多数男生喜欢现金支付
D.样本中多数女生喜欢手机支付
2.(2022河南开封五县期末)在某次国际会议中,为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在如表所示的“性别与会外语”的2×2列联表中,d= .
单位:人
会外语
不会外语
合计
男
a
b
20
女
6
d
合计
18
50
3.某学校对高三学生进行了一项调查,发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张.作出等高堆积条形图,并利用条形图判断该校高三学生考前心情紧张与性格类型是否有关系.
题组二 独立性检验及其应用
4.(2022黑龙江哈九中五模)在2008年北京奥运会上,中国健儿取得了51金、21银、28铜的好成绩,稳居金牌榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见,有网友为此进行了调查,在参与调查的2 548名男性中有1 560名持反对意见,2 452名女性中有1 200名持反对意见,在运用这些数据说明性别与判断“中国进入了世界体育强国之列”是否有关系时,最有说服力的方法是 ( )
A.平均数与方差
B.经验回归方程
C.独立性检验
D.概率
5.(2022陕西宝鸡模拟)某机构进行抽样调查,利用2×2列联表和χ2统计量研究患肺病是否与吸烟有关,计算得χ2=3.305,经查对临界值表知P(χ2≥2.706)=0.10,P(χ2≥3.841)=0.05,现给出四个结论,其中正确的是 ( )
A.因为χ2>2.706,所以有90%的把握认为患肺病与吸烟有关
B.因为χ2<3.841,所以有95%的把握认为患肺病与吸烟有关
C.因为χ2>2.706,所以有90%的把握认为患肺病与吸烟无关
D.因为χ2<3.841,所以有95%的把握认为患肺病与吸烟无关
6.某学校食堂对30名高三学生偏爱蔬菜还是偏爱肉类进行了一次调查,将统计数据制成如下表格:
偏爱蔬菜
偏爱肉类
男生/人
4
8
女生/人
16
2
则认为偏爱蔬菜还是偏爱肉类与性别有关的把握至少有( )
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
α
0.05
0.01
0.005
0.001
xα
3.841
6.635
7.879
10.828
A.95% B.99%
C.99.5% D.99.9%
7.(2021山西运城高中联合体调研)某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算得χ2=7.069,则至少有 的把握认为学生的性别与是否支持该活动有关系.附表:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
8.某校在高一部分学生中调查男女同学对某项体育运动的喜好情况,调查结果的二维条形图如图所示:
(1)写出2×2列联表;
(2)依据α=0.01的独立性检验,分析喜欢这项体育运动是否与性别有关;
(3)在这次调查中,从喜欢这项体育运动的一名男生和两名女生中任选两人进行专业培训,求恰是一男一女的概率.
附表及公式:
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
能力提升练
题组 独立性检验的综合应用
1.(2021福建厦门三模)福建省采用“3+1+2”的新高考模式,其中“3”为全国统考科目:语文、数学和外语;“1”为考生在物理和历史中选择一门;“2”为考生在思想政治、地理、化学和生物四门中再选择两门.某中学调查了高一年级学生的选科倾向,随机抽取200人,其中选考物理的有120人,选考历史的有80人,统计各选科人数如下表,则下列说法正确的是 ( )
选考类别
选择科目
思想政治
地理
化学
生物
物理类
35
50
90
65
历史类
50
45
30
35
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
α
0.100
0.050
0.025
0.010
0.005
0.001
xα
2.706
3.841
5.024
6.635
7.879
10.828
A.物理类的学生中选择地理的比例比历史类的学生中选择地理的比例高
B.物理类的学生中选择生物的比例比历史类的学生中选择生物的比例低
C.有90%以上的把握认为选择生物与选考类别有关
D.没有95%以上的把握认为选择生物与选考类别有关
2.(2022贵州贵阳一模)2021年7月24日,中共中央办公厅、国务院办公厅印发《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》,要求学校做好课后服务工作,结合学生的兴趣爱好,开设体育、美术、音乐、书法等特色课程.某初级中学在课后延长一小时开设相关课程,为了解学生选课情况,在该校全体学生中随机抽取50名学生进行问卷调查,得到如下数据:
喜欢音乐
不喜欢音乐
喜欢体育
20
10
不喜欢体育
5
15
附表:
α
0.05
0.025
0.01
0.005
0.001
xα
3.841
5.024
6.635
7.879
10.828
根据以上数据,对该校学生的选课情况判断不正确的是 ( )
A.估计该校既喜欢体育又喜欢音乐的学生约占25
B.从这30名喜欢体育的学生中采用随机数法抽取6人进行访谈,则他们每个个体被抽到的概率都为15
C.从不喜欢体育的20名学生中任选4人进行访谈,则事件“至少有2人喜欢音乐”与“至多有1人不喜欢音乐”为对立事件
D.在犯错误的概率不超过0.005的前提下,认为“喜欢体育”与“喜欢音乐”有关系
3.(2021河南郑州期末)假设2个分类变量X和Y的2×2列联表如下:
X
Y
合计
y1
y2
x1
a
10
a+10
x2
c
30
c+30
合计
a+c
40
100
对于同一样本,以下数据能说明X和Y有关系的可能性最大的一组是 ( )
A.a=40,c=20 B.a=45,c=15
C.a=35,c=25 D.a=30,c=30
4.某调查机构为了解国庆节通过短视频APP、微信或微博表达对祖国祝福的人们是否存在年龄差异,通过不同途径调查了数千个表达了祝福的人,并从参与者中随机选出200人,经统计,这200人中通过微信或微博表达对祖国祝福的有160人.将这160人按年龄(单位:岁)分组:第1组[15,25),第2组[25,35),第3组[35,45),第4组[45,55),第5组[55,65],得到的频率分布直方图如图所示:
(1)求a的值并估计这160人的平均年龄(同一组中数据用该组区间中点值作代表);
(2)若把年龄在第1,2,3组的人称为青年人,年龄在第4,5组的人称为中年人,已知选出的200人中通过短视频APP表达对祖国祝福的中年人有26人,依据α=0.010的独立性检验,能否认为是否通过微信或微博表达对祖国的祝福与年龄有关?
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
α
0.050
0.025
0.010
0.005
0.001
xα
3.841
5.024
6.635
7.879
10.828
5.(2022四川资阳二诊)手机支付也称为移动支付,是指允许用户使用其移动终端(通常是手机)对所消费的商品或服务进行账务支付的一种服务方式.随着信息技术的发展,手机支付越来越成为人们喜欢的支付方式.某机构对某地区年龄在15到75岁的人群“是否使用手机支付”的情况进行了调查,随机抽取了100人,其年龄(单位:岁)的频率分布和使用手机支付的人数如下表所示:
年龄段
频率
使用人数
[15,25)
0.1
8
[25,35)
0.32
28
[35,45)
0.28
24
[45,55)
0.22
12
[55,65)
0.05
2
[65,75]
0.03
1
(1)若以45岁为分界点,根据以上统计数据填写下面的2×2列联表,并依据α=0.001的独立性检验分析“使用手机支付”是否与年龄有关;
单位:人
年龄低于
45岁
年龄不低于
45岁
合计
使用
手机支付
不使用
手机支付
合计
(2)若从年龄在[55,65),[65,75]的样本中各随机选取2人进行座谈,记选中的4人中“使用手机支付”的人数为X,求随机变量X的分布列和数学期望.
参考数据:
α
0.025
0.010
0.005
0.001
xα
5.024
6.635
7.879
10.828
参考公式: χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
6.(2022辽宁五校期末联考)据检测,新型冠状病毒进入人体后有潜伏期,潜伏期是指病原体侵入人体至最早出现临床症状的这段时间,潜伏期越长,感染到他人的可能性越高.现对400个病例的潜伏期(单位:天)进行调查,统计发现潜伏期的平均数为7.2,方差为2.252,如果认为超过8天的潜伏期属于“长潜伏期”,现按照年龄统计样本,发现50岁以上人数占70%,长潜伏期人数占25%,其中50岁以上长潜伏期者有60人.
(1)请根据以上数据完成2×2列联表,并依据小概率值α=0.05的独立性检验,分析“长潜伏期”是否与年龄有关;
单位:人
50岁以下
(含50岁)
50岁以上
总计
长潜伏期
非长潜伏期
总计
(2)假设潜伏期X服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差,若规定对入境旅客一律要求隔离14天,请结合3σ原则解释此规定的合理性.
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
α
0.1
0.05
0.01
xα
2.706
3.841
6.635
若X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈
0.954 5,P(μ-3σ≤X≤μ+3σ)≈0.997 3.
答案与分层梯度式解析
第八章 成对数据的统计分析
8.3 列联表与独立性检验
基础过关练
1.C 对于A,由题中左图可知,样本中的男生人数多于女生人数,所以A中结论正确;
对于B,由题中右图可知,样本中喜欢手机支付的人数多于喜欢现金支付的人数,所以B中结论正确;
对于C,由题中右图可知,样本中多数男生喜欢手机支付,所以C中结论错误;
对于D,由题中右图可知,样本中多数女生喜欢手机支付,所以D中结论正确.
故选C.
2.答案 24
解析 由题表中数据可得6+d=50-20,解得d=24.
3.解析 由题意可作2×2列联表如下:
单位:人
性格内向
性格外向
合计
考前心情紧张
332
213
545
考前心情不紧张
94
381
475
合计
426
594
1 020
相应的等高堆积条形图如图所示:
图中阴影部分表示考前心情紧张与考前心情不紧张的学生中性格内向的学生的比例.从图中可以看出考前心情紧张的学生中性格内向的学生占的比例比考前心情不紧张的学生中性格内向的学生占的比例高,故可以认为该校高三学生考前心情紧张与性格类型有关系.
4.C
5.A ∵2.706< χ2=3.305<3.841,
∴有90%的把握认为患肺病与吸烟有关,没有95%的把握认为患肺病与吸烟有关.
故选A.
6.C 由已知得,2×2列联表为
偏爱蔬菜
偏爱肉类
合计
男生/人
4
8
12
女生/人
16
2
18
合计
20
10
30
则χ2=30×(4×2-8×16)212×18×20×10=10>7.879=x0.005,故至少有99.5%的把握认为偏爱蔬菜还是偏爱肉类与性别有关,故选C.
7.答案 99%
解析 6.635<χ2=7.069<7.879,结合题中附表的数据,可得至少有99%的把握认为学生的性别与是否支持该活动有关系.
8.解析 (1)观察题中二维条形图可得,
被调查的男生总共有45人,其中喜欢这项体育运动的有15人,不喜欢的有30人;
被调查的女生总共有45人,其中喜欢这项体育运动的有5人,不喜欢的有40人.
由此写出2×2列联表如下:
单位:人
喜欢
不喜欢
合计
男
15
30
45
女
5
40
45
合计
20
70
90
(2)零假设为H0:喜欢这项体育运动与性别无关.
计算可得χ2=90×(15×40-30×5)245×45×20×70≈6.429<6.635=x0.01,
所以依据α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为喜欢这项体育运动与性别无关.
(3)设喜欢这项体育运动的一名男生和两名女生分别为A,B,C.
任选两人的情况有(A,B),(A,C),(B,C),
选一名男生和一名女生的情况有(A,B),(A,C),
所以恰是一男一女的概率P=23.
能力提升练
1.D 依据题表中数据可知,物理类的学生中选择地理的比例为50120=512,历史类的学生中选择地理的比例为4580=916,因为512<916,所以物理类的学生中选择地理的比例比历史类的学生中选择地理的比例低,故A错误;
物理类的学生中选择生物的比例为65120=1324,历史类的学生中选择生物的比例为3580=716,
因为1324>716,所以物理类的学生中选择生物的比例比历史类的学生中选择生物的比例高,故B错误;
由题中表格可列2×2列联表如下:
单位:人
选考生物
不选考生物
合计
物理类
65
55
120
历史类
35
45
80
合计
100
100
200
故χ2=200×(65×45-55×35)2120×80×100×100≈2.083,
由2.083<2.706=x0.100,知没有90%以上的把握认为选择生物与选考类别有关,故C错误;
由2.083<3.841=x0.050,知没有95%以上的把握认为选择生物与选考类别有关,故D正确.
故选D.
2.C 估计该校既喜欢体育又喜欢音乐的学生约占2050=25,A中判断正确;
每个个体被抽到的概率为630=15,B中判断正确;
“至少有2人喜欢音乐”与“至多有1人喜欢音乐”为对立事件,C中判断错误;
由χ2=50×(20×15-10×5)230×20×25×25≈8.333>7.879=x0.005,得在犯错误的概率不超过0.005的前提下,认为“喜欢体育”与“喜欢音乐”有关系,D中判断正确.
故选C.
3.B χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=naa+c-bb+d·aa+b-cc+d,根据2×2列联表和独立性检验的相关知识,知当b,d 一定时,a,c相差越大,aa+10与cc+30相差就越大, χ2就越大,即X和Y有关系的可能性就越大,结合选项,知B中a-c=30,与其他选项相比相差最大.故选B.
4.解析 (1)由10×(0.01+0.015+a+0.03+0.01)=1,解得a=0.035,
这160人的平均年龄为20×10×0.01+30×10×0.015+40×10×0.035+50×10×0.03+60×10×0.01=41.5(岁).
(2)零假设为H0:是否通过微信或微博表达对祖国的祝福与年龄无关.
前3组人数为10×(0.01+0.015+0.035)×160=96,
由题可得,2×2列联表如下:
单位:人
通过短视频APP
表达祝福
通过微信或微博
表达祝福
合计
青年人
14
96
110
中年人
26
64
90
合计
40
160
200
经计算得, χ2=200×(14×64-96×26)2110×90×40×160≈8.081>6.635=x0.010,
根据小概率值α=0.010的χ2独立性检验,有充分证据推断H0不成立,因此能认为是否通过微信或微博表达对祖国的祝福与年龄有关.
5.解析 (1)由题表中数据可得,低于45岁的人数为100×(0.1+0.32+0.28)=70,不低于45岁的人数为30,可得2×2列联表如下:
单位:人
年龄低于45岁
年龄不低于45岁
合计
使用
手机支付
60
15
75
不使用
手机支付
10
15
25
合计
70
30
100
零假设为H0:“使用手机支付”与年龄无关.
根据列联表中数据,计算可得χ2=100×(60×15-15×10)275×25×70×30≈14.286>10.828=x0.001.
根据小概率值α=0.001的独立性检验,有充分证据推断H0不成立,因此认为“使用手机支付”与年龄有关.
(2)由题意可知,X的所有可能取值为0,1,2,3,
且P(X=0)=C32C22C52C32=110,
P(X=1)=C31C21C22C52C32+C32C21C52C32=25,
P(X=2)=C22C22C52C32+C31C21C21C52C32=1330,
P(X=3)=C22C21C52C32=115,
于是X的分布列为
X
0
1
2
3
P
110
25
1330
115
所以E(X)=0×110+1×25+2×1330+3×115=2215.
6.解析 (1)补充完整的2×2列联表如下.
单位:人
50岁以下
(含50岁)
50岁以上
总计
长潜伏期
40
60
100
非长潜伏期
80
220
300
总计
120
280
400
零假设为H0:“长潜伏期”与年龄无关.
计算得,χ2=400×(40×220-60×80)2100×300×120×280≈6.349>3.841=x0.05,
根据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为“长潜伏期”与年龄有关,此推断犯错误的概率不大于0.05.
(2)由题意得μ=7.2,σ=2.25,则μ+3σ=13.95,
又P(X>13.95)≈1-0.99732=0.001 35,
所以潜伏期超过14天的概率很低,因此对入境旅客一律要求隔离14天是合理的.
高中数学人教A版 (2019)选择性必修 第二册第五章 一元函数的导数及其应用5.1 导数的概念及其意义随堂练习题: 这是一份高中数学人教A版 (2019)选择性必修 第二册第五章 一元函数的导数及其应用5.1 导数的概念及其意义随堂练习题,共6页。试卷主要包含了1 导数的概念及其意义等内容,欢迎下载使用。
高中人教A版 (2019)8.3 分类变量与列联表复习练习题: 这是一份高中人教A版 (2019)8.3 分类变量与列联表复习练习题,共11页。试卷主要包含了001的前提下,认为该疫苗有效等内容,欢迎下载使用。
【同步讲义】(人教A版2019)高中数学选修第三册:8.3 列联表与独立性检验 讲义: 这是一份【同步讲义】(人教A版2019)高中数学选修第三册:8.3 列联表与独立性检验 讲义,文件包含同步讲义人教A版2019高中数学选修第三册83列联表与独立性检验原卷版docx、同步讲义人教A版2019高中数学选修第三册83列联表与独立性检验解析版docx等2份试卷配套教学资源,其中试卷共60页, 欢迎下载使用。