所属成套资源:【同步知识讲义】人教A版高中数学选修第三册 全册精讲精练讲义+质量检测卷
【同步讲义】(人教A版2019)高中数学选修第三册:成对数据的统计分析章末测试卷(一)
展开
这是一份【同步讲义】(人教A版2019)高中数学选修第三册:成对数据的统计分析章末测试卷(一),文件包含同步讲义人教A版2019高中数学选修第三册成对数据的统计分析章末测试卷一原卷版docx、同步讲义人教A版2019高中数学选修第三册成对数据的统计分析章末测试卷一解析版docx等2份试卷配套教学资源,其中试卷共31页, 欢迎下载使用。
成对数据的统计分析章末测试卷(一)
说明:1.本试题共4页,满分150分,考试时间120分钟。
2.答题前,考生务必用黑色字迹的钢笔或签字笔将自己的姓名、试室号、座位号填写在答题卷上。
3. 答题必须使用黑色字迹的钢笔或签字笔作答,答案必须写在答题卷上各题目指定区域内的相应位置上;如需改动,先划掉原来的答案,然后再写上新的答案;不准使用铅笔和涂改液。不按以上要求作答的答案无效。
4.考生必须保持答题卷整洁,考试结束后,将答题卷交回,试卷自己保存。
第I卷(选择题 共60分)
一、单项选择题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项符合题目要求.)
1.(2023·江西宜春·统考一模)给出下列命题,其中正确命题的个数为( )
①若样本数据的方差为,则数据的方差为;
②回归方程为时,变量与具有负的线性相关关系;
③随机变量服从正态分布,,则;
④在回归分析中,对一组给定的样本数据而言,当样本相关系数越接近时,样本数据的线性相关程度越强.
A.个 B.个 C.个 D.个
【答案】B
【分析】根据方差的性质、回归直线的意义、正态分布曲线的对称性和相关系数的意义依次判断各个选项即可.
【详解】对于①,由方差的性质可知:数据的方差为,①错误;
对于②,由回归方程知:,则变量与具有负的线性相关关系,②正确;
对于③,由正态分布曲线的对称性可知:,③错误;
对于④,由相关系数意义可知:越接近时,样本数据的线性相关程度越强,④正确.
故选:B.
2.(2023·浙江杭州·统考二模)某兴趣小组研究光照时长x(h)和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,作如图所示的散点图.若去掉后,下列说法正确的是( )
A.相关系数r变小 B.决定系数变小
C.残差平方和变大 D.解释变量x与预报变量y的相关性变强
【答案】D
【分析】从图中分析得到去掉后,回归效果更好,再由相关系数,决定系数,残差平方和和相关性的概念和性质作出判断即可.
【详解】从图中可以看出较其他点,偏离直线远,故去掉后,回归效果更好,
对于A,相关系数越接近于1,模型的拟合效果越好,若去掉后,相关系数r变大,故A错误;
对于B,决定系数越接近于1,模型的拟合效果越好,若去掉后,决定系数变大,故B错误;
对于C,残差平方和越小,模型的拟合效果越好,若去掉后,残差平方和变小,故C错误;
对于D,若去掉后,解释变量x与预报变量y的相关性变强,且是正相关,故D正确.
故选:D.
3.(2023·高二课时练习)利用独立性检验来考察两个分类变量和是否有关系时,通过查列联表计算得4.964,那么认为与有关系,这个结论错误的可能性不超过( )
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.0.001 B.0.005 C.0.01 D.0.05
【答案】D
【分析】根据的观测值,与临界值表对照求解即可.
【详解】由,所以在犯错误的概率不超过0.05的前提下,认为与有关系.
故选:D
4.(2023·贵州·校联考二模)为了发展学生的兴趣和个性特长,培养全面发展的人才.某学校在不加重学生负担的前提下.提供个性、全面的选修课程.为了解学生对于选修课《学生领导力的开发》的选择意愿情况,对部分高二学生进行了抽样调查,制作出如图所示的两个等高条形图,根据条形图,下列结论正确的是( )
A.样本中不愿意选该门课的人数较多
B.样本中男生人数多于女生人数
C.样本中女生人数多于男生人数
D.该等高条形图无法确定样本中男生人数是否多于女生人数
【答案】B
【分析】根据等高条形图直接判断各个选项即可.
【详解】对于A,由图乙可知,样本中男生,女生都大部分愿意选择该门课,
则样本中愿意选该门课的人数较多,A错误;
对于BCD,由图甲可知,在愿意和不愿意的人中,都是男生占比较大,
所以可以确定,样本中男生人数多于女生人数,B正确,CD错误.
故选:B.
5.(2023·上海浦东新·统考二模)某种产品的广告支出与销售额(单位:万元)之间有下表关系,与的线性回归方程为,当广告支出6万元时,随机误差的效应即离差(真实值减去预报值)为( ).
2
4
5
6
8
30
40
60
70
80
A.1.6 B.8.4 C.11.6 D.7.4
【答案】A
【分析】代入,得到,从而得到随机误差的效应即离差.
【详解】当时,,故随机误差的效应即离差为.
故选:A
6.(2023·陕西榆林·统考三模)若由一个列联表中的数据计算得,则( )
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.能有的把握认为这两个变量有关系
B.能有的把握认为这两个变量没有关系
C.能有的把握认为这两个变量有关系
D.能有的把握认为这两个变量没有关系
【答案】A
【分析】通过所给的观测值,同临界值表中的数据进行比较,得到结论.
【详解】因为,所以能有的把握认为这两个变量有关系.
故选:A
7.(2023春·河南南阳·高二校联考期中)鞋子的尺码又叫鞋号,这是一种衡量人类脚的形状以便配鞋的标准单位系统,已知女鞋欧码及对应的脚长(单位:厘米)如下表所示:
脚长
22
22
22.5
23
23.5
24
24.5
25
25.5
26
26.5
27
欧码
35
35.5
36
36.5
37.5
38
38.5
39
40
40.5
41
42
某数学兴趣小组通过调查发现某高中的女学生的脚长x(单位:厘米)和身高y(单位:厘米)之间有线性相关关系,其回归直线方程为.已知该高中某女学生的身高为166厘米,则预测她穿的鞋子为( )
A.36码 B.36.5码
C.38码 D.39码
【答案】C
【分析】将身高值代入回归直线方程,求解,再结合表格中数据得出结果.
【详解】由题意可估计该女学生的脚长为,
则她穿的鞋子为38码.
故选:C.
8.(2023春·内蒙古赤峰·高二赤峰二中校考阶段练习)据一组样本数据,求得经验回归方程为,且.现发现这组样本数据中有两个样本点和误差较大,去除后重新求得的经验回归直线的斜率为1.1,则( )
A.去除两个误差较大的样本点后,的估计值增加速度变快
B.去除两个误差较大的样本点后,重新求得的回归方程对应直线一定过点
C.去除两个误差较大的样本点后,重新求得的回归方程为
D.去除两个误差较大的样本点后,相应于样本点的残差为0.1
【答案】C
【分析】根据直线的斜率大小判断A;求出判断B;再求出经验回归方程判断C;计算残差判断D作答.
【详解】对于A,因为去除两个误差较大的样本点后,经验回归直线的斜率变小,则的估计值增加速度变慢,A错误;
对于B,由及得:,因为去除的两个样本点和,
并且,因此去除两个样本点后,样本的中心点仍为,
因此重新求得的回归方程对应直线一定过点,B错误;
对于C,设去除后重新求得的经验回归直线的方程为,由选项B知,,解得,
所以重新求得的回归方程为,C正确;
对于D,由选项C知,,当时,,则,
因此去除两个误差较大的样本点后,相应于样本点的残差为,D错误.
故选:C
二、多项选择题(本题共4小题,每小题5分,共20分.在每小题给出的四个选项中,有多项符合题目要求。全部选对的得5分,部分选对的得2分,有选错的得0分)
9.(2023·吉林通化·梅河口市第五中学校考模拟预测)下列关于成对数据的统计说法正确的有( )
A.若当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关
B.样本相关系数r的绝对值大小可以反映成对样本数据之间线性相关的程度
C.通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据
D.决定系数越大,模型的拟合效果越差
【答案】ABC
【分析】根据正、负相关的意义即可判断A;根据相关系数、决定系数的意义即可判断B,D;可以从残差图发现可疑数据,用残差平方和判断模型拟合效果即可判断C.
【详解】对于A,如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关,故A正确;
对于B,在回归分析中,成对样本数据的样本相关系数r的绝对值越大,成对样本数据的线性相关程度越强,故B正确;
对于C,残差图可以发现原始数据中的可疑数据,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故C正确;
对于D,在回归分析中,可用决定系数的值判断模型的拟合效果,越大,模型的拟合效果越好,故D错误.
故选:ABC.
10.(2023春·河南南阳·高二校联考期中)某机构为了调查某地中学生是否喜欢数学课与性别之间的关系,通过抽样调查的方式收集数据,经过计算得到,由,可知下列结论正确的是( )
A.有95%的把握认为该地中学生是否喜欢数学课与性别无关
B.有95%的把握认为该地中学生是否喜欢数学课与性别有关
C.在犯错误的概率不超过5%的前提下,可以认为该地中学生是否喜欢数学课与性别无关
D.在犯错误的概率不超过5%的前提下,可以认为该地中学生是否喜欢数学课与性别有关
【答案】BD
【分析】根据已知直接判断选项即可.
【详解】因为,所以有95%的把握认为该地中学生是否喜欢数学课与性别有关,
即在犯错误的概率不超过5%的前提下,可以认为该地中学生是否喜欢数学课与性别有关.
故选:BD.
11.(2023·广东汕头·金山中学校考模拟预测)每年4月23日为“世界读书日”,树人学校于四月份开展“书香润泽校园,阅读提升思想”主题活动,为检验活动效果,学校收集当年二至六月的借阅数据如下表:
月份
二月
三月
四月
五月
六月
月份代码x
l
2
3
4
5
月借阅量y(百册)
4.9
5.1
5.5
5.7
5.8
根据上表,可得y关于x的经验回归方程为,则( )
A.
B.借阅量4.9,5.1,5.5,5.7,5.8的上四分位数为5.7
C.y与x的线性相关系数
D.七月的借阅量一定不少于6. 12万册
【答案】ABC
【分析】对于A:根据回归方程必过样本中心点分析运算;对于B:根据百分位的定义分析运算;对于C:根据相关系数的概念分析理解;对于D:取,代入回归直线分析运算.
【详解】对于A:因为,,
所以,得,所以A正确;
对于B:因为5×75%=3.75,所以借阅量4.9,5.1,5.5,5.7,5.8的上四分位数为5.7,所以B正确;
对于C:因为,所以y与x的线性相关系数,所以C正确;
对于D:由选项A可知线性回归方程为,
当,则,
所以七月的借阅量约为6. 12百册,所以D错误;
故选:ABC.
12.(2023·高二课时练习)某中学为了解性别因素是否对本校学生体育锻炼的经常性有影响,从本校所有学生中随机调查了50名男生和50名女生,得到如下列联表:
经常锻炼
不经常锻炼
男
40
10
女
30
20
a
0.1
0.05
0.01
2.706
3.841
6.635
经计算,则可以推断出( )
A.该学校男生中经常体育锻炼的概率的估计值为
B.该学校男生比女生更经常锻炼
C.有95%的把握认为男、女生在体育锻炼的经常性方面有差异
D.有99%的把握认为男、女生在体育锻炼的经常性方面有差异
【答案】BC
【分析】根据列联表判断概率估值,判断AB,以及和参考临界值比较,判断CD.
【详解】对选项A:该学校男生中经常体育锻炼的概率的估计值为,故A错误;
对选项B:经常体育锻炼的概率的估计值男生为,女生为,故B正确;
对选项C:,故有95%的把握认为男、女生在体育锻炼的经常性方面有差异,故C正确;
对选项D:,故没有99%的把握认为男、女生在体育锻炼的经常性方面有差异,故D错误.
故选:BC
第Ⅱ卷(非选择题 共90分)
三、填空题(本题共4小题,每小题5分,共20分)
13.(2023秋·浙江宁波·高三期末)已知变量x和y的统计数据如下表:
x
6
7
8
9
10
y
3.5
4
5
5.5
7
如果由表中数据可得经验回归直线方程为,那么,当时,残差为______.(注:残差=观测值-预测值)
【答案】/
【分析】先求出回归方程,再根据回归方程求出预测值,最后计算残差即可.
【详解】,
所以,
所以时,,
所以残差为.
故答案为:.
14.(2023春·河南南阳·高二校考阶段练习)一组样本数据:,,,,,由最小二乘法求得线性回归方程为,若,则实数a的值为______.
【答案】5
【分析】求出中心点,由线性回归方程过中心点列方程求解.
【详解】,,由线性回归方程过中心点得.
故答案为:5
15.(2023春·上海·高三校联考阶段练习)一项研究同年龄段的男、女生的注意力差别的脑功能实验,实验数据如下表:
注意力稳定
注意力不稳定
男生
29
7
女生
33
5
依据,该__________实验该年龄段的学生在注意力的稳定性上对于性别没有显著差异(填拒绝或支持),
参考公式:
【答案】支持
【分析】根据卡方公式计算即可做出判断.
【详解】由表中数据:,
所以没有足够把握认为学生在注意力的稳定性上与性别有关,
即该实验支持该年龄段的学生在注意力的稳定性上对于性别没有显著差异.
故答案为:支持
16.(2023春·湖南长沙·高二长郡中学校考阶段练习)某校团委对“学生性别和喜欢网络游戏是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢网络游戏的人数占男生人数的,女生喜欢网络游戏的人数占女生人数的.若根据独立性检验认为喜欢网络游戏和性别有关,且此推断犯错误的概率超过0.01但不超过0.05,则被调查的学生中男生可能有_________人.(请将所有可能的结果都填在横线上)
附表:,其中.
0.050
0.010
3.841
6.635
【答案】45,50,55,60,65
【分析】利用独立性检验表达列联表及观测值可解得答案.
【详解】设男生有x人,由题意可得列联表如下,
喜欢
不喜欢
合计
男生
x
女生
x
合计
若认为喜欢网络游戏和性别有关,且该推断犯错误的概率超过0.01但不超过0.05,
则.
∵,
∴,解得,
又x为5的整数倍,∴被调查的学生中男生可能人数为45,50,55,60,65.
故答案为:45,50,55,60,65.
四、解答题(本题共6个小题,共70分.解答应写出文字说明,证明过程或演算步骤)
17.(2023·辽宁锦州·统考模拟预测)今年以来,人们的出行需求持续释放,各种旅游项目态势火爆,旅游预订人数也开始增多.某调查组对400名不同年龄段的游客进行了问卷调查,其中有200名游客进行了预订,这200名游客中各年龄段所占百分比如图所示:
年龄在19-35岁的人群称为青年人群,已知在所有调查游客中随机抽取1人,抽到不预订的青年游客概率为.
(1)请将下列列联表补充完整,并判断能否在犯错误概率不超过0.001的前提下,认为旅游预订与是否为青年有关;
预定旅游
不预定旅游
合计
青年
非青年
合计
(2)按照分层抽样的方法,从预订旅游客群中选取5人,再从这5人中任意选取3人,求3人中至少有2人是青年人的概率.
附:①,其中.
②
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)列联表答案见解析,能在犯错误概率不超过0.001的前提下,认为旅游预订与是否青年有关
(2)
【分析】(1)先求出青年游客预订旅游人数,再求出青年游客不预订旅游的人数,从而得到列联表,再利用列联表求出的值,从而得到结论;
(2)先求出每层抽取的人数,再求出基本事件的个数和事件包含的个数,利用古典概率公式即可求出结果.
【详解】(1)200名有预订的游客中,青年游客人数为,
200名不预订的游客中,青年游客人数为,
可知列联表如下
预订旅游
不预订旅游
合计
青年
120
75
195
非青年
80
125
205
合计
200
200
400
所以能在犯错误概率不超过0.001的前提下,认为旅游预订与是否青年有关.
(2)按分层抽样,从预定游客中选取5人,
其中青年游客的人数为人,非青年游客2人,
所以从5人中任取3人,其中至少有2人是青年人的概率为
.
18.(2023·广西柳州·高三柳州高级中学校联考阶段练习)中国女排,曾经一度成为世界冠军,铸就了响彻中华的女排精神.看过中国女排的纪录片后,某大学掀起“学习女排精神,塑造健康体魄”的年度主题活动,一段时间后,学生的身体素质明显提高,将该大学近5个月体重超重的人数进行统计,得到如下表格:
月份
1
2
3
4
5
体重超重的人数
640
540
420
300
200
(1)若该大学体重超重人数与月份变量份变量(月份变量依次为)具有线性相关关系,请预测从第几月份开始该大学体重超重的人数降至100人以下?
(2)该大学鼓励学生自发组织各项体育比赛活动,甲、乙两班同学利用课余时间进行排球比赛,规定:每一局比赛中获胜方记1分,失败方记0分,没有平局,首先获得3分者获胜,比赛结束.假设每局比赛甲班获胜的概率都是.若甲班以的比分领先时,记为到结束比赛时还需要比赛的局数,求的分布列及期望.
附1:回归方程中斜率和截距的最小二乘估计公式分别为:
;.
附2:参考数据.
【答案】(1)预测从第6月份开始该大学体重超标人数降至100人以下
(2)分布列见解析,期望为
【分析】(1)根据最小二乘法可计算得回归直线方程,由不等式即可求解,
(2)根据相互独立事件的概率公式计算的各种取值对应的概率,再计算数学期望;
【详解】(1)设线性回归方程为:,
由已知可得:,,
,,
线性回归方程为:,
令,可得,
又,故.
故可以预测从第6月份开始该大学体重超标人数降至100人以下.
(2)的可能取值为2,3,4,
,
,
,
的分布列为:
2
3
4
.
19.(2023·陕西·统考一模)甲乙二人均为射击队S中的射击选手,某次训练中,二人进行了100次“对抗赛”,每次“对抗赛”中,二人各自射击一次,并记录二人射击的环数,更接近10环者获胜,环数相同则记为“平局”.已知100次对抗的成绩的频率分布如下:
“对抗赛”成绩(甲:乙)
总计
频数
21
13
6
25
15
10
4
2
4
100
这100次“对抗赛”中甲乙二人各自击中各环数的频率可以视为相应的概率.
(1)设甲,乙两位选手各自射击一次,得到的环数分别为随机变量X,Y,求,,,.
(2)若某位选手在一次射击中命中9环或10环,则称这次射击成绩优秀,以这100次对抗赛的成绩为观测数据,能否在犯错误的概率不超过0.01的前提下认为甲的射击成绩优秀与乙的射击成绩优秀有关联?
(3)在某次团队赛中,射击队S只要在最后两次射击中获得至少19环即可夺得此次比赛的冠军,现有以下三种方案:
方案一:由选手甲射击2次﹔
方案二:由选手甲、乙各射击1次;
方案三:由选手乙射击2次.
则哪种方案最有利于射击队S夺冠?请说明理由.
附:参考公式:
参考数据:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1),,,
(2)不能
(3)方案二;理由见解析
【分析】(1)由随机变量X,Y的取值,计算相应的概率,列出分布列,求,,,;
(2)根据列联表,计算,与临界值比较,得出结论;
(3)分别计算三种方案射击队S夺冠的概率,选择最有利方案.
【详解】(1)根据题意,选手甲击中10环的频数为,击中9环的频数为,击中8环的频数为;选手乙击中10环的频数为,击中9环的频数为,击中8环的频数为;
以频率作概率,可得X,Y的分布列分别为
X
10
9
8
P
0.4
0.5
0.1
Y
10
9
8
P
0.5
0.3
0.2
故,
,
,
,
(2)根据题意,在100次“对抗赛”中,他们成绩同时优秀的频数为,仅甲优秀的频数为,仅乙优秀的频数为;二人均非优秀的频数为4,
故可得以下列联表:
乙
合计
优秀
非优秀
甲
优秀
74
16
90
非优秀
6
4
10
合计
80
20
100
根据列联表中的数据,经计算得到
,
因此,在犯错误的概率不超过0.01的前提下,不能认为甲的射击成绩优秀与乙的射击成绩优秀有关联.
(3)记事件“S队夺冠(即最后两次射击总环数达到19环)”.
若采用方案一:则取得19环的概率为,取得20环的概率为,故A事件发生概率为0.56.
若采用方案二:则取得19环的概率为,取得20环的概率为,故A事件发生概率为0.57.
若采用方案三:则取得19环的概率为,取得20环的概率为,故A事件发生概率为0.55.
因为,故应采用方案二.
20.(2023·河北沧州·统考模拟预测)近年来,随着科技不断地进步,科技成果逐年呈递增的态势,尤其与物理专业有关的方面——光学、电学、机械力学、电气等方面递增更快.为了保护知识产权,需要将科技成果转化为科技专利,这样就需要大量的专利代理人员从事专利书写工作,而物理方面的研究生更受专利代理公司青睐.因为通过培训物理方面的研究生,他们可以书写化学、生物、医学等方面的专利,而其他科目的研究生只能写本专业方面的专利.某大型专利代理公司为了更好、更多的招收研究生来书写专利,通过随机问卷调查的方式对物理方向的研究生进行了专利代理方向就业意向调查,得到的数据如下表:
喜欢
不喜欢
女研究生
105
75
男研究生
60
90
(1)根据的独立性检验,能否认为物理方向的研究生专利代理方向就业意向与性别有关联?
(2)该专利代理公司从这150人的男研究生中按专利代理方向就业意向分层,用分层随机抽样方式抽取5人,再从这5人中随机抽取3人用问卷的形式调查他们毕业后的年薪资意向,这3人中有人喜欢从事专利代理工作,求的分布列和数学期望.
下面附临界值表及参考公式:
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
.
【答案】(1)物理方向的研究生专利代理方向就业意向与性别有关联
(2)分布列见解析,
【分析】(1)根据公式计算出值与临界值表进行比较即可判断出关联性,
(2)根据分层抽样性质确定对应人数,写出随机变量并根据超几何分布求出分布列,计算得出期望值.
【详解】(1)零假设为:物理方向的研究生专利代理方向就业意向与性别没有关联,
,
∴根据的独立性检验,可以推断不成立,
∴物理方向的研究生专利代理方向就业意向与性别有关联.
(2)由分层随机抽样可知,抽取的喜欢专利代理的男生有2人,不喜欢专利代理的男生有3人.
可取0,1,2,
,,,
∴的分布列为
0
1
2
数学期望.
21.(2023·重庆·统考模拟预测)李医生研究当地成年男性患糖尿病与经常喝酒的关系,他对盲抽的60名成年男性作了调查,得到如下表统计数据,还知道被调查人中随机抽一人患糖尿病的概率为.
经常喝酒
不经常喝酒
患糖尿病
4
没患糖尿病
6
(1)写出本研究的列联表,依据小概率值的独立性检验,判断当地成年男性患糖尿病是否和喝酒习惯有关联?
(2)从该地任选一人,表示事件“选到的人经常喝酒”,表示事件“选到的人患糖尿病”,把与的比值叫“常喝酒和患糖尿病的关联指数”,记为.
(ⅰ)利用该调查数据求的值;
(ⅱ)证明:.
参考公式及数表:,
0.15
0.1
0.05
0.01
0.005
0.001
2.072
2.706
3.841
6.635
7.879
10.828
【答案】(1)联立表见解析;当地成年男性患糖尿病与喝酒习惯无关联;
(2);证明见解析.
【分析】(1)根据题干填写联立表,再根据卡方公式计算对照数表进行判断即可.
(2)根据条件概率公式求出(2)问中对应条件概率,代入式中计算即可.
【详解】(1)根据题意可知,患糖尿病的人数为人,这10人中不经常喝酒的有6人,
经常喝酒
不经常喝酒
患糖尿病
4
6
没患糖尿病
6
44
,
因此依据小概率值的独立性检验,当地成年男性患糖尿病与喝酒习惯无关联.
(2)(ⅰ)经常喝酒且患糖尿病的人数有4人,则,
经常喝酒的人数有10人,则,
,
经常喝酒且没患糖尿病的人数有6人,则,
,
;
(ⅱ)证明:患糖尿病的人数有10人,则;没患糖尿病的人数有50人,则,
,,
.
22.(2023·湖南益阳·统考模拟预测)为了研究学生每天整理数学错题情况,某课题组在某市中学生中随机抽取了100名学生调查了他们期中考试的数学成绩和平时整理数学错题情况,并绘制了下列两个统计图表,图1为学生期中考试数学成绩的频率分布直方图,图2为学生一个星期内整理数学错题天数的扇形图.若本次数学成绩在110分及以上视为优秀,将一个星期有4天及以上整理数学错题视为“经常整理”,少于4天视为“不经常整理”.已知数学成绩优秀的学生中,经常整理错题的学生占.
数学成绩优秀
数学成绩不优秀
合计
经常整理
不经常整理
合计
(1)求图1中的值以及学生期中考试数学成绩的上四分位数;
(2)根据图1、图2中的数据,补全上方列联表,并根据小概率值的独立性检验,分析数学成绩优秀与经常整理数学错题是否有关?
(3)用频率估计概率,在全市中学生中按“经常整理错题”与“不经常整理错题”进行分层抽样,随机抽取5名学生,再从这5名学生中随机抽取2人进行座谈.求这2名同学中经常整理错题且数学成绩优秀的人数X的分布列和数学期望.
附:
【答案】(1),分
(2)有关
(3)分布列见解析,
【分析】(1)利用频率分布直方图各个小矩形的面积和为1,求出的值,进而可求出上四分位数;
(2)先求出数学优秀和不优秀的人,常整理错题和不经常整理错题的人,得到列联表,根据列联表求出值,从而得出判断;
(3)先求出的可能取值,并求出相应取值的概率,从而求出分布列和期望.
【详解】(1)由题意可得,
解得,
学生期中考试数学成绩的上四分位数为:分;
(2)数学成绩优秀的有人,不优秀的人人,经常整理错题的有人,不经常整理错题的是人,经常整理错题且成绩优秀的有人,则
数学成绩优秀
数学成绩不优秀
合计
经常整理
35
25
60
不经常整理
15
25
40
合计
50
50
100
零假设为:数学成绩优秀与经常整理数学错题无关,
根据列联表中的数据,经计算得到可得,
根据小概率值的独立性检验,我们推断不成立,
即认为数学成绩优秀与经常整理数学错题有关联,此推断犯错误的概率不大于;
(3)由分层抽样知,随机抽取的5名学生中经常整理错题的有3人,不经常整理错题的有2人,则可能取为0,1,2,
经常整理错题的3名学生中,恰抽到k人记为事件,则
参与座谈的2名学生中经常整理错题且数学成绩优秀的恰好抽到人记为事件
则,,,,
,,
,
,
,
故X的分布列如下:
X
0
1
2
P
则可得X的数学期望为
相关试卷
这是一份【同步讲义】(人教A版2019)高中数学选修第三册:计数原理章末检测卷(二),文件包含同步讲义人教A版2019高中数学选修第三册计数原理章末检测卷二原卷版docx、同步讲义人教A版2019高中数学选修第三册计数原理章末检测卷二解析版docx等2份试卷配套教学资源,其中试卷共17页, 欢迎下载使用。
这是一份【同步讲义】(人教A版2019)高中数学选修第三册:计数原理章末检测卷(一),文件包含同步讲义人教A版2019高中数学选修第三册计数原理章末检测卷一原卷版docx、同步讲义人教A版2019高中数学选修第三册计数原理章末检测卷一解析版docx等2份试卷配套教学资源,其中试卷共20页, 欢迎下载使用。
这是一份【同步讲义】(人教A版2019)高中数学选修第三册:成对数据的统计分析章末测试卷(二),文件包含同步讲义人教A版2019高中数学选修第三册成对数据的统计分析章末测试卷二原卷版docx、同步讲义人教A版2019高中数学选修第三册成对数据的统计分析章末测试卷二解析版docx等2份试卷配套教学资源,其中试卷共29页, 欢迎下载使用。