还剩7页未读,
继续阅读
成套系列资料,整套一键下载
- 新教材2023高中数学第八章成对数据的统计分析8.3列联表与独立性检验8.3.1分类变量与列联表分层演练新人教A版选择性必修第三册 试卷 0 次下载
- 新教材2023高中数学第八章成对数据的统计分析8.3列联表与独立性检验8.3.2独立性检验分层演练新人教A版选择性必修第三册 试卷 0 次下载
- 新教材2023高中数学第八章成对数据的统计分析章末复习课新人教A版选择性必修第三册 试卷 试卷 0 次下载
- 新教材2023高中数学数学建模建立统计模型进行预测新人教A版选择性必修第三册 试卷 0 次下载
- 新教材2023高中数学数学探究杨辉三角的性质与应用分层演练新人教A版选择性必修第三册 试卷 0 次下载
新教材2023高中数学第八章成对数据的统计分析质量评估新人教A版选择性必修第三册 试卷
展开
这是一份新教材2023高中数学第八章成对数据的统计分析质量评估新人教A版选择性必修第三册,共10页。
第八章质量评估
(时间:120分钟 分值:150分)
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一个选项是符合题目要求的.
1.下列现象的相关性最高的是 ( )
A.某商店的职工人数与商品销售额之间的样本相关系数为0.87
B.流通费用率与商业利润之间的样本相关系数为-0.94
C.商品销售额与商业利润之间的样本相关系数为0.51
D.商品销售额与流通费用率之间的样本相关系数为-0.81
解析:|r|越接近1,相关性越强.
答案:B
2.工人月工资y(单位:元)关于劳动生产率x(单位:千元)的经验回归方程为=90x+60,下列说法中正确的是 ( )
A.劳动生产率每提高1 000元,工人月工资提高150元左右
B.劳动生产率每提高1 000元,工人月工资提高90元左右
C.当劳动生产率为1 000元时,工人月工资提高90元
D.以上说法都不正确
解析:由经验回归方程得到的预测值并不一定是响应变量的精确值,而是响应变量可能取值的平均值,
因此当劳动生产率每提高1 000元时,工人月工资提高90元左右.
答案:B
3.如图,等高堆积条形图可以说明的问题是( )
A.“心脏搭桥”手术和“血管清障”手术对“又发心脏病”的影响是绝对不同的
B.“心脏搭桥”手术和“血管清障”手术对“又发心脏病”的影响没有什么不同
C.此等高堆积条形图看不出两种手术有什么不同的地方
D.“心脏搭桥”手术和“血管清障”手术对“又发心脏病”的影响在某种程度上是不同的,但是没有100%的把握
解析:由等高堆积条形图可知选项D正确.
答案:D
4.设两个变量x和y之间具有线性相关关系,它们的样本相关系数是r,y关于x的经验回归直线的斜率是b,纵轴上的截距是a,那么必有
( )
A.b与r的符号相同
B.a与r的符号相同
C.b与r的符号相反
D.a与r的符号相反
解析:当b>0时,两变量正相关,此时,r>0;当b<0时,两变量负相关,此时r<0,所以b与r的符号相同.
答案:A
5.若经验回归方程中的=0,则样本相关系数为 ( )
A.r=1 B.r=-1
C.r=0 D.无法确定
解析:当=0时,(xi-)(yi-)=0,
即xiyi-n=0,
所以r=0.
答案:C
6.通过随机询问相同人数不同性别的大学生在购买食物时是否看营养说明,得知有的男大学生“不看”,有的女大学生“不看”,若依据α=0.01的独立性检验,认为性别与看营养说明之间有关,则调查的总人数可能为 ( )
A.150B.170C.240D.175
解析:设男女大学生各有m人,根据题意列出2×2列联表如下:
性别
是否看营养说明
合计
看
不看
男
m
m
m
女
m
m
m
合计
m
m
2m
所以χ2==,
因为依据α=0.01的独立性检验,认为性别与看营养说明之间有关,
所以≥x0.01=6.635,解得2m≥179.145,
所以总人数2m可能为240.
答案:C
7.某工厂为预测某种产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取了8组观察值.计算知xi=52,yi=228,
=478,xiyi=1 849,则y关于x的经验回归方程是( )
A. =11.47+2.62x B. =-11.47+2.62x
C. =2.62+11.47x D. =11.47-2.62x
解析:由已知条件得=6.5,=28.5.
由=, =-,计算得≈2.62,≈11.47,
所以=11.47+2.62x.
答案:A
8.小波同学为了验证谚语“日落云里走,雨在半夜后”,观察了他所在地区的100天里日落和夜晚天气,得到2×2列联表.并计算得到χ2≈
19.05,下列小波对该地区天气判断不正确的是 ( )
单位:天
天气“日落云里走”
“雨在半夜后”
合计
下雨
未下雨
出现
25
5
30
未出现
25
45
70
合计
50
50
100
A.夜晚下雨的概率约为
B.未出现“日落云里走”夜晚下雨的概率约为
C.有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关联
D.出现“日落云里走”,有99.9%的把握认为夜晚会下雨
解析:由题意,把频率看作概率可得夜晚下雨的概率约为=,故A正确;
未出现“日落云里走”夜晚下雨的概率约为=,故B正确;
由χ2≈19.05>10.828,根据临界值表,可得有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关联,故C正确,D错误.
答案:D
二、选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.
9.下列说法正确的是 ( )
A.将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变
B.设有一个经验回归方程=3-5x,当变量x每增加1个单位时,y平均增加5个单位
C.经验回归直线=x+不可能过点(,)
D.在一个2×2列联表中,由计算得χ2=13.079,则推断“这两个变量间有关联”犯错误的概率不超过0.001
解析:将一组数据中的每个数据都加上或减去同一个常数后,每个数与平均数的差值不变,因而方差恒不变,故A项正确;根据经验回归方程=3-5x可知当x每增加1个单位时,y平均减少5个单位,故B项错误;经验回归直线必过点(,),故C项错误;因为χ2=13.079>10.828=
x0.001,所以根据小概率值α=0.001的独立性检验,推断“两个变量间有关联”犯错误的概率不超过0.001,故D项正确.
答案:AD
10.某城市收集并整理了该市去年1月份至10月份各月最低气温与最高气温(单位:℃)的数据,绘制的折线图如图所示.已知该城市各月的最低气温与最高气温具有较好的线性关系,则根据折线图,下列结论正确的是( )
A.最低气温与最高气温为正相关
B.10月的最高气温不低于5月的最高气温
C.月温差(最高气温减最低气温)的最大值出现在1月
D.最低气温低于0 ℃的月份有4个
解析:由图可知,最低气温与最高气温为正相关,故A项正确;10月的最高气温不低于5月的最高气温,故B项正确;月温差的最大值出现在1月,故C项正确;最低气温低于0 ℃的月份有3个,故D项错误.故选ABC.
答案:ABC
11.已知变量x和y的取值如表所示,且2.5
x
2
3
4
5
y
6.5
m
n
2.5
A. =-1.4x+9.4 B. =-2x+14.2
C. =1.5x+8.8 D. =-1.6x+10.6
解析:由题意,知=×(2+3+4+5)=3.5,
=×(6.5+m+n+2.5)=2.25+∈(3.5,5.5).
由2.5
可得变量y与x呈现出负相关,故C项不符合题意;
把(,)代入选项A,得=-1.4×3.5+9.4=4.5,符合题意;
把(,)代入选项B,得=-2×3.5+14.2=7.2,不符合题意;
把(,)代入选项D,得=-1.6×3.5+10.6=5,符合题意.
故选AD.
答案:AD
12.在一次恶劣气候的飞行航程中,男女乘客在机上晕机的情况如下表所示.则下列说法正确的是 ( )
单位:人
性别
晕机与否
合计
晕机
不晕机
男
n11
15
n1+
女
6
n22
n2+
合计
n+1
28
46
A.>
B.χ2<2.706
C.有90%的把握认为,在恶劣气候飞行中,晕机与性别有关联
D.没有理由认为,在恶劣气候飞行中,晕机与否跟男女性别有关
解析:由列联表数据,
知得
所以==>=,即A正确;
单位:人
性别
晕机与否
合计
晕机
不晕机
男
12
15
27
女
6
13
19
合计
18
28
46
所以χ2=≈0.775< 2.706,即B正确;且没有理由认为,在恶劣气候飞行中,晕机与性别有关联,即D正确;故选ABD.
答案:ABD
三、填空题:本题共4小题,每小题5分,共20分.
13.已知变量x,y线性相关,样本相关系数r<0,则在以(,)为坐标原点的坐标系下的散点图中,大多数的点都落在第二、四象限.
解析:因为r<0,所以<0,所以大多数点落在第二、四象限.
14.在2×2列联表中,两个比值与相差越大,两个分类变量有关联的可能性越大.
解析:根据2×2列联表及χ2的表达式可知,比值与相差越大,则|ad-bc|就越大,那么两个分类变量有关联的可能性就越大.
15.某社区医疗服务部门为了考察该社区居民患高血压病是否与食盐的摄入量有关,对该社区的1 633人进行了跟踪调查,得出以下数据:
单位:人
食盐的摄入量
高血压
合计
患高血压
未患高血压
喜欢较咸食物
34
220
254
喜欢清淡食物
26
1 353
1 379
合计
60
1 573
1 633
计算χ2,得χ2≈80.155,我们在犯错误的概率不超过0.001时,认为该社区居民患高血压病与食盐的摄入量有关联.(本题第一空3分,第二空2分)
解析:零假设为
H0:患高血压病与食盐的摄入量没有关联.
则χ2=≈80.155>10.828=x0.001.
根据小概率值α=0.001的独立性检验,我们推断H0不成立,
即认为患高血压病与食盐的摄入量有关联,此推断犯错误的概率不超过0.001.
16.已知具有相关关系的两个随机变量的一组观测数据的散点图中的点分布在函数y=3的图象附近,则可通过转换得到的经验回归方程为u=1+ln 3+2x(其中u=ln y).
解析:由y=3e2x+1,得ln y=ln(3e2x+1),即ln y=ln 3+2x+1.令u=ln y,则经验回归方程为u=1+ln 3+2x.
四、解答题:本题共4小题,共70分.解答应写出文字说明、证明过程或演算步骤.
17.(15分)(2020·全国Ⅱ卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得xi=60,yi=1 200,(xi-)2=80,(yi-)2=9 000,
(xi-)(yi-)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的样本相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:样本相关系数r=,≈1.414.
解:(1)因为yi=1 200,
所以20个样区这种野生动物数量的平均数为
yi=1 200×=60,
所以该地区这种野生动物数量的估计值为60×200=12 000.
(2)因为(xi-)2=80,(yi-)2=9 000,(xi-)(yi-)=800,
所以r====≈0.94.
(3)更合理的抽样方法是分层随机抽样,根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.
理由如下:
由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得对该地区这种野生动物数量更准确的估计.
18.(15分)某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,得出以下2×2列联表.如果随机抽查该班的一名学生,那么抽到积极参加班级工作的学生的概率是.
(1)求a,b,c,d的值.
(2)试运用独立性检验的思想方法分析:依据小概率值α=0.001的独立性检验,能否认为学生的学习积极性与对待班级工作的态度有关联?并说明理由.
单位:人
学习积极性
班级工作
合计
积极参加
不太主动参加
高
18
7
25
一般
a
b
25
合计
c
d
50
解:(1)积极参加班级工作的学生有c人,总人数为50,
由抽到积极参加班级工作的学生的概率P==,解得c=24,所以a=6.所以b=25-a=25-6=19,d=50-c=50-24=26.
(2)零假设为
H0:学生的学习积极性与对待班级工作的态度无关.
由列联表知,χ2=≈11.538,
由11.538>10.828=x0.001,依据小概率值α=0.001 的独立性检验,推断H0不成立,认为学生的学习积极性与对待班级工作的态度有关联.
19.(20分)(2022·全国甲卷)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运营情况,随机调查了甲、乙两城之间的500个班次,得到下面的列联表.
(1)根据列联表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
公司
班次数
准点
未准点
A
240
20
B
210
30
解:(1)A公司一共调查了260辆车,其中有240辆准点,故A公司准点的概率为=;
B公司一共调查了240辆车,其中有210辆准点,故B公司准点的概率为=.
(2)由题设数据可知,准点班次数共450辆,未准点班次数共50辆,A公司共260辆,B公司共240辆,
所以χ2=≈3.2>2.706,
所以有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
20.(20分)某种疾病可分为Ⅰ,Ⅱ两种类型,为了解该疾病类型与性别的关系,在某地区随机抽取了患该疾病的病人进行调查,其中男性人数为z,女性人数为2z,男性患Ⅰ型病的人数占男性病人的,女性患
Ⅰ型病的人数占女性病人的.
(1)完成2×2列联表,若在犯错误的概率不大于0.005的前提下认为“所患疾病类型”与“性别”有关联,求男性患者至少有多少人?
(2)某药品研发公司欲安排甲乙两个研发团队来研发此疾病的治疗药物,两个团队各至多安排2个接种周期进行试验.每人每次接种花费m(m>0)元.甲团队研发的药物每次接种后产生抗体的概率为p,根据以往试验统计,甲团队平均花费为-2mp2+6m;乙团队研发的药物每次接种后产生抗体的概率为q,每个周期必须完成3次接种,若一个周期内至少出现2次抗体,则该周期结束后终止试验,否则进入第二个接种周期.假设两个研发团队每次接种后产生抗体与否均相互独立.若p=
2q,从两个团队试验的平均花费考虑,该公司应选择哪个团队进行药品研发?
性别
类型
合计
Ⅰ型病
Ⅱ型病
男
女
合计
解:(1)2×2列联表如下:
性别
类型
合计
Ⅰ型病
Ⅱ型病
男
z
女
2z
合计
3z
要使在犯错误的概率不大于0.005的前提下认为“所患疾病类型”与“性别”有关联,
则χ2==>7.879,
解得z>11.818 5,
因为∈Z,∈Z,所以z的最小整数值为12,
所以男性患者至少有12人.
(2)设甲研发团队试验总花费为X,
E(X)=-2mp2+6m,
设乙研发团队试验总花费为Y元,则Y的可能取值为3m,6m,
所以P(Y=3m)=q2(1-q)+q3=-2q3+3q2,
P(Y=6m)=1+2q3-3q2,
所以E(Y)=3m·(-2q3+3q2)+6m·(1+2q3-3q2)=6mq3-9mq2+6m,
因为p=2q,所以E(Y)-E(X)=6mq3-9mq2+6m+2mp2-6m=6mq3-
9mq2+2mp2=6mq3-mq2=mq2·(6q-1),
①当0
第八章质量评估
(时间:120分钟 分值:150分)
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一个选项是符合题目要求的.
1.下列现象的相关性最高的是 ( )
A.某商店的职工人数与商品销售额之间的样本相关系数为0.87
B.流通费用率与商业利润之间的样本相关系数为-0.94
C.商品销售额与商业利润之间的样本相关系数为0.51
D.商品销售额与流通费用率之间的样本相关系数为-0.81
解析:|r|越接近1,相关性越强.
答案:B
2.工人月工资y(单位:元)关于劳动生产率x(单位:千元)的经验回归方程为=90x+60,下列说法中正确的是 ( )
A.劳动生产率每提高1 000元,工人月工资提高150元左右
B.劳动生产率每提高1 000元,工人月工资提高90元左右
C.当劳动生产率为1 000元时,工人月工资提高90元
D.以上说法都不正确
解析:由经验回归方程得到的预测值并不一定是响应变量的精确值,而是响应变量可能取值的平均值,
因此当劳动生产率每提高1 000元时,工人月工资提高90元左右.
答案:B
3.如图,等高堆积条形图可以说明的问题是( )
A.“心脏搭桥”手术和“血管清障”手术对“又发心脏病”的影响是绝对不同的
B.“心脏搭桥”手术和“血管清障”手术对“又发心脏病”的影响没有什么不同
C.此等高堆积条形图看不出两种手术有什么不同的地方
D.“心脏搭桥”手术和“血管清障”手术对“又发心脏病”的影响在某种程度上是不同的,但是没有100%的把握
解析:由等高堆积条形图可知选项D正确.
答案:D
4.设两个变量x和y之间具有线性相关关系,它们的样本相关系数是r,y关于x的经验回归直线的斜率是b,纵轴上的截距是a,那么必有
( )
A.b与r的符号相同
B.a与r的符号相同
C.b与r的符号相反
D.a与r的符号相反
解析:当b>0时,两变量正相关,此时,r>0;当b<0时,两变量负相关,此时r<0,所以b与r的符号相同.
答案:A
5.若经验回归方程中的=0,则样本相关系数为 ( )
A.r=1 B.r=-1
C.r=0 D.无法确定
解析:当=0时,(xi-)(yi-)=0,
即xiyi-n=0,
所以r=0.
答案:C
6.通过随机询问相同人数不同性别的大学生在购买食物时是否看营养说明,得知有的男大学生“不看”,有的女大学生“不看”,若依据α=0.01的独立性检验,认为性别与看营养说明之间有关,则调查的总人数可能为 ( )
A.150B.170C.240D.175
解析:设男女大学生各有m人,根据题意列出2×2列联表如下:
性别
是否看营养说明
合计
看
不看
男
m
m
m
女
m
m
m
合计
m
m
2m
所以χ2==,
因为依据α=0.01的独立性检验,认为性别与看营养说明之间有关,
所以≥x0.01=6.635,解得2m≥179.145,
所以总人数2m可能为240.
答案:C
7.某工厂为预测某种产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取了8组观察值.计算知xi=52,yi=228,
=478,xiyi=1 849,则y关于x的经验回归方程是( )
A. =11.47+2.62x B. =-11.47+2.62x
C. =2.62+11.47x D. =11.47-2.62x
解析:由已知条件得=6.5,=28.5.
由=, =-,计算得≈2.62,≈11.47,
所以=11.47+2.62x.
答案:A
8.小波同学为了验证谚语“日落云里走,雨在半夜后”,观察了他所在地区的100天里日落和夜晚天气,得到2×2列联表.并计算得到χ2≈
19.05,下列小波对该地区天气判断不正确的是 ( )
单位:天
天气“日落云里走”
“雨在半夜后”
合计
下雨
未下雨
出现
25
5
30
未出现
25
45
70
合计
50
50
100
A.夜晚下雨的概率约为
B.未出现“日落云里走”夜晚下雨的概率约为
C.有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关联
D.出现“日落云里走”,有99.9%的把握认为夜晚会下雨
解析:由题意,把频率看作概率可得夜晚下雨的概率约为=,故A正确;
未出现“日落云里走”夜晚下雨的概率约为=,故B正确;
由χ2≈19.05>10.828,根据临界值表,可得有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关联,故C正确,D错误.
答案:D
二、选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.
9.下列说法正确的是 ( )
A.将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变
B.设有一个经验回归方程=3-5x,当变量x每增加1个单位时,y平均增加5个单位
C.经验回归直线=x+不可能过点(,)
D.在一个2×2列联表中,由计算得χ2=13.079,则推断“这两个变量间有关联”犯错误的概率不超过0.001
解析:将一组数据中的每个数据都加上或减去同一个常数后,每个数与平均数的差值不变,因而方差恒不变,故A项正确;根据经验回归方程=3-5x可知当x每增加1个单位时,y平均减少5个单位,故B项错误;经验回归直线必过点(,),故C项错误;因为χ2=13.079>10.828=
x0.001,所以根据小概率值α=0.001的独立性检验,推断“两个变量间有关联”犯错误的概率不超过0.001,故D项正确.
答案:AD
10.某城市收集并整理了该市去年1月份至10月份各月最低气温与最高气温(单位:℃)的数据,绘制的折线图如图所示.已知该城市各月的最低气温与最高气温具有较好的线性关系,则根据折线图,下列结论正确的是( )
A.最低气温与最高气温为正相关
B.10月的最高气温不低于5月的最高气温
C.月温差(最高气温减最低气温)的最大值出现在1月
D.最低气温低于0 ℃的月份有4个
解析:由图可知,最低气温与最高气温为正相关,故A项正确;10月的最高气温不低于5月的最高气温,故B项正确;月温差的最大值出现在1月,故C项正确;最低气温低于0 ℃的月份有3个,故D项错误.故选ABC.
答案:ABC
11.已知变量x和y的取值如表所示,且2.5
2
3
4
5
y
6.5
m
n
2.5
A. =-1.4x+9.4 B. =-2x+14.2
C. =1.5x+8.8 D. =-1.6x+10.6
解析:由题意,知=×(2+3+4+5)=3.5,
=×(6.5+m+n+2.5)=2.25+∈(3.5,5.5).
由2.5
把(,)代入选项A,得=-1.4×3.5+9.4=4.5,符合题意;
把(,)代入选项B,得=-2×3.5+14.2=7.2,不符合题意;
把(,)代入选项D,得=-1.6×3.5+10.6=5,符合题意.
故选AD.
答案:AD
12.在一次恶劣气候的飞行航程中,男女乘客在机上晕机的情况如下表所示.则下列说法正确的是 ( )
单位:人
性别
晕机与否
合计
晕机
不晕机
男
n11
15
n1+
女
6
n22
n2+
合计
n+1
28
46
A.>
B.χ2<2.706
C.有90%的把握认为,在恶劣气候飞行中,晕机与性别有关联
D.没有理由认为,在恶劣气候飞行中,晕机与否跟男女性别有关
解析:由列联表数据,
知得
所以==>=,即A正确;
单位:人
性别
晕机与否
合计
晕机
不晕机
男
12
15
27
女
6
13
19
合计
18
28
46
所以χ2=≈0.775< 2.706,即B正确;且没有理由认为,在恶劣气候飞行中,晕机与性别有关联,即D正确;故选ABD.
答案:ABD
三、填空题:本题共4小题,每小题5分,共20分.
13.已知变量x,y线性相关,样本相关系数r<0,则在以(,)为坐标原点的坐标系下的散点图中,大多数的点都落在第二、四象限.
解析:因为r<0,所以<0,所以大多数点落在第二、四象限.
14.在2×2列联表中,两个比值与相差越大,两个分类变量有关联的可能性越大.
解析:根据2×2列联表及χ2的表达式可知,比值与相差越大,则|ad-bc|就越大,那么两个分类变量有关联的可能性就越大.
15.某社区医疗服务部门为了考察该社区居民患高血压病是否与食盐的摄入量有关,对该社区的1 633人进行了跟踪调查,得出以下数据:
单位:人
食盐的摄入量
高血压
合计
患高血压
未患高血压
喜欢较咸食物
34
220
254
喜欢清淡食物
26
1 353
1 379
合计
60
1 573
1 633
计算χ2,得χ2≈80.155,我们在犯错误的概率不超过0.001时,认为该社区居民患高血压病与食盐的摄入量有关联.(本题第一空3分,第二空2分)
解析:零假设为
H0:患高血压病与食盐的摄入量没有关联.
则χ2=≈80.155>10.828=x0.001.
根据小概率值α=0.001的独立性检验,我们推断H0不成立,
即认为患高血压病与食盐的摄入量有关联,此推断犯错误的概率不超过0.001.
16.已知具有相关关系的两个随机变量的一组观测数据的散点图中的点分布在函数y=3的图象附近,则可通过转换得到的经验回归方程为u=1+ln 3+2x(其中u=ln y).
解析:由y=3e2x+1,得ln y=ln(3e2x+1),即ln y=ln 3+2x+1.令u=ln y,则经验回归方程为u=1+ln 3+2x.
四、解答题:本题共4小题,共70分.解答应写出文字说明、证明过程或演算步骤.
17.(15分)(2020·全国Ⅱ卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得xi=60,yi=1 200,(xi-)2=80,(yi-)2=9 000,
(xi-)(yi-)=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的样本相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:样本相关系数r=,≈1.414.
解:(1)因为yi=1 200,
所以20个样区这种野生动物数量的平均数为
yi=1 200×=60,
所以该地区这种野生动物数量的估计值为60×200=12 000.
(2)因为(xi-)2=80,(yi-)2=9 000,(xi-)(yi-)=800,
所以r====≈0.94.
(3)更合理的抽样方法是分层随机抽样,根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.
理由如下:
由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得对该地区这种野生动物数量更准确的估计.
18.(15分)某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,得出以下2×2列联表.如果随机抽查该班的一名学生,那么抽到积极参加班级工作的学生的概率是.
(1)求a,b,c,d的值.
(2)试运用独立性检验的思想方法分析:依据小概率值α=0.001的独立性检验,能否认为学生的学习积极性与对待班级工作的态度有关联?并说明理由.
单位:人
学习积极性
班级工作
合计
积极参加
不太主动参加
高
18
7
25
一般
a
b
25
合计
c
d
50
解:(1)积极参加班级工作的学生有c人,总人数为50,
由抽到积极参加班级工作的学生的概率P==,解得c=24,所以a=6.所以b=25-a=25-6=19,d=50-c=50-24=26.
(2)零假设为
H0:学生的学习积极性与对待班级工作的态度无关.
由列联表知,χ2=≈11.538,
由11.538>10.828=x0.001,依据小概率值α=0.001 的独立性检验,推断H0不成立,认为学生的学习积极性与对待班级工作的态度有关联.
19.(20分)(2022·全国甲卷)甲、乙两城之间的长途客车均由A和B两家公司运营.为了解这两家公司长途客车的运营情况,随机调查了甲、乙两城之间的500个班次,得到下面的列联表.
(1)根据列联表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
公司
班次数
准点
未准点
A
240
20
B
210
30
解:(1)A公司一共调查了260辆车,其中有240辆准点,故A公司准点的概率为=;
B公司一共调查了240辆车,其中有210辆准点,故B公司准点的概率为=.
(2)由题设数据可知,准点班次数共450辆,未准点班次数共50辆,A公司共260辆,B公司共240辆,
所以χ2=≈3.2>2.706,
所以有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
20.(20分)某种疾病可分为Ⅰ,Ⅱ两种类型,为了解该疾病类型与性别的关系,在某地区随机抽取了患该疾病的病人进行调查,其中男性人数为z,女性人数为2z,男性患Ⅰ型病的人数占男性病人的,女性患
Ⅰ型病的人数占女性病人的.
(1)完成2×2列联表,若在犯错误的概率不大于0.005的前提下认为“所患疾病类型”与“性别”有关联,求男性患者至少有多少人?
(2)某药品研发公司欲安排甲乙两个研发团队来研发此疾病的治疗药物,两个团队各至多安排2个接种周期进行试验.每人每次接种花费m(m>0)元.甲团队研发的药物每次接种后产生抗体的概率为p,根据以往试验统计,甲团队平均花费为-2mp2+6m;乙团队研发的药物每次接种后产生抗体的概率为q,每个周期必须完成3次接种,若一个周期内至少出现2次抗体,则该周期结束后终止试验,否则进入第二个接种周期.假设两个研发团队每次接种后产生抗体与否均相互独立.若p=
2q,从两个团队试验的平均花费考虑,该公司应选择哪个团队进行药品研发?
性别
类型
合计
Ⅰ型病
Ⅱ型病
男
女
合计
解:(1)2×2列联表如下:
性别
类型
合计
Ⅰ型病
Ⅱ型病
男
z
女
2z
合计
3z
要使在犯错误的概率不大于0.005的前提下认为“所患疾病类型”与“性别”有关联,
则χ2==>7.879,
解得z>11.818 5,
因为∈Z,∈Z,所以z的最小整数值为12,
所以男性患者至少有12人.
(2)设甲研发团队试验总花费为X,
E(X)=-2mp2+6m,
设乙研发团队试验总花费为Y元,则Y的可能取值为3m,6m,
所以P(Y=3m)=q2(1-q)+q3=-2q3+3q2,
P(Y=6m)=1+2q3-3q2,
所以E(Y)=3m·(-2q3+3q2)+6m·(1+2q3-3q2)=6mq3-9mq2+6m,
因为p=2q,所以E(Y)-E(X)=6mq3-9mq2+6m+2mp2-6m=6mq3-
9mq2+2mp2=6mq3-mq2=mq2·(6q-1),
①当0
0,
所以mq2(6q-1)<0,所以E(X)>E(Y),
乙团队试验的平均花费较少,所以选择乙团队进行研发;
②当0,因为m>0,
所以mq2(6q-1)>0,所以E(X)甲团队试验的平均花费较少,所以选择甲团队进行研发;
③当q=时,mq2(6q-1)=0,所以E(X)=E(Y),甲团队试验的平均花费和乙团队试验的平均花费相同,从两个团队试验的平均花费考虑,该公司选择甲团队或乙团队进行研发均可.
相关资料
更多