![第七章达标检测-2022版数学选择性必修第一册 北师大版(2019) 同步练习 (Word含解析)01](http://img-preview.51jiaoxi.com/3/3/12638796/0/0.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![第七章达标检测-2022版数学选择性必修第一册 北师大版(2019) 同步练习 (Word含解析)02](http://img-preview.51jiaoxi.com/3/3/12638796/0/1.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![第七章达标检测-2022版数学选择性必修第一册 北师大版(2019) 同步练习 (Word含解析)03](http://img-preview.51jiaoxi.com/3/3/12638796/0/2.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
还剩24页未读,
继续阅读
成套系列资料,整套一键下载
- 2 成对数据的线性相关性-2022版数学选择性必修第一册 北师大版(2019) 同步练习 (Word含解析) 试卷 1 次下载
- 3 独立性检验问题-2022版数学选择性必修第一册 北师大版(2019) 同步练习 (Word含解析) 试卷 1 次下载
- 专题强化练15 独立性检验与统计、概率的综合应用-2022版数学选择性必修第一册 北师大版(2019) 同步练习 (Word含解析) 试卷 1 次下载
- 第七章复习提升-2022版数学选择性必修第一册 北师大版(2019) 同步练习 (Word含解析) 试卷 1 次下载
- 全书综合测评-2022版数学选择性必修第一册 北师大版(2019) 同步练习 (Word含解析) 试卷 2 次下载
第七章达标检测-2022版数学选择性必修第一册 北师大版(2019) 同步练习 (Word含解析)
展开
这是一份第七章达标检测-2022版数学选择性必修第一册 北师大版(2019) 同步练习 (Word含解析),共27页。
本章达标检测
(满分:150分;时间:120分钟)
一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是 ( )
A.y^=-10x+200 B.y^=10x+200
C.y^=-10x-200 D.y^=10x-200
2.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-13x+2上,则这组样本数据的相关系数为 ( )
A.-1 B.0 C.-13 D.1
3.已知四个命题:
①在回归分析中,可以借助散点图判断两个变量是否具有线性相关关系;
②在独立性检验中,随机变量χ2的值越大,说明两个分类变量有关系的可能性越大;
③在回归方程y^=0.2x+12中,当变量x每增加1个单位时,变量y^平均增加1个单位;
④两个随机变量的相关性越弱,相关系数的绝对值越接近1.
其中真命题的序号是 ( )
A.①④ B.②④ C.①② D.②③
4.利用独立性检验的方法调查高中生性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用2×2列联表,经计算可得χ2≈7.245,则下列结论正确的是 ( )
A.有99%以上的把握认为“爱好该项运动与性别无关”
B.有99%以上的把握认为“爱好该项运动与性别有关”
C.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别无关”
5.在一次独立性检验中得到如下列联表:
A1
A2
总计
B1
200
800
1000
B2
180
a
180+a
总计
380
800+a
1180+a
若这两个分类变量A和B没有关系,则a的可能值是 ( )
A.200 B.720 C.100 D.180
6.某市政府在调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3000人,计算发现χ2=6.023,根据这一数据,该市政府断言“市民收入增减与旅游愿望有关系”,这一断言犯错误的概率不超过 ( )
A.0.005 B.0.01
C.0.05 D.0.1
7.变量x,y的散点图如图所示,现对这两个变量进行回归分析,方案一:根据图中所有数据,得到线性回归方程y^=b^1x+a^1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归方程y^=b^2x+a^2,相关系数为r2.则 ( )
A.0
B.0
C.-1
D.-1
8.某调查者在调查中获知某公司近年来科研费用支出x(万元)与公司所获得利润y(万元)的统计资料如下表:
序号
科研费用支出xi
利润yi
xiyi
xi2
1
5
31
155
25
2
11
40
440
121
3
4
30
120
16
4
5
34
170
25
5
3
25
75
9
6
2
20
40
4
总计
30
180
1000
200
则利润y关于科研费用支出x的线性回归方程为 ( )
参考公式:b^=∑i=1nxiyi-nxy∑i=1nxi2-nx 2,a^=y-b^x.
A.y^=2x+20
B.y^=2x-20
C.y^=20x+2
D.y^=20x-2
二、多项选择题(本大题共4小题,每小题5分,共20分.在每小题给出的选项中,有多个选项符合题目要求,全部选对的得5分,部分选对的得3分,有选错的得0分)
9.某课外兴趣小组通过随机调查,利用2×2列联表和χ2统计量研究数学成绩优秀是否与性别有关.计算得χ2=6.748,则下列判断正确的是 ( )
A.每100个数学成绩优秀的人当中就会有1名是女生
B.若某人数学成绩优秀,那么他为男生的概率是0.010
C.有99%的把握认为“数学成绩优秀与性别有关”
D.在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关”
10.为了对变量x与y的线性相关性进行检验,由样本点(x1,y1),(x2,y2),…,(x10,y10)求得两个变量的样本相关系数为r,那么下列说法中错误的有 ( )
A.若所有样本点都在直线y=-2x+1上,则r=1
B.若所有样本点都在直线y=-2x+1上,则r=-2
C.若|r|越大,则变量x与y的线性相关性越强
D.若|r|越小,则变量x与y的线性相关性越强
11.在独立性检验中,为了调查变量X与变量Y的关系,经过计算得到χ2≥6.635,其表示的意义是 ( )
A.有99%的把握认为变量X与变量Y没有关系
B.有1%的把握认为变量X与变量Y有关系
C.有99%的把握认为变量X与变量Y有关系
D.有1%的把握认为变量X与变量Y没有关系
12.某校团委对“学生性别和喜欢运动是否有关”进行了一次调查,其中被调查的男、女生人数相同,男生喜欢运动的人数占男生人数的45,女生喜欢运动的人数占女生人数的35,若有95%的把握认为“是否喜欢运动和性别有关”,则被调查人中男生可能有 ( )
A.25人 B.45人
C.60人 D.75人
三、填空题(本大题共4小题,每小题5分,共20分.将答案填在题中横线上)
13.某次国际会议为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在如下2×2列联表中,a+d= .
是否会外语
性别
会外语
不会外语
总计
男
a
b
20
女
6
d
总计
18
50
14.某手机运营商为了拓展业务,现对该手机使用潜在客户进行调查,随机抽取国内国外潜在用户代表各100名,调查用户对是否使用该手机的态度,得到如图所示的等高条形图.根据等高条形图, (填“有”或“没有”)99%以上的把握认为持乐观态度和国内外差异有关.
15.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下对照表,由表中数据得线性回归方程y^=b^x+a^,其中b^=-2.现预测当气温为-4℃时,用电量的度数为 .
气温x(℃)
18
13
10
-1
用电量y(度)
24
34
38
64
16.在生态环境部公布的2016年74个城市PM2.5月均浓度排名情况中,某14座城市在74城的排名情况如图所示,甲、乙、丙为某三座城市.
图1
图2
从排名情况看,
在甲、乙两城市中,2月份名次比1月份名次靠前的城市是 ;在第1季度的三个月中,丙城市的名次最靠前的月份是 .
四、解答题(本大题共6小题,共70分.解答应写出必要的文字说明、证明过程或演算步骤)
17.(本小题满分10分)某数学小组从气象局和医院获得今年1月份至6月份每月20日的昼夜温差x℃和患感冒人数y的数据,画出了折线图.
(1)由折线图看出,可用线性回归模型拟合y与x的关系,请用相关系数加以说明;
(2)建立y关于x的回归方程(精确到0.01),预测昼夜温差为4℃时患感冒的人数(精确到整数).
参考数据:∑i=16xi=54.9,∑i=16(xi-x)(yi-y)=94,∑i=16(xi-x)2=6,7≈2.646.
参考公式:相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2,
b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2,a^=y-b^x.
18.(本小题满分12分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:
x
3
4
5
6
y
2.5
3.5
4
5
(1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^;
(2)已知该厂技术改造前生产100吨甲产品相应的生产能耗为90吨标准煤.试根据(1)求出的线性回归方程,预测生产100吨甲产品相应的生产能耗比技术改造前降低多少吨标准煤.
附:线性回归方程y^=b^x+a^中
b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2=∑i=1nxiyi-nx y∑i=1nxi2-nx 2,a^=y-b^x.
19.(本小题满分12分)截至2020年5月15日,新冠肺炎全球确诊数已经超过440万,新冠肺炎是一个传染性很强的疾病,其病毒在潜伏期以内就具备了传染性.湖北省某医疗研究机构收集了1000名患者的病毒潜伏期的信息,数据统计如下表所示:
潜伏期
(天)
0~
2
2~
4
4~
6
6~
8
8~
10
10~
12
12~
14
人数
40
160
300
360
60
60
20
(1)求这1000名患者潜伏期的平均数x(同一组中的数据用该组区间的中点值作代表);
(2)潜伏期不高于平均数的患者,称为“短潜伏者”;潜伏期等于或高于平均数的患者,称为“长潜伏者”.为研究潜伏期与患者年龄的关系,以潜伏期是否高于平均数为标准分为两类进行分层抽样,从上述1000名患者中抽取300人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有99%的把握认为潜伏期长短与患者年龄有关.
短潜伏者
长潜伏者
总计
60岁及以上
100
60岁以下
140
总计
300
20.(本小题满分12分)2019年中央电视台在周日晚上推出的一档新的综艺节目中,为了解节目效果,一次节目结束后,随机抽取了500名观众(含200名女性)的评分(百分制)进行分析,分别得到如图所示的两个频率分布直方图.
(1)计算女性观众评分的中位数与男性观众评分的平均分;
(2)若把评分低于70分定为“不满意”,评分不低于70分定为“满意”.
(i)试比较男性观众与女性观众不满意的概率大小,并说明理由;
(ii)完成下列2×2列联表,并回答是否有95%的把握认为对该综艺节目是否满意和性别有关.
女性观众
男性观众
总计
满意
不满意
总计
21.(本小题满分12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层随机抽样的方法从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到的频率分布直方图分别如图1,图2.
图1
图2
(1)从样本中日平均生产件数不足60的工人中随机抽取2人,求至少抽到一名25周岁以下组工人的概率;
(2)规定日平均生产件数不少于80者为生产能手,请你根据已知条件列出2×2列联表,分析生产能手与工人所在的年龄组是否有关.
22.(本小题满分12分)某地区在一次考试后,从全体考生中随机抽取44名,获取他们本次考试的数学成绩x(单位:分)和物理成绩y(单位:分),绘制成如下散点图:
根据散点图可以看出y与x之间具有线性相关关系,但图中有两个异常点A,B.经调查得知,A考生由于感冒导致物理考试发挥失常,B考生因故未能参加物理考试.为了使分析结果更科学准确,剔除这两组数据后,对剩下的数据进行处理,得到一些统计量的值:
∑i=142xi=4641,∑i=142yi=3108,∑i=142xiyi=350350,∑i=142(xi-x)2=13814.5,∑i=142(yi-y)2=5250,
其中xi,yi分别表示这42名同学的数学成绩、物理成绩,i=1,2,…,42.y与x的相关系数r≈0.81.
(1)若不剔除A,B两名考生的数据,用44组数据作回归分析,设此时y与x的相关系数为r0,试判断r0与r的大小关系,并说明理由;
(2)求y关于x的线性回归方程(精确到0.01),如果B考生参加了这次物理考试(已知B考生的数学成绩为125分),估计其物理成绩是多少(精确到个位);
(3)从概率统计规律看,本次考试该地区的物理成绩X服从正态分布N(μ,σ2).以剔除后的物理成绩作为样本,用样本平均数y作为μ的估计值,用样本方差s2作为σ2的估计值.试求该地区5000名考生中,物理成绩位于区间(62.8,85.2]的人数Z的数学期望.(精确到个位)
附:①线性回归方程y^=b^x+a^中,b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2,a^=y-b^x.
②若X~N(μ,σ2),则P(μ-σ
③125≈11.2.
答案全解全析
一、单项选择题
1.A 因为商品销售量y(件)与销售价格x(元/件)负相关,所以排除B,D选项,将x=0代入y^=-10x-200可得y^=-200<0,不符合实际,所以排除C选项.故选A.
2.A 因为回归直线方程是y=-13x+2,所以这两个变量是负相关,故这组样本数据的相关系数为负值,又所有样本点(xi,yi)(i=1,2,…,n)都在直线上,所以|r|=1,所以相关系数r=-1.故选A.
3.C 对于①,可以借助散点图直观判断两个变量是否具有线性相关关系,正确;对于②,在独立性检验中,随机变量χ2的值越大,说明两个分类变量有关系的可能性越大,正确;对于③,在回归方程y^=0.2x+12中,当变量x每增加1个单位时,变量y^平均增加0.2个单位,错误;对于④,两个随机变量的相关性越强,相关系数的绝对值越接近1,错误.故选C.
4.B 由χ2≈7.245>6.635,可得有99%以上的把握认为“爱好该项运动与性别有关”.故选B.
5.B 当A和B没有关系时,χ2≤2.706,把各选项依次代入可知当a=720时,χ2=(1180+720)×(200×720-800×180)2380×(800+720)×(180+720)×1000=0,故选B.
6.C ∵χ2=6.023>3.841,∴“市民收入增减与旅游愿望有关系”这一断言犯错误的概率不超过0.05,故选C.
7.D 由题中散点图得y与x负相关,所以r1<0,r2<0,因为剔除点(10,21)后,剩下点数据更具有线性相关性,|r2|更接近1,所以-1
8.A 设线性回归方程为y^=b^x+a^.
由题表中数据得,b^=1000-6×5×30200-6×52=2,
∴a^=30-2×5=20,
∴线性回归方程为y^=2x+20.
二、多项选择题
9.CD 因为χ2=6.748>6.635,所以有99%的把握认为“数学成绩优秀与性别有关”,即在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关”.故选CD.
10.ABD 若所有样本点都在直线y=-2x+1上,且直线斜率为负数,则r=-1,A、B选项中说法均错误;若|r|越大,则变量x与y的线性相关性越强,C选项中说法正确,D选项中说法错误.故选ABD.
11.CD 在独立性检验中,χ2≥6.635表示的意义是有1%的把握认为变量X与变量Y没有关系,D正确;
有99%的把握认为变量X与变量Y有关系,C正确.故选CD.
12.BCD 设被调查人中男生有x人,依题意可得列联表如下:
是否喜欢
运动
性别
喜欢运动
不喜欢运动
总计
男生
45x
15x
x
女生
35x
25x
x
总计
75x
35x
2x
若有95%的把握认为“是否喜欢运动和性别有关”,则χ2=2x21≥3.841,
解得x≥40.3305,
由题意知x>0,且x是5的整数倍,所以结合选项知45、60和75满足题意.
故选BCD.
三、填空题
13.答案 36
解析 由题意有a+6=18,a+b=20,a+b+d+6=50,
解得a=12,b=8,d=24,
所以a+d=12+24=36.
14.答案 有
解析 依题意,可得出如下2×2列联表:
国内代表
国外代表
总计
不乐观
40
60
100
乐观
60
40
100
总计
100
100
200
χ2=200×(402-602)21004=8>6.635,
所以有99%以上的把握认为持乐观态度和国内外差异有关.
15.答案 68
解析 由题表中数据可得x=14×(18+13+10-1)=10,
y=14×(24+34+38+64)=40,
所以线性回归直线过点(10,40),故a^=60.
所以当x=-4时,y^=-2×(-4)+60=68.
16.答案 乙;二月份
解析 由题图1可知城市乙2月份名次比1月份名次靠前,答案应填乙;结合题图1、图2可以看出丙城市的名次最靠前的是二月份,答案应填二月份.
四、解答题
17.解析 (1)由题意得y=16×(8+11+14+20+23+26)=17,∴∑i=16(yi-y)2=(8-17)2+(11-17)2+(14-17)2+(20-17)2+(23-17)2+(26-17)2=252,
∴r=∑i=16(xi-x)(yi-y)∑i=16(xi-x)2∑i=16(yi-y)2=946×67≈9436×2.646≈0.99>0.75.
∴可用线性回归模型拟合y与x的关系. (5分)
(2)x=16×∑i=16xi=54.96=9.15,b^=∑i=16(xi-x)(yi-y)∑i=16(xi-x)2=9436≈2.61,a^≈17-2.61×9.15≈-6.88,∴回归方程为y^=2.61x-6.88,当x=4时,y^=2.61×4-6.88≈4.∴昼夜温差为4℃时患感冒的人数约为4.(10分)
18.解析 (1)由题表中的数据得x=4.5,y=3.75,
(3分)
b^=7.5+14+20+30-4×4.5×3.759+16+25+36-4×4.52=45=0.8,
a^=3.75-0.8×4.5=0.15, (5分)
所以y关于x的线性回归方程为y^=0.8x+0.15. (7分)
(2)当x=100时,y^=0.8×100+0.15=80.15,90-80.15=9.85, (10分)
所以技术改造后预测生产100吨甲产品相应的生产能耗比技术改造前降低9.85吨标准煤. (12分)
19.解析 (1)x=1×401000+3×1601000+5×3001000+7×3601000+9×601000+11×601000+13×201000
=40+480+1500+2520+540+660+2601000
=60001000=6. (4分)
(2)抽取的短潜伏者的总人数为300×40+160+3001000=150,长潜伏者的总人数为300-150=150. (7分)
补充完整的列联表如下:
短潜伏者
长潜伏者
总计
60岁及以上
100
60
160
60岁以下
50
90
140
总计
150
150
300
χ2=300×(100×90-50×60)2150×150×140×160=1507≈21.429.(10分)
因为21.429>6.635,所以有99%的把握认为潜伏期长短与患者年龄有关. (12分)
20.解析 (1)根据题意,设女性观众评分的中位数为x,
则10×0.01+10×0.02+(x-70)×0.04=0.5,
∴x=75. (2分)
男性观众评分的平均数为55×0.15+65×0.25+75×0.3+85×0.2+95×0.1=73.5. (4分)
(2)(i)男性观众不满意的概率大,
记CA表示事件:女性观众不满意,CB表示事件:男性观众不满意,
由频率估计概率,得P(CA)=(0.01+0.02)×10=0.3, (6分)
P(CB)=(0.015+0.025)×10=0.4,
所以男性观众不满意的概率大. (8分)
(ii)完成列联表如下:
女性观众
男性观众
总计
满意
140
180
320
不满意
60
120
180
总计
200
300
500
所以χ2=500×(140×120-180×60)2200×300×320×180≈5.208,(10分)
因为5.208>3.841,所以有95%的把握认为对该综艺节目是否满意和性别有关. (12分)
21.解析 (1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.
所以样本中日平均生产件数不足60的工人中,25周岁以上组工人有60×0.05=3人,记为A1,A2,A3;25周岁以下组工人有40×0.05=2人,记为B1,B2.
从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2). (3分)
其中,至少有1名25周岁以下组工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2),故所求概率P=710. (5分)
(2)由题中频率分布直方图可知,在抽取的100名工人中,25周岁以上组中的生产能手有60×0.25=15(人),25周岁以下组中的生产能手有40×0.375=15(人),
据此可得2×2列联表如下:
生产能手
非生产能手
总计
25周岁以上组
15
45
60
25周岁以下组
15
25
40
总计
30
70
100
(8分)
计算可得χ2=100×(15×25-45×15)260×40×30×70≈1.79. (10分)
因为1.79<2.706,所以认为生产能手与工人所在的年龄组无关. (12分)
22.解析 (1)r0
理由如下:由题图可知,y与x呈现正相关,
①异常点A,B会降低变量之间的线性相关程度.
②44个数据点与其回归直线的总偏差更大,回归效果更差,所以相关系数更小.
③42个数据点与其回归直线的总偏差更小,回归效果更好,所以相关系数更大.
④42个数据点更贴近其回归直线.
⑤44个数据点与其回归直线更离散. (4分)
(以上理由写出任一个或其他言之有理,均可得分)
(2)设y关于x的线性回归方程为y^=b^x+a^.由题中数据可得x=142∑i=142xi=110.5,
y=142∑i=142yi=74,
所以∑i=142(xi-x)(yi-y)=∑i=142xiyi-42xy=350350-42×110.5×74=6916.
又因为∑i=142(xi-x)2=13814.5, (6分)
所以b^=∑i=142(xi-x)(yi-y)∑i=142(xi-x)2≈0.50,
a^=y-b^x≈74-0.50×110.5=18.75,
所以y^=0.50x+18.75.
将x=125代入,得y^=0.50×125+18.75=62.5+18.75≈81,
所以估计B考生的物理成绩为81分. (8分)
(3)y=142∑i=142yi=74,s2=142∑i=142(yi-y)2=142×5250=125,所以X~N(74,125), (10分)
又因为125≈11.2,
所以P(62.8
所以Z~B(5000,0.6827),
所以EZ=5000×0.6827≈3414,
即该地区本次考试物理成绩位于区间(62.8,85.2]的人数Z的数学期望约为3414.(12分)
本章达标检测
(满分:150分;时间:120分钟)
一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是 ( )
A.y^=-10x+200 B.y^=10x+200
C.y^=-10x-200 D.y^=10x-200
2.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-13x+2上,则这组样本数据的相关系数为 ( )
A.-1 B.0 C.-13 D.1
3.已知四个命题:
①在回归分析中,可以借助散点图判断两个变量是否具有线性相关关系;
②在独立性检验中,随机变量χ2的值越大,说明两个分类变量有关系的可能性越大;
③在回归方程y^=0.2x+12中,当变量x每增加1个单位时,变量y^平均增加1个单位;
④两个随机变量的相关性越弱,相关系数的绝对值越接近1.
其中真命题的序号是 ( )
A.①④ B.②④ C.①② D.②③
4.利用独立性检验的方法调查高中生性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用2×2列联表,经计算可得χ2≈7.245,则下列结论正确的是 ( )
A.有99%以上的把握认为“爱好该项运动与性别无关”
B.有99%以上的把握认为“爱好该项运动与性别有关”
C.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别无关”
5.在一次独立性检验中得到如下列联表:
A1
A2
总计
B1
200
800
1000
B2
180
a
180+a
总计
380
800+a
1180+a
若这两个分类变量A和B没有关系,则a的可能值是 ( )
A.200 B.720 C.100 D.180
6.某市政府在调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了3000人,计算发现χ2=6.023,根据这一数据,该市政府断言“市民收入增减与旅游愿望有关系”,这一断言犯错误的概率不超过 ( )
A.0.005 B.0.01
C.0.05 D.0.1
7.变量x,y的散点图如图所示,现对这两个变量进行回归分析,方案一:根据图中所有数据,得到线性回归方程y^=b^1x+a^1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归方程y^=b^2x+a^2,相关系数为r2.则 ( )
A.0
序号
科研费用支出xi
利润yi
xiyi
xi2
1
5
31
155
25
2
11
40
440
121
3
4
30
120
16
4
5
34
170
25
5
3
25
75
9
6
2
20
40
4
总计
30
180
1000
200
则利润y关于科研费用支出x的线性回归方程为 ( )
参考公式:b^=∑i=1nxiyi-nxy∑i=1nxi2-nx 2,a^=y-b^x.
A.y^=2x+20
B.y^=2x-20
C.y^=20x+2
D.y^=20x-2
二、多项选择题(本大题共4小题,每小题5分,共20分.在每小题给出的选项中,有多个选项符合题目要求,全部选对的得5分,部分选对的得3分,有选错的得0分)
9.某课外兴趣小组通过随机调查,利用2×2列联表和χ2统计量研究数学成绩优秀是否与性别有关.计算得χ2=6.748,则下列判断正确的是 ( )
A.每100个数学成绩优秀的人当中就会有1名是女生
B.若某人数学成绩优秀,那么他为男生的概率是0.010
C.有99%的把握认为“数学成绩优秀与性别有关”
D.在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关”
10.为了对变量x与y的线性相关性进行检验,由样本点(x1,y1),(x2,y2),…,(x10,y10)求得两个变量的样本相关系数为r,那么下列说法中错误的有 ( )
A.若所有样本点都在直线y=-2x+1上,则r=1
B.若所有样本点都在直线y=-2x+1上,则r=-2
C.若|r|越大,则变量x与y的线性相关性越强
D.若|r|越小,则变量x与y的线性相关性越强
11.在独立性检验中,为了调查变量X与变量Y的关系,经过计算得到χ2≥6.635,其表示的意义是 ( )
A.有99%的把握认为变量X与变量Y没有关系
B.有1%的把握认为变量X与变量Y有关系
C.有99%的把握认为变量X与变量Y有关系
D.有1%的把握认为变量X与变量Y没有关系
12.某校团委对“学生性别和喜欢运动是否有关”进行了一次调查,其中被调查的男、女生人数相同,男生喜欢运动的人数占男生人数的45,女生喜欢运动的人数占女生人数的35,若有95%的把握认为“是否喜欢运动和性别有关”,则被调查人中男生可能有 ( )
A.25人 B.45人
C.60人 D.75人
三、填空题(本大题共4小题,每小题5分,共20分.将答案填在题中横线上)
13.某次国际会议为了搞好对外宣传工作,会务组选聘了50名记者担任对外翻译工作,在如下2×2列联表中,a+d= .
是否会外语
性别
会外语
不会外语
总计
男
a
b
20
女
6
d
总计
18
50
14.某手机运营商为了拓展业务,现对该手机使用潜在客户进行调查,随机抽取国内国外潜在用户代表各100名,调查用户对是否使用该手机的态度,得到如图所示的等高条形图.根据等高条形图, (填“有”或“没有”)99%以上的把握认为持乐观态度和国内外差异有关.
15.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下对照表,由表中数据得线性回归方程y^=b^x+a^,其中b^=-2.现预测当气温为-4℃时,用电量的度数为 .
气温x(℃)
18
13
10
-1
用电量y(度)
24
34
38
64
16.在生态环境部公布的2016年74个城市PM2.5月均浓度排名情况中,某14座城市在74城的排名情况如图所示,甲、乙、丙为某三座城市.
图1
图2
从排名情况看,
在甲、乙两城市中,2月份名次比1月份名次靠前的城市是 ;在第1季度的三个月中,丙城市的名次最靠前的月份是 .
四、解答题(本大题共6小题,共70分.解答应写出必要的文字说明、证明过程或演算步骤)
17.(本小题满分10分)某数学小组从气象局和医院获得今年1月份至6月份每月20日的昼夜温差x℃和患感冒人数y的数据,画出了折线图.
(1)由折线图看出,可用线性回归模型拟合y与x的关系,请用相关系数加以说明;
(2)建立y关于x的回归方程(精确到0.01),预测昼夜温差为4℃时患感冒的人数(精确到整数).
参考数据:∑i=16xi=54.9,∑i=16(xi-x)(yi-y)=94,∑i=16(xi-x)2=6,7≈2.646.
参考公式:相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2,
b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2,a^=y-b^x.
18.(本小题满分12分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:
x
3
4
5
6
y
2.5
3.5
4
5
(1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y^=b^x+a^;
(2)已知该厂技术改造前生产100吨甲产品相应的生产能耗为90吨标准煤.试根据(1)求出的线性回归方程,预测生产100吨甲产品相应的生产能耗比技术改造前降低多少吨标准煤.
附:线性回归方程y^=b^x+a^中
b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2=∑i=1nxiyi-nx y∑i=1nxi2-nx 2,a^=y-b^x.
19.(本小题满分12分)截至2020年5月15日,新冠肺炎全球确诊数已经超过440万,新冠肺炎是一个传染性很强的疾病,其病毒在潜伏期以内就具备了传染性.湖北省某医疗研究机构收集了1000名患者的病毒潜伏期的信息,数据统计如下表所示:
潜伏期
(天)
0~
2
2~
4
4~
6
6~
8
8~
10
10~
12
12~
14
人数
40
160
300
360
60
60
20
(1)求这1000名患者潜伏期的平均数x(同一组中的数据用该组区间的中点值作代表);
(2)潜伏期不高于平均数的患者,称为“短潜伏者”;潜伏期等于或高于平均数的患者,称为“长潜伏者”.为研究潜伏期与患者年龄的关系,以潜伏期是否高于平均数为标准分为两类进行分层抽样,从上述1000名患者中抽取300人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有99%的把握认为潜伏期长短与患者年龄有关.
短潜伏者
长潜伏者
总计
60岁及以上
100
60岁以下
140
总计
300
20.(本小题满分12分)2019年中央电视台在周日晚上推出的一档新的综艺节目中,为了解节目效果,一次节目结束后,随机抽取了500名观众(含200名女性)的评分(百分制)进行分析,分别得到如图所示的两个频率分布直方图.
(1)计算女性观众评分的中位数与男性观众评分的平均分;
(2)若把评分低于70分定为“不满意”,评分不低于70分定为“满意”.
(i)试比较男性观众与女性观众不满意的概率大小,并说明理由;
(ii)完成下列2×2列联表,并回答是否有95%的把握认为对该综艺节目是否满意和性别有关.
女性观众
男性观众
总计
满意
不满意
总计
21.(本小题满分12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层随机抽样的方法从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到的频率分布直方图分别如图1,图2.
图1
图2
(1)从样本中日平均生产件数不足60的工人中随机抽取2人,求至少抽到一名25周岁以下组工人的概率;
(2)规定日平均生产件数不少于80者为生产能手,请你根据已知条件列出2×2列联表,分析生产能手与工人所在的年龄组是否有关.
22.(本小题满分12分)某地区在一次考试后,从全体考生中随机抽取44名,获取他们本次考试的数学成绩x(单位:分)和物理成绩y(单位:分),绘制成如下散点图:
根据散点图可以看出y与x之间具有线性相关关系,但图中有两个异常点A,B.经调查得知,A考生由于感冒导致物理考试发挥失常,B考生因故未能参加物理考试.为了使分析结果更科学准确,剔除这两组数据后,对剩下的数据进行处理,得到一些统计量的值:
∑i=142xi=4641,∑i=142yi=3108,∑i=142xiyi=350350,∑i=142(xi-x)2=13814.5,∑i=142(yi-y)2=5250,
其中xi,yi分别表示这42名同学的数学成绩、物理成绩,i=1,2,…,42.y与x的相关系数r≈0.81.
(1)若不剔除A,B两名考生的数据,用44组数据作回归分析,设此时y与x的相关系数为r0,试判断r0与r的大小关系,并说明理由;
(2)求y关于x的线性回归方程(精确到0.01),如果B考生参加了这次物理考试(已知B考生的数学成绩为125分),估计其物理成绩是多少(精确到个位);
(3)从概率统计规律看,本次考试该地区的物理成绩X服从正态分布N(μ,σ2).以剔除后的物理成绩作为样本,用样本平均数y作为μ的估计值,用样本方差s2作为σ2的估计值.试求该地区5000名考生中,物理成绩位于区间(62.8,85.2]的人数Z的数学期望.(精确到个位)
附:①线性回归方程y^=b^x+a^中,b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2,a^=y-b^x.
②若X~N(μ,σ2),则P(μ-σ
答案全解全析
一、单项选择题
1.A 因为商品销售量y(件)与销售价格x(元/件)负相关,所以排除B,D选项,将x=0代入y^=-10x-200可得y^=-200<0,不符合实际,所以排除C选项.故选A.
2.A 因为回归直线方程是y=-13x+2,所以这两个变量是负相关,故这组样本数据的相关系数为负值,又所有样本点(xi,yi)(i=1,2,…,n)都在直线上,所以|r|=1,所以相关系数r=-1.故选A.
3.C 对于①,可以借助散点图直观判断两个变量是否具有线性相关关系,正确;对于②,在独立性检验中,随机变量χ2的值越大,说明两个分类变量有关系的可能性越大,正确;对于③,在回归方程y^=0.2x+12中,当变量x每增加1个单位时,变量y^平均增加0.2个单位,错误;对于④,两个随机变量的相关性越强,相关系数的绝对值越接近1,错误.故选C.
4.B 由χ2≈7.245>6.635,可得有99%以上的把握认为“爱好该项运动与性别有关”.故选B.
5.B 当A和B没有关系时,χ2≤2.706,把各选项依次代入可知当a=720时,χ2=(1180+720)×(200×720-800×180)2380×(800+720)×(180+720)×1000=0,故选B.
6.C ∵χ2=6.023>3.841,∴“市民收入增减与旅游愿望有关系”这一断言犯错误的概率不超过0.05,故选C.
7.D 由题中散点图得y与x负相关,所以r1<0,r2<0,因为剔除点(10,21)后,剩下点数据更具有线性相关性,|r2|更接近1,所以-1
由题表中数据得,b^=1000-6×5×30200-6×52=2,
∴a^=30-2×5=20,
∴线性回归方程为y^=2x+20.
二、多项选择题
9.CD 因为χ2=6.748>6.635,所以有99%的把握认为“数学成绩优秀与性别有关”,即在犯错误的概率不超过1%的前提下认为“数学成绩优秀与性别有关”.故选CD.
10.ABD 若所有样本点都在直线y=-2x+1上,且直线斜率为负数,则r=-1,A、B选项中说法均错误;若|r|越大,则变量x与y的线性相关性越强,C选项中说法正确,D选项中说法错误.故选ABD.
11.CD 在独立性检验中,χ2≥6.635表示的意义是有1%的把握认为变量X与变量Y没有关系,D正确;
有99%的把握认为变量X与变量Y有关系,C正确.故选CD.
12.BCD 设被调查人中男生有x人,依题意可得列联表如下:
是否喜欢
运动
性别
喜欢运动
不喜欢运动
总计
男生
45x
15x
x
女生
35x
25x
x
总计
75x
35x
2x
若有95%的把握认为“是否喜欢运动和性别有关”,则χ2=2x21≥3.841,
解得x≥40.3305,
由题意知x>0,且x是5的整数倍,所以结合选项知45、60和75满足题意.
故选BCD.
三、填空题
13.答案 36
解析 由题意有a+6=18,a+b=20,a+b+d+6=50,
解得a=12,b=8,d=24,
所以a+d=12+24=36.
14.答案 有
解析 依题意,可得出如下2×2列联表:
国内代表
国外代表
总计
不乐观
40
60
100
乐观
60
40
100
总计
100
100
200
χ2=200×(402-602)21004=8>6.635,
所以有99%以上的把握认为持乐观态度和国内外差异有关.
15.答案 68
解析 由题表中数据可得x=14×(18+13+10-1)=10,
y=14×(24+34+38+64)=40,
所以线性回归直线过点(10,40),故a^=60.
所以当x=-4时,y^=-2×(-4)+60=68.
16.答案 乙;二月份
解析 由题图1可知城市乙2月份名次比1月份名次靠前,答案应填乙;结合题图1、图2可以看出丙城市的名次最靠前的是二月份,答案应填二月份.
四、解答题
17.解析 (1)由题意得y=16×(8+11+14+20+23+26)=17,∴∑i=16(yi-y)2=(8-17)2+(11-17)2+(14-17)2+(20-17)2+(23-17)2+(26-17)2=252,
∴r=∑i=16(xi-x)(yi-y)∑i=16(xi-x)2∑i=16(yi-y)2=946×67≈9436×2.646≈0.99>0.75.
∴可用线性回归模型拟合y与x的关系. (5分)
(2)x=16×∑i=16xi=54.96=9.15,b^=∑i=16(xi-x)(yi-y)∑i=16(xi-x)2=9436≈2.61,a^≈17-2.61×9.15≈-6.88,∴回归方程为y^=2.61x-6.88,当x=4时,y^=2.61×4-6.88≈4.∴昼夜温差为4℃时患感冒的人数约为4.(10分)
18.解析 (1)由题表中的数据得x=4.5,y=3.75,
(3分)
b^=7.5+14+20+30-4×4.5×3.759+16+25+36-4×4.52=45=0.8,
a^=3.75-0.8×4.5=0.15, (5分)
所以y关于x的线性回归方程为y^=0.8x+0.15. (7分)
(2)当x=100时,y^=0.8×100+0.15=80.15,90-80.15=9.85, (10分)
所以技术改造后预测生产100吨甲产品相应的生产能耗比技术改造前降低9.85吨标准煤. (12分)
19.解析 (1)x=1×401000+3×1601000+5×3001000+7×3601000+9×601000+11×601000+13×201000
=40+480+1500+2520+540+660+2601000
=60001000=6. (4分)
(2)抽取的短潜伏者的总人数为300×40+160+3001000=150,长潜伏者的总人数为300-150=150. (7分)
补充完整的列联表如下:
短潜伏者
长潜伏者
总计
60岁及以上
100
60
160
60岁以下
50
90
140
总计
150
150
300
χ2=300×(100×90-50×60)2150×150×140×160=1507≈21.429.(10分)
因为21.429>6.635,所以有99%的把握认为潜伏期长短与患者年龄有关. (12分)
20.解析 (1)根据题意,设女性观众评分的中位数为x,
则10×0.01+10×0.02+(x-70)×0.04=0.5,
∴x=75. (2分)
男性观众评分的平均数为55×0.15+65×0.25+75×0.3+85×0.2+95×0.1=73.5. (4分)
(2)(i)男性观众不满意的概率大,
记CA表示事件:女性观众不满意,CB表示事件:男性观众不满意,
由频率估计概率,得P(CA)=(0.01+0.02)×10=0.3, (6分)
P(CB)=(0.015+0.025)×10=0.4,
所以男性观众不满意的概率大. (8分)
(ii)完成列联表如下:
女性观众
男性观众
总计
满意
140
180
320
不满意
60
120
180
总计
200
300
500
所以χ2=500×(140×120-180×60)2200×300×320×180≈5.208,(10分)
因为5.208>3.841,所以有95%的把握认为对该综艺节目是否满意和性别有关. (12分)
21.解析 (1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.
所以样本中日平均生产件数不足60的工人中,25周岁以上组工人有60×0.05=3人,记为A1,A2,A3;25周岁以下组工人有40×0.05=2人,记为B1,B2.
从中随机抽取2名工人,所有的可能结果共有10种,它们是(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2). (3分)
其中,至少有1名25周岁以下组工人的可能结果共有7种,它们是(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2),故所求概率P=710. (5分)
(2)由题中频率分布直方图可知,在抽取的100名工人中,25周岁以上组中的生产能手有60×0.25=15(人),25周岁以下组中的生产能手有40×0.375=15(人),
据此可得2×2列联表如下:
生产能手
非生产能手
总计
25周岁以上组
15
45
60
25周岁以下组
15
25
40
总计
30
70
100
(8分)
计算可得χ2=100×(15×25-45×15)260×40×30×70≈1.79. (10分)
因为1.79<2.706,所以认为生产能手与工人所在的年龄组无关. (12分)
22.解析 (1)r0
①异常点A,B会降低变量之间的线性相关程度.
②44个数据点与其回归直线的总偏差更大,回归效果更差,所以相关系数更小.
③42个数据点与其回归直线的总偏差更小,回归效果更好,所以相关系数更大.
④42个数据点更贴近其回归直线.
⑤44个数据点与其回归直线更离散. (4分)
(以上理由写出任一个或其他言之有理,均可得分)
(2)设y关于x的线性回归方程为y^=b^x+a^.由题中数据可得x=142∑i=142xi=110.5,
y=142∑i=142yi=74,
所以∑i=142(xi-x)(yi-y)=∑i=142xiyi-42xy=350350-42×110.5×74=6916.
又因为∑i=142(xi-x)2=13814.5, (6分)
所以b^=∑i=142(xi-x)(yi-y)∑i=142(xi-x)2≈0.50,
a^=y-b^x≈74-0.50×110.5=18.75,
所以y^=0.50x+18.75.
将x=125代入,得y^=0.50×125+18.75=62.5+18.75≈81,
所以估计B考生的物理成绩为81分. (8分)
(3)y=142∑i=142yi=74,s2=142∑i=142(yi-y)2=142×5250=125,所以X~N(74,125), (10分)
又因为125≈11.2,
所以P(62.8
所以EZ=5000×0.6827≈3414,
即该地区本次考试物理成绩位于区间(62.8,85.2]的人数Z的数学期望约为3414.(12分)
相关资料
更多