还剩8页未读,
继续阅读
成套系列资料,整套一键下载
北师大版(2019) 高中数学 选择性必修第一册 第七章统计案例 章末测评卷(含解析)
展开
这是一份北师大版(2019) 高中数学 选择性必修第一册 第七章统计案例 章末测评卷(含解析),共11页。
《第七章 统计案例》章末测评卷
一、单项选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.为调查中学生近视情况,随机抽取某校男生150名,女生140名,其中,男生中有80名近视,女生中有70名近视.在检验这些中学生眼睛近视是否与性别有关时,最有说服力的方法是( )
A.均值与方差 B.排列与组合
C.概率 D.独立性检验
2.(2021春丰台区期末)下列两个变量具有相关关系的是( )
A.正方体的体积与棱长
B.汽车匀速行驶时的路程与时间
C.人的体重与饭量
D.人的身高与视力
3.两个变量Y与X的回归模型中,分别选择了4个不同的模型,它们的相关系数r如表,其中拟合效果最好的模型是( )
模型
模型1
模型2
模型3
模型4
相关系数r
0.48
0.15
0.96
0.30
A.模型1 B.模型2
C.模型3 D.模型4
4.用最小二乘法得到一组数据(xi,yi)(i=1,2,3,4,5)的线性回归方程为Y=2X+3,若∑i=15xi=25,则∑i=15yi等于( )
A.11 B.13
C.53 D.65
5.(2021江苏无锡一模)某词汇研究机构为对某城市人们使用流行用语的情况进行调查,随机抽取了200人进行调查统计得到下方的2×2列联表.则根据列联表可知( )
流行用语情况
年轻人
非年轻人
总计
经常用流行用语
125
25
150
不经常用流行用语
35
15
50
总计
160
40
200
参考公式:独立性检验统计量χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
A.有95%的把握认为“经常用流行用语”与“年轻人”有关系
B.没有95%的把握认为“经常用流行用语”与“年轻人”有关系
C.有97.5%的把握认为“经常用流行用语”与“年
轻人”有关系
D.有97.5%的把握认为“经常用流行用语”与“年轻人”没有关系
6.已知变量X,Y之间的线性回归方程Y=-0.7X+10.3,且变量X,Y之间的一组相关数据如表所示,则下列说法错误的是( )
X
6
8
10
12
Y
6
m
3
2
A.变量X,Y之间呈负相关关系
B.m=4
C.可以预测,当X=20时,Y=-3.7
D.该回归直线必过点(9,4)
7.(2021春龙凤区校级期中)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如表数据:
单价X(元)
4
5
6
7
8
9
销量Y(件)
90
84
83
80
75
68
由表中数据,求得线性回归方程为Y=b^X+106.若在这些样本点中任取一点,则它在回归直线右上方的概率为( )
A.16 B.13
C.12 D.23
8.疫苗是为预防、控制传染病的发生、流行,用于人体预防接种的预防性生物制品,其前期研发过程中,一般都会进行动物保护测试,为了考察某种疫苗预防效果,在进行动物试验时,得到如下统计数据:
是否发病
未发病
发病
总计
未注射疫苗
20
注射疫苗
30
总计
50
50
100
现从试验动物中任取一只,取得“注射疫苗”的概率为25,则下列判断错误的是( )
公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
A.注射疫苗发病的动物数为10
B.从该试验未注射疫苗的动物中任取一只,发病的概率为23
C.有99%的把握判断注射疫苗与是否发病有关联
D.有95%的把握判断注射疫苗与是否发病有关联
二、多项选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.
9.为了对变量x与y的线性相关性进行检验,由样本点(x1,y1),(x2,y2),…,(x10,y10)求得两个变量的样本相关系数为r,那么下面说法中错误的有( )
A.若所有样本点都在直线y=-2x+1上,则r=1
B.若所有样本点都在直线y=-2x+1上,则r=-2
C.若|r|越大,则变量x与y的线性相关性越强
D.若|r|越小,则变量x与y的线性相关性越强
10.(2021山东烟台模拟)在一次恶劣气候的飞行航程中,调查男女乘客在机上晕机的情况,结果如表所示:
性别
晕机
不晕机
合计
男
a
15
a+15
女
6
d
d+6
合计
a+6
28
46
则下列说法正确的是( )
A.aa+15>6d+6
B.χ2<2.706
C.有90%的把握认为,在恶劣气候飞行中,晕机与否跟性别有关
D.没有90%的把握认为,在恶劣气候飞行中,晕机与否跟性别有关
11.(2021秋山东潍坊高三期中)某位同学10次考试的物理成绩Y与数学成绩X如表所示:
数学成
绩X
76
82
72
87
93
78
89
66
81
76
物理成
绩Y
80
87
75
a
100
79
93
68
85
77
参考数据:∑i=110xi=800.
已知Y与X线性相关,且Y关于X的回归直线方程为Y=1.1X-5,则下列说法正确的是( )
A.a=86
B.Y与X正相关
C.Y与X的相关系数为负数
D.若数学成绩每提高5分,则物理成绩估计能提高5.5分
12.(2021永州三模)某校对“学生性别和喜欢锻炼是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢锻炼的人数占男生总人数的45,女生喜欢锻炼的人数占女生总人数的35.若至少有95%的把握认为“学生性别和喜欢锻炼有关”,则被调查学生中男生的人数可能为( )
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(n=a+b+c+d).
A.35 B.40 C.45 D.50
三、填空题:本题共4小题,每小题5分,共20分.
13.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
性别
非统计专业
统计专业
男
13
10
女
7
20
为了检验主修统计专业是否与性别有关系,根据表中的数据,得到χ2=50(13×20-10×7)223×27×20×30≈4.844.
因为χ2≥3.841,所以断定主修统计专业与性别有关系.这种判断的把握为 .
14.一般说来,年收入高的家庭年支出也高,你能设计一个方案说明“年收入”与“年支出”是否存在线性相关关系吗?试写出你的设计 .(答案不唯一)
15.(2021安徽六安一中高三模拟)已知由一组样本数据确定的回归直线方程为Y=1.5X+1,且x=2,发现有两组数据(2.2,2.9)与(1.8,5.1)误差较大,去掉这两组数据后,重新求得回归直线的斜率为1,那么当X=4时,Y的预测值为 .
16.某高校有10 000名学生,其中女生3 000名,男生7 000名.为调查爱好体育运动是否与性别有关,用分层抽样的方法抽取120名学生,制成独立性检验的2×2列联表如下,则a-b= .(用数字作答)
性别
男
女
总计
爱好体育运动
a
9
####
不爱好体育运动
28
b
####
总计
####
####
120
四、解答题:本题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤.
17.(10分)(2021安徽宿州检测)某村海拔1 500米,交通极为不便,被称为“云端上的村庄”,系建档立卡贫困村.该省政府办公厅组建了精准扶贫组进行定点帮扶,扶贫组在实地调研和充分听取群众意见后,立足当地独特优势,大力发展高山蔬菜和生态黑猪,有效带动了全村父老乡亲脱贫奔小康.村民甲在企业帮扶下签订合同,代养生态黑猪,2016年至2020年养殖黑猪的年收入Y(单位:万元)的数据如表:
年份
2016
2017
2018
2019
2020
年份代号X
1
2
3
4
5
年收入Y(万元)
5.6
6.5
7.4
8.2
9.1
(1)请根据表中的数据,用最小二乘法求出Y关于X的线性回归方程;
(2)利用(1)中的线性回归方程,预测2021年该村民养殖黑猪的年收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为b^=∑i=1nxiyi-nx y∑i=1nxi2-nx2,a^=y−b^ x.
18.(12分)(2021四川广元模拟)某高中学校实施线上教学,为了解线上教学的效果,随机抽取了100名学生对线上教学效果进行评分(满分100分),记低于80的评分为“效果一般”,不低于80分为“效果较好”.
(1)请补充完整2×2列联表;通过计算判断,有没有99%的把握认为线上教学效果评分为“效果较好”与性别有关?
性别
效果一般
效果较好
总计
男
20
女
15
55
总计
(2)根据(1)中列联表的数据,在评分为“效果较好”的学生中按照性别用分层抽样的方法抽取了6名学生.若从这6名学生中随机选择2名进行访谈,求所抽取的2名学生中恰好有1名男生的概率.
χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
19.(12分)(2021江苏连云港质检)机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道,应当停车让行,俗称“礼让行人”.下表是某市一主干路口监控设备所抓拍的1月份到5月份这5个月内驾驶员不“礼让行人”行为统计数据:
月份
1
2
3
4
5
违章驾驶员人数
120
105
100
95
80
(1)请利用所给数据求违章人数Y与月份X之间的线性回归方程Y=b^X+a^;
(2)预测该路口9月份的不“礼让行人”违章驾驶员人数;
(3)交警从这5个月内通过该路口的驾驶员中随机抽查70人,调查驾驶员不“礼让行人”行为与驾龄的关系,得到下表:
驾龄
不礼让行人
礼让行人
驾龄不超过1年
24
16
驾龄1年以上
16
14
能否据此判断有90%的把握认为“礼让行人”行为与驾龄有关?
参考公式:b^=∑i=1nxiyi-nx y∑i=1nxi2-nx2=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2,a^=y−b^ x,χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(其中n=a+b+c+d).
20.(12分)(2021江西南昌二中高二上月考)自湖北武汉暴发新型冠状病毒肺炎疫情以来,在以习近平总书记为核心的党中央的正确领导和指挥下,全国各地纷纷驰援,湖北的疫情形势很快得到了控制,但是国际疫情越来越严重,医用口罩等物资存在很大缺口.某口罩生产厂家复工复产后,抢时生产口罩,已知该企业前10天生产的口罩量如下表所示:
第X天
1
2
3
4
5
产量Y
(单位:万个)
76.0
88.0
96.0
104.0
111.0
第X天
6
7
8
9
10
产量Y
(单位:万个)
117.0
124.0
130.0
135.0
140.0
对上表的数据初步处理,得到一些统计量的值:
x
y
∑i=110xi2-10x2
∑i=110xiyi-10x y
m
n
82.5
570.5
(1)求表中m,n的值,并根据最小二乘法求出Y关于X的线性回归方程Y=b^X+a^(回归方程系数精确到0.1);
(2)某同学认为Y=p^X2+q^X+r^更适宜作为Y关于X的回归方程模型,并以此模型求得回归方程为Y=-311X2+10X+68.经调查,该企业第11天的产量为145.3万个,与(1)中的线性回归方程比较,哪个回归方程的拟合效果更好?并说明理由.
附:b^=∑i=1nxiyi-nx y∑i=1nxi2-nx2,a^=y−b^ x.
21.(12分)某沙漠地区经过治理,生态系统得到改善.为调查该地区植物覆盖面积(单位:公顷)和某种野生动物的数量的关系,将该地区分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积和这种野生动物的数量,并计算得∑i=120xi=60,∑i=120yi=1 200,∑i=120(xi-x)2=80,∑i=120(yi-y)2=9 000,∑i=120(xi-x)(yi-y)=800.
(1)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01),并用相关系数说明各样区的这种野生动物的数量与植物覆盖面积的相关性.
(2)根据现有统计资料得知,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2.
22.(12分)(2021深圳实验中学高二期中改编)某公司为了解年研发资金投入量X(单位:亿元)对年销售额Y(单位:亿元)的影响.对公司近12年的年研发资金投入量xi和年销售额yi的数据,进行了对比分析,建立了两个模型:①Y=α^+β^X2,②Y=eλ^X+t^,其中α,β,λ,t均为常数,e为自然对数的底数,并得到一些统计量的值.令ui=xi2,vi=ln yi(i=1,2,…,12),经计算得如下数据:
x
y
∑i=112(xi-x)2
∑i=112(yi-y)2
u
v
20
66
77
2
460
4.20
∑i=112(ui-u)2
∑i=112(ui-u)(yi-y)
∑i=112(vi-v)2
∑i=112(xi-x)(vi-v)
31 250
215
3.08
14
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?
(2)(ⅰ)根据分析及表中数据,建立Y关于X的回归方程;
(ⅱ)若下一年销售额Y需达到90亿元,预测下一年的研发资金投入量X是多少亿元?
附:①相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2,回归直线Y=a^+b^X中公式分别为b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2=∑i=1nxiyi-nx y∑i=1nxi2-nx2,a^=y−b^x;
②参考数据:308=4×77,90≈9.486 8,e4.499 8≈90.
参考答案
一、单项选择题
1.D
2.C 正方体的体积与棱长是函数关系,故选项A错误;
汽车匀速行驶时的路程与时间是函数关系,故选项B错误;
饭量会影响体重,但不是唯一因素,所以人的体重与饭量是相关关系,故选项C正确;
人的身高与视力无任何关系,故选项D错误.
3.C 4.D 5.A 6.B
7.C 由表中数据知,x=16×(4+5+6+7+8+9)=6.5,y=16×(90+84+83+80+75+68)=80,
因为线性回归方程Y=b^X+106恒过样本点的中心(x,y),
所以80=b^×6.5+106,解得b^=-4,
所以Y=-4X+106,由此得到如下表格:
单价X(元)
4
5
6
7
8
9
销量Y(件)
90
84
83
80
75
68
估计值y^(件)
90
86
82
78
74
70
所以6个点中,在回归直线右上方的点有(6,83),(7,80),(8,75),共3个,
所以概率为36=12.
故选C.
8.D
二、多项选择题
9.ABD 当所有样本点都在直线y=-2x+1上时,样本点数据完全负相关,其相关系数r=-1,所以A,B都错误;
相关系数|r|值越大,则变量x与y的线性相关性越强,C正确;
相关系数|r|值越小,则变量x与y的线性相关性越弱,D错误.
综上知,以上错误的说法是ABD.
10.ABD
11.ABD 对于Ax=80,∴ y=80×1.1-5=83,可得A正确;对于B显然正确;对于C,因为y与x正相关,故相关系数为正;D显然正确.
12.CD 由题意被调查的男女生人数相同,设男生的人数为5n,n∈N*,由题意可列出2×2列联表:
爱好
男生
女生
合计
喜欢锻炼
4n
3n
7n
不喜欢锻炼
n
2n
3n
合计
5n
5n
10n
χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=10n×(4n×2n-3n×n)25n×5n×7n×3n=10n21.
由于有95%的把握认为“学生性别和喜欢锻炼有关”,
所以3.841≤10n21<6.635,
解得8.066 1≤n<13.933 5,
则n的可能取值为9,10,11,12,13,
则选项中被调查学生中男生的人数可能为45或50.
三、填空题
13.95% 根据χ2=4.844>3.841,因此有95%的把握判断主修统计专业与性别有关系.
14.参考答案:1.收集30个家庭的年收入和年支出数据;2.以年收入数据作为变量X,年支出数据作为变量Y,绘制散点图;3.观察散点图中的点是否集中在一条直线的附近;4.下结论
15.6 ∵x=2,∴y=2×1.5+1=4,设新的回归直线方程为Y=x+a,代入(2,4)解得a=2,当X=4时,Y的预测值为6.
16.29 根据分层抽样原理,计算抽取男生120×7 00010 000=84(人),女生120×3 00010 000=36(人),所以a=84-28=56(人),b=36-9=27(人),所以a-b=56-27=29(人).
四、解答题
17.解 (1)x=15×(1+2+3+4+5)=3,
y=15×(5.6+6.5+7.4+8.2+9.1)=7.36,
∑i=15xiyi=1×5.6+2×6.5+3×7.4+4×8.2+5×9.1=119.1,∑i=15xi2=55,
∴b^=119.1-5×3×7.3655-5×32=8.710=0.87,
a^=y−b^ x=7.36-0.87×3=4.75,
∴Y关于X的线性回归方程为Y=0.87X+4.75;
(2)将2021年的年份代号X=6代入Y=0.87X+4.75,可得Y=0.87×6+4.75=9.97(万元).故预测2021年该村民养殖黑猪的年收入为9.97万元.
18.解 (1)根据题意填写列联表如下:
性别
效果一般
效果较好
总计
男
25
20
45
女
15
40
55
总计
40
60
100
计算χ2=100×(25×40-15×20)245×55×40×60≈8.249>6.635,
所以有99%的把握认为线上教学效果评分为“效果较好”与性别有关.
(2)根据列联表中的数据,用分层抽样法抽取6名学生,其中男生2人,女生4人,故所求的概率为C21C41C62=815.
19.解 (1)由表中的数据可知,x=15×(1+2+3+4+5)=3,
y=15×(120+105+100+95+80)=100,
所以b^=∑i=1nxiyi-nxy∑i=1nxi2-nx2=1 410-1 50055-45=-9,
所以a^=y−b^ x=127,
故所求线性回归方程为Y=-9X+127;
(2)由(1)可知,Y=-9X+127,
令X=9,则Y=-9×9+127=46(人);
(3)由表中数据可得χ2=70×(24×14-16×16)240×30×40×30≈0.311<2.706,
故没有充分的证据判断“礼让行人”行为与驾龄有关.
20.解 (1)易得x=m=5.5,y=n=112.1,
∴b^=∑i=110xiyi-10x y∑i=110xi2-10x2=570.582.5≈6.9,a^=y−b^ x=112.1-6.9×5.5≈74.2,
∴所求回归方程为Y=6.9X+74.2.
(2)用Y'=-311X2+10X+68拟合效果更好.理由如下:
将X=11代入Y=6.9X+74.2中,得Y=150.1,
150.1-145.3=4.8.
将X=11代入Y'=-311X2+10X+68中,得Y'=145,145-145.3=-0.3.
又|-0.3|<4.8,所以用Y'=-311X2+10X+68拟合效果更好.
21.解 (1)样本(xi,yi)(i=1,2,…,20)的相关系数为
r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2=80080×9 000=223≈0.94,
由于0.94接近1,说明各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性.
(2)更合理的抽样方法是分层抽样.理由如下:
由(1)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异也很大,
采用分层抽样的方法能较好地保持样本结构与总体结构的一致性,提高样本的代表性,
从而可以获得该地区这种野生动物数量更准确的估计.
22.解 (1)设模型①和②的相关系数分别为r1,r2.
由题意,r1=∑i=112(ui-u)(yi-y)∑i=112(ui-u)2∑i=112(yi-y)2=21531 250×2=215250=4350=0.86,
r2=∑i=112(xi-x)(vi-v)∑i=112(xi-x)2∑i=112(vi-v)2=1477×3.08=1477×0.2=1011≈0.91,
所以|r1|<|r2|,由相关系数的相关性质可得,模型②的拟合程度更好.
(2)(ⅰ)由(1)知,选择模型②.
先建立V关于X的线性回归方程,
由Y=eλ^X+t^,得ln Y=t^+λ^X,即V=t^+λ^X,
由于λ^=1477≈0.18,
t^=v−λ^ x=4.2-0.18×20=0.60,
所以V关于X的线性回归方程为V=0.18X+0.60,
所以ln Y=0.18X+0.60,则Y=e0.18X+0.60;
(ⅱ)下一年销售额需达到90亿元,即Y=90,
代入Y=e0.18X+0.60,得90=e0.18X+0.60,
又e4.499 8≈90,所以4.499 8≈0.18X+0.60,
所以X≈4.499 8-0.600.18≈21.67,
所以预测下一年的研发资金投入量约是21.67亿元.
《第七章 统计案例》章末测评卷
一、单项选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.
1.为调查中学生近视情况,随机抽取某校男生150名,女生140名,其中,男生中有80名近视,女生中有70名近视.在检验这些中学生眼睛近视是否与性别有关时,最有说服力的方法是( )
A.均值与方差 B.排列与组合
C.概率 D.独立性检验
2.(2021春丰台区期末)下列两个变量具有相关关系的是( )
A.正方体的体积与棱长
B.汽车匀速行驶时的路程与时间
C.人的体重与饭量
D.人的身高与视力
3.两个变量Y与X的回归模型中,分别选择了4个不同的模型,它们的相关系数r如表,其中拟合效果最好的模型是( )
模型
模型1
模型2
模型3
模型4
相关系数r
0.48
0.15
0.96
0.30
A.模型1 B.模型2
C.模型3 D.模型4
4.用最小二乘法得到一组数据(xi,yi)(i=1,2,3,4,5)的线性回归方程为Y=2X+3,若∑i=15xi=25,则∑i=15yi等于( )
A.11 B.13
C.53 D.65
5.(2021江苏无锡一模)某词汇研究机构为对某城市人们使用流行用语的情况进行调查,随机抽取了200人进行调查统计得到下方的2×2列联表.则根据列联表可知( )
流行用语情况
年轻人
非年轻人
总计
经常用流行用语
125
25
150
不经常用流行用语
35
15
50
总计
160
40
200
参考公式:独立性检验统计量χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.
A.有95%的把握认为“经常用流行用语”与“年轻人”有关系
B.没有95%的把握认为“经常用流行用语”与“年轻人”有关系
C.有97.5%的把握认为“经常用流行用语”与“年
轻人”有关系
D.有97.5%的把握认为“经常用流行用语”与“年轻人”没有关系
6.已知变量X,Y之间的线性回归方程Y=-0.7X+10.3,且变量X,Y之间的一组相关数据如表所示,则下列说法错误的是( )
X
6
8
10
12
Y
6
m
3
2
A.变量X,Y之间呈负相关关系
B.m=4
C.可以预测,当X=20时,Y=-3.7
D.该回归直线必过点(9,4)
7.(2021春龙凤区校级期中)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如表数据:
单价X(元)
4
5
6
7
8
9
销量Y(件)
90
84
83
80
75
68
由表中数据,求得线性回归方程为Y=b^X+106.若在这些样本点中任取一点,则它在回归直线右上方的概率为( )
A.16 B.13
C.12 D.23
8.疫苗是为预防、控制传染病的发生、流行,用于人体预防接种的预防性生物制品,其前期研发过程中,一般都会进行动物保护测试,为了考察某种疫苗预防效果,在进行动物试验时,得到如下统计数据:
是否发病
未发病
发病
总计
未注射疫苗
20
注射疫苗
30
总计
50
50
100
现从试验动物中任取一只,取得“注射疫苗”的概率为25,则下列判断错误的是( )
公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
A.注射疫苗发病的动物数为10
B.从该试验未注射疫苗的动物中任取一只,发病的概率为23
C.有99%的把握判断注射疫苗与是否发病有关联
D.有95%的把握判断注射疫苗与是否发病有关联
二、多项选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.
9.为了对变量x与y的线性相关性进行检验,由样本点(x1,y1),(x2,y2),…,(x10,y10)求得两个变量的样本相关系数为r,那么下面说法中错误的有( )
A.若所有样本点都在直线y=-2x+1上,则r=1
B.若所有样本点都在直线y=-2x+1上,则r=-2
C.若|r|越大,则变量x与y的线性相关性越强
D.若|r|越小,则变量x与y的线性相关性越强
10.(2021山东烟台模拟)在一次恶劣气候的飞行航程中,调查男女乘客在机上晕机的情况,结果如表所示:
性别
晕机
不晕机
合计
男
a
15
a+15
女
6
d
d+6
合计
a+6
28
46
则下列说法正确的是( )
A.aa+15>6d+6
B.χ2<2.706
C.有90%的把握认为,在恶劣气候飞行中,晕机与否跟性别有关
D.没有90%的把握认为,在恶劣气候飞行中,晕机与否跟性别有关
11.(2021秋山东潍坊高三期中)某位同学10次考试的物理成绩Y与数学成绩X如表所示:
数学成
绩X
76
82
72
87
93
78
89
66
81
76
物理成
绩Y
80
87
75
a
100
79
93
68
85
77
参考数据:∑i=110xi=800.
已知Y与X线性相关,且Y关于X的回归直线方程为Y=1.1X-5,则下列说法正确的是( )
A.a=86
B.Y与X正相关
C.Y与X的相关系数为负数
D.若数学成绩每提高5分,则物理成绩估计能提高5.5分
12.(2021永州三模)某校对“学生性别和喜欢锻炼是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢锻炼的人数占男生总人数的45,女生喜欢锻炼的人数占女生总人数的35.若至少有95%的把握认为“学生性别和喜欢锻炼有关”,则被调查学生中男生的人数可能为( )
附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(n=a+b+c+d).
A.35 B.40 C.45 D.50
三、填空题:本题共4小题,每小题5分,共20分.
13.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:
性别
非统计专业
统计专业
男
13
10
女
7
20
为了检验主修统计专业是否与性别有关系,根据表中的数据,得到χ2=50(13×20-10×7)223×27×20×30≈4.844.
因为χ2≥3.841,所以断定主修统计专业与性别有关系.这种判断的把握为 .
14.一般说来,年收入高的家庭年支出也高,你能设计一个方案说明“年收入”与“年支出”是否存在线性相关关系吗?试写出你的设计 .(答案不唯一)
15.(2021安徽六安一中高三模拟)已知由一组样本数据确定的回归直线方程为Y=1.5X+1,且x=2,发现有两组数据(2.2,2.9)与(1.8,5.1)误差较大,去掉这两组数据后,重新求得回归直线的斜率为1,那么当X=4时,Y的预测值为 .
16.某高校有10 000名学生,其中女生3 000名,男生7 000名.为调查爱好体育运动是否与性别有关,用分层抽样的方法抽取120名学生,制成独立性检验的2×2列联表如下,则a-b= .(用数字作答)
性别
男
女
总计
爱好体育运动
a
9
####
不爱好体育运动
28
b
####
总计
####
####
120
四、解答题:本题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤.
17.(10分)(2021安徽宿州检测)某村海拔1 500米,交通极为不便,被称为“云端上的村庄”,系建档立卡贫困村.该省政府办公厅组建了精准扶贫组进行定点帮扶,扶贫组在实地调研和充分听取群众意见后,立足当地独特优势,大力发展高山蔬菜和生态黑猪,有效带动了全村父老乡亲脱贫奔小康.村民甲在企业帮扶下签订合同,代养生态黑猪,2016年至2020年养殖黑猪的年收入Y(单位:万元)的数据如表:
年份
2016
2017
2018
2019
2020
年份代号X
1
2
3
4
5
年收入Y(万元)
5.6
6.5
7.4
8.2
9.1
(1)请根据表中的数据,用最小二乘法求出Y关于X的线性回归方程;
(2)利用(1)中的线性回归方程,预测2021年该村民养殖黑猪的年收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为b^=∑i=1nxiyi-nx y∑i=1nxi2-nx2,a^=y−b^ x.
18.(12分)(2021四川广元模拟)某高中学校实施线上教学,为了解线上教学的效果,随机抽取了100名学生对线上教学效果进行评分(满分100分),记低于80的评分为“效果一般”,不低于80分为“效果较好”.
(1)请补充完整2×2列联表;通过计算判断,有没有99%的把握认为线上教学效果评分为“效果较好”与性别有关?
性别
效果一般
效果较好
总计
男
20
女
15
55
总计
(2)根据(1)中列联表的数据,在评分为“效果较好”的学生中按照性别用分层抽样的方法抽取了6名学生.若从这6名学生中随机选择2名进行访谈,求所抽取的2名学生中恰好有1名男生的概率.
χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.
19.(12分)(2021江苏连云港质检)机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道,应当停车让行,俗称“礼让行人”.下表是某市一主干路口监控设备所抓拍的1月份到5月份这5个月内驾驶员不“礼让行人”行为统计数据:
月份
1
2
3
4
5
违章驾驶员人数
120
105
100
95
80
(1)请利用所给数据求违章人数Y与月份X之间的线性回归方程Y=b^X+a^;
(2)预测该路口9月份的不“礼让行人”违章驾驶员人数;
(3)交警从这5个月内通过该路口的驾驶员中随机抽查70人,调查驾驶员不“礼让行人”行为与驾龄的关系,得到下表:
驾龄
不礼让行人
礼让行人
驾龄不超过1年
24
16
驾龄1年以上
16
14
能否据此判断有90%的把握认为“礼让行人”行为与驾龄有关?
参考公式:b^=∑i=1nxiyi-nx y∑i=1nxi2-nx2=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2,a^=y−b^ x,χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)(其中n=a+b+c+d).
20.(12分)(2021江西南昌二中高二上月考)自湖北武汉暴发新型冠状病毒肺炎疫情以来,在以习近平总书记为核心的党中央的正确领导和指挥下,全国各地纷纷驰援,湖北的疫情形势很快得到了控制,但是国际疫情越来越严重,医用口罩等物资存在很大缺口.某口罩生产厂家复工复产后,抢时生产口罩,已知该企业前10天生产的口罩量如下表所示:
第X天
1
2
3
4
5
产量Y
(单位:万个)
76.0
88.0
96.0
104.0
111.0
第X天
6
7
8
9
10
产量Y
(单位:万个)
117.0
124.0
130.0
135.0
140.0
对上表的数据初步处理,得到一些统计量的值:
x
y
∑i=110xi2-10x2
∑i=110xiyi-10x y
m
n
82.5
570.5
(1)求表中m,n的值,并根据最小二乘法求出Y关于X的线性回归方程Y=b^X+a^(回归方程系数精确到0.1);
(2)某同学认为Y=p^X2+q^X+r^更适宜作为Y关于X的回归方程模型,并以此模型求得回归方程为Y=-311X2+10X+68.经调查,该企业第11天的产量为145.3万个,与(1)中的线性回归方程比较,哪个回归方程的拟合效果更好?并说明理由.
附:b^=∑i=1nxiyi-nx y∑i=1nxi2-nx2,a^=y−b^ x.
21.(12分)某沙漠地区经过治理,生态系统得到改善.为调查该地区植物覆盖面积(单位:公顷)和某种野生动物的数量的关系,将该地区分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积和这种野生动物的数量,并计算得∑i=120xi=60,∑i=120yi=1 200,∑i=120(xi-x)2=80,∑i=120(yi-y)2=9 000,∑i=120(xi-x)(yi-y)=800.
(1)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01),并用相关系数说明各样区的这种野生动物的数量与植物覆盖面积的相关性.
(2)根据现有统计资料得知,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2.
22.(12分)(2021深圳实验中学高二期中改编)某公司为了解年研发资金投入量X(单位:亿元)对年销售额Y(单位:亿元)的影响.对公司近12年的年研发资金投入量xi和年销售额yi的数据,进行了对比分析,建立了两个模型:①Y=α^+β^X2,②Y=eλ^X+t^,其中α,β,λ,t均为常数,e为自然对数的底数,并得到一些统计量的值.令ui=xi2,vi=ln yi(i=1,2,…,12),经计算得如下数据:
x
y
∑i=112(xi-x)2
∑i=112(yi-y)2
u
v
20
66
77
2
460
4.20
∑i=112(ui-u)2
∑i=112(ui-u)(yi-y)
∑i=112(vi-v)2
∑i=112(xi-x)(vi-v)
31 250
215
3.08
14
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?
(2)(ⅰ)根据分析及表中数据,建立Y关于X的回归方程;
(ⅱ)若下一年销售额Y需达到90亿元,预测下一年的研发资金投入量X是多少亿元?
附:①相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2,回归直线Y=a^+b^X中公式分别为b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2=∑i=1nxiyi-nx y∑i=1nxi2-nx2,a^=y−b^x;
②参考数据:308=4×77,90≈9.486 8,e4.499 8≈90.
参考答案
一、单项选择题
1.D
2.C 正方体的体积与棱长是函数关系,故选项A错误;
汽车匀速行驶时的路程与时间是函数关系,故选项B错误;
饭量会影响体重,但不是唯一因素,所以人的体重与饭量是相关关系,故选项C正确;
人的身高与视力无任何关系,故选项D错误.
3.C 4.D 5.A 6.B
7.C 由表中数据知,x=16×(4+5+6+7+8+9)=6.5,y=16×(90+84+83+80+75+68)=80,
因为线性回归方程Y=b^X+106恒过样本点的中心(x,y),
所以80=b^×6.5+106,解得b^=-4,
所以Y=-4X+106,由此得到如下表格:
单价X(元)
4
5
6
7
8
9
销量Y(件)
90
84
83
80
75
68
估计值y^(件)
90
86
82
78
74
70
所以6个点中,在回归直线右上方的点有(6,83),(7,80),(8,75),共3个,
所以概率为36=12.
故选C.
8.D
二、多项选择题
9.ABD 当所有样本点都在直线y=-2x+1上时,样本点数据完全负相关,其相关系数r=-1,所以A,B都错误;
相关系数|r|值越大,则变量x与y的线性相关性越强,C正确;
相关系数|r|值越小,则变量x与y的线性相关性越弱,D错误.
综上知,以上错误的说法是ABD.
10.ABD
11.ABD 对于Ax=80,∴ y=80×1.1-5=83,可得A正确;对于B显然正确;对于C,因为y与x正相关,故相关系数为正;D显然正确.
12.CD 由题意被调查的男女生人数相同,设男生的人数为5n,n∈N*,由题意可列出2×2列联表:
爱好
男生
女生
合计
喜欢锻炼
4n
3n
7n
不喜欢锻炼
n
2n
3n
合计
5n
5n
10n
χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=10n×(4n×2n-3n×n)25n×5n×7n×3n=10n21.
由于有95%的把握认为“学生性别和喜欢锻炼有关”,
所以3.841≤10n21<6.635,
解得8.066 1≤n<13.933 5,
则n的可能取值为9,10,11,12,13,
则选项中被调查学生中男生的人数可能为45或50.
三、填空题
13.95% 根据χ2=4.844>3.841,因此有95%的把握判断主修统计专业与性别有关系.
14.参考答案:1.收集30个家庭的年收入和年支出数据;2.以年收入数据作为变量X,年支出数据作为变量Y,绘制散点图;3.观察散点图中的点是否集中在一条直线的附近;4.下结论
15.6 ∵x=2,∴y=2×1.5+1=4,设新的回归直线方程为Y=x+a,代入(2,4)解得a=2,当X=4时,Y的预测值为6.
16.29 根据分层抽样原理,计算抽取男生120×7 00010 000=84(人),女生120×3 00010 000=36(人),所以a=84-28=56(人),b=36-9=27(人),所以a-b=56-27=29(人).
四、解答题
17.解 (1)x=15×(1+2+3+4+5)=3,
y=15×(5.6+6.5+7.4+8.2+9.1)=7.36,
∑i=15xiyi=1×5.6+2×6.5+3×7.4+4×8.2+5×9.1=119.1,∑i=15xi2=55,
∴b^=119.1-5×3×7.3655-5×32=8.710=0.87,
a^=y−b^ x=7.36-0.87×3=4.75,
∴Y关于X的线性回归方程为Y=0.87X+4.75;
(2)将2021年的年份代号X=6代入Y=0.87X+4.75,可得Y=0.87×6+4.75=9.97(万元).故预测2021年该村民养殖黑猪的年收入为9.97万元.
18.解 (1)根据题意填写列联表如下:
性别
效果一般
效果较好
总计
男
25
20
45
女
15
40
55
总计
40
60
100
计算χ2=100×(25×40-15×20)245×55×40×60≈8.249>6.635,
所以有99%的把握认为线上教学效果评分为“效果较好”与性别有关.
(2)根据列联表中的数据,用分层抽样法抽取6名学生,其中男生2人,女生4人,故所求的概率为C21C41C62=815.
19.解 (1)由表中的数据可知,x=15×(1+2+3+4+5)=3,
y=15×(120+105+100+95+80)=100,
所以b^=∑i=1nxiyi-nxy∑i=1nxi2-nx2=1 410-1 50055-45=-9,
所以a^=y−b^ x=127,
故所求线性回归方程为Y=-9X+127;
(2)由(1)可知,Y=-9X+127,
令X=9,则Y=-9×9+127=46(人);
(3)由表中数据可得χ2=70×(24×14-16×16)240×30×40×30≈0.311<2.706,
故没有充分的证据判断“礼让行人”行为与驾龄有关.
20.解 (1)易得x=m=5.5,y=n=112.1,
∴b^=∑i=110xiyi-10x y∑i=110xi2-10x2=570.582.5≈6.9,a^=y−b^ x=112.1-6.9×5.5≈74.2,
∴所求回归方程为Y=6.9X+74.2.
(2)用Y'=-311X2+10X+68拟合效果更好.理由如下:
将X=11代入Y=6.9X+74.2中,得Y=150.1,
150.1-145.3=4.8.
将X=11代入Y'=-311X2+10X+68中,得Y'=145,145-145.3=-0.3.
又|-0.3|<4.8,所以用Y'=-311X2+10X+68拟合效果更好.
21.解 (1)样本(xi,yi)(i=1,2,…,20)的相关系数为
r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2=80080×9 000=223≈0.94,
由于0.94接近1,说明各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性.
(2)更合理的抽样方法是分层抽样.理由如下:
由(1)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异也很大,
采用分层抽样的方法能较好地保持样本结构与总体结构的一致性,提高样本的代表性,
从而可以获得该地区这种野生动物数量更准确的估计.
22.解 (1)设模型①和②的相关系数分别为r1,r2.
由题意,r1=∑i=112(ui-u)(yi-y)∑i=112(ui-u)2∑i=112(yi-y)2=21531 250×2=215250=4350=0.86,
r2=∑i=112(xi-x)(vi-v)∑i=112(xi-x)2∑i=112(vi-v)2=1477×3.08=1477×0.2=1011≈0.91,
所以|r1|<|r2|,由相关系数的相关性质可得,模型②的拟合程度更好.
(2)(ⅰ)由(1)知,选择模型②.
先建立V关于X的线性回归方程,
由Y=eλ^X+t^,得ln Y=t^+λ^X,即V=t^+λ^X,
由于λ^=1477≈0.18,
t^=v−λ^ x=4.2-0.18×20=0.60,
所以V关于X的线性回归方程为V=0.18X+0.60,
所以ln Y=0.18X+0.60,则Y=e0.18X+0.60;
(ⅱ)下一年销售额需达到90亿元,即Y=90,
代入Y=e0.18X+0.60,得90=e0.18X+0.60,
又e4.499 8≈90,所以4.499 8≈0.18X+0.60,
所以X≈4.499 8-0.600.18≈21.67,
所以预测下一年的研发资金投入量约是21.67亿元.
相关资料
更多