2023-2024学年湘教版(2019)选择性必修二 第四章 统计 单元测试卷(含答案)
展开2023-2024学年湘教版(2019)选择性必修二 第四章 统计 单元测试卷
学校:___________姓名:___________班级:___________考号:___________
一、选择题
1、如图所示,已知两个线性相关变量x,y的统计数据如下:
x | 6 | 8 | 10 | 12 |
y | 6 | 5 | 3 | 2 |
其线性回归方程为,则( ).
A.-0.7 B.0.7 C.-0.5 D.-2
2、为了比较甲、乙、丙三组数据的线性相关性的强弱,小郑同学分别计算了甲、乙、丙三组数据线性相关系数,其数值分别为0.939,0.937,0.948,则( )
A.甲组数据的线性相关性最强,乙组数据的线性相关性最弱
B.乙组数据的线性相关性最强,丙组数据的线性相关性最弱
C.丙组数据的线性相关性最强,甲组数据的线性相关性最弱
D.丙组数据的线性相关性最强,乙组数据的线性相关性最弱
3、某学习小组用计算机软件对一组数据进行回归分析,甲同学首先求出回归直线方程,样本的中心点为.乙同学对甲的计算过程进行检查发现甲将数据误输成,数据误输成,将这两个数据修正后得到回归直线方程,则实数( )
A. B. C. D.
4、某企业节能降耗技术改造后,在生产某产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据如下表所示:
x | 3 | 4 | 5 | 6 |
y | 2.5 | 3 | 4 | a |
若根据表中数据得出y关于x的线性回归方程为,则表中a的值为( )
A.3 B.3.15 C.3.5 D.4.5
5、已知某产品的营销费用x(单位:万元)与销售额y(单位:万元)的统计数据如表所示:
营销费用x/万元 | 2 | 3 | 4 | 5 |
销售额y/万元 | 15 | 20 | 30 | 35 |
根据上表可得y关于x的回归直线方程为,则当该产品的营销费用为6万元时,销售额为( )
A.40.5万元 B.41.5万元 C.42.5万元 D.45万元
6、某社区医院为了了解社区老人与儿童每月患感冒的人数y(人)与月平均气温x(℃)之间的关系,随机统计了某4个月的患病(感冒)人数与当月平均气温,其数据如下表:
月平均气温x(℃) | 17 | 13 | 8 | 2 |
月患病y(人) | 24 | 33 | 40 | 55 |
由表中数据算出线性回归方程中的,气象部门预测下个月的平均气温约为6℃,据此估计该社区下个月老年人与儿童患病人数约为( )
A.38 B.40 C.46 D.58
7、对于两变量,有四组样本数据,分别算出它们的线性相关系数(如下),则线性相关性最强的是( )
A. B. 0.78 C. D. 0.87
8、为了规定工时定额,需要确定加工某种零件所需的时间,为此进行了5次试验,得到5组数据:,由最小二乘法求得回归直线方程为.若已知,则( )
A.75 B.155.4 C.375 D.466.2
二、多项选择题
9、相关变量的散点图如图所示,现对这两个变量进行线性相关分析.方案一:根据图中所有数据,得到线性回归方程,相关系数为;方案二:剔除点,根据剩卜数据得到线性归直线方程:,相关系数为.则( )
A. B. C. D.
10、对某中学的高中女生体重 (单位:)与身高 (单位:)进行线性回归分析,根据样本数据,计算得到相关系数,用最小二乘法近似得到回归直线方程为,则以下结论中正确的是( )
A.与正相关
B.与具有较强的线性相关关系,得到的回归直线方程有价值
C.若该中学某高中女生身高增加,则其体重约增加
D.若该中学某高中女生身高为,则可断定其体重为
三、填空题
11、某机构为了解某社区居民的2021年家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元) | 8.2 | 8.6 | 10.0 | 11.3 | 11.9 |
支出y(万元 | 6.2 | 7.5 | 8.0 | t | 9.8 |
根据上表可得回归直线方程,则__________.
12、一车间为了规定工时定额,需要确定加工某零件所需的时间,为此进行了多次试验,收集了加工零件个数x与所用时间y(分钟)的相关数据,并利用最小二乘法求得回归方程.据此可预测加工200个零件所用的时间约为__________分钟.
13、某城市近10年居民的年收入x与支出y之间的关系大致符合(单位:亿元),预计今年该城市居民年收入为20亿元,则今年支出估计是__________亿元.
14、高二某班数学学习小组成员最近研究的椭圆的问题数x与抛物线的问题数y之间有如下的对应数据:
1 | 2 | 3 | 4 | 5 | |
2 | 4 | 5 | 5 |
若用最小二乘法求得线性回归方程是,则表中的m是___________.
四、解答题
15、某食品专卖店为调查某种零售食品的受欢迎程度,通过电话回访的形式,随机调查了200名年龄在岁的顾客.以28岁为分界线,按喜欢不喜欢,得到下表,且年龄在岁间不喜欢该食品的频率是.
| 喜欢 | 不喜欢 | 合计 |
年龄岁(含28岁) | 80 | m |
|
年龄岁(含40岁) | n | 40 |
|
合计 |
|
|
|
(I)求表中m,n的值;
(Ⅱ)能否有的把握认为顾客是否喜欢该食品与年龄有关?
附:,其中.
0.050 | 0.010 | 0.001 | |
k | 3.841 | 6.635 | 10.828 |
16、某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).
(1)应收集多少位女生的样本数据?
(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为,估计该校学生每周平均体育运动时间超过4小时的概率.
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”
0.10 | 0.05 | 0.010 | 0.005 | |
2.706 | 3.841 | 6.635 | 7.879 |
附:
参考答案
1、答案:A
解析:依题意,,,将带入得:,解得,
所以.
故选:A
2、答案:D
解析:因为线性相关系数越大则线性相关性越
强,所以丙组数据的线性相关性最强,乙组数
据的线性相关性最弱.
故选:D
3、答案:D
解析:依题意知,设修正后的样本点的中心为,则,,,得,故选D.
4、答案:D
解析:,由回归方程:,解之得,故选D.
5、答案:C
解析:由题中表格数据可知,,因为回归直线一定经过点,所以,解得,
所以回归直线方程为,将代入,得.
所以当该产品的营销费用为6万元时,销售额为42.5万元.
故选:C.
6、答案:C
解析:由表格得为:,
中的
解得:,
,
当时,
.
故选:C.
7、答案:D
解析:
8、答案:C
解析:
9、答案:CD
解析:
10、答案:ABC
解析:
11、答案:8.5
解析:,,
样本点的中心的坐标为
代入,得,
解得:.
故答案为:8.5.
12、答案:189
解析:因为回归方程,
所以当时,,
所以可预测加工200个零件所用的时间约为189分钟,
故答案为:189.
13、答案:18.2
解析:根据题意,由于线性回归直线方程为,那么可知当时,,因此今年支出估计是18.2亿元.
14、答案:4
解析:,
,
回归直线经过样本中心,可得,解得.
故答案为:4.
15、答案:(1),(2)有
解析:(1)由题中表格中数据可得
,解得,
且,解得.
(2)由(1)可补充列联表为
| 喜欢 | 不喜欢 | 合计 |
年龄岁(含28岁) | 80 | 20 | 100 |
年龄岁(含40岁) | 60 | 40 | 100 |
合计 | 140 | 60 | 200 |
则,
所以有的把握认为顾客是否喜欢该食品与年龄有关.
16、答案:(1)应收集90位女生的样本数据.
(2)概率的估计值为0.75.
(3)有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.
解析:(1),所以应收集90位女生的样本数据.
(2)由频率分布直方图得,
所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.
(3)由2知,300名学生中有人的每周平均体育运动时间超过4个小时,
75人的每周平均体育运动时间不超过4个小时.
又因为样本数据中有210份是关于男生的,90份是关于女生的,
所以每周平均体育运动时间与性别的列联表如下:
平均体育运动时间与性别列联表
| 男生 | 女生 | 总计 |
每周平均体育运动时间 不超过4个小时 | 45 | 30 | 75 |
每周平均体育运动时间 超过4个小时 | 165 | 60 | 225 |
总计 | 210 | 90 | 300 |
结合列联表可算得的观测值.
所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.