所属成套资源:高二数学下学期期末考试分类汇编新人教A版(14份)
高二数学下学期期末考试分类汇编数据统计分析新人教A版
展开
这是一份高二数学下学期期末考试分类汇编数据统计分析新人教A版,共21页。试卷主要包含了单选题,解答题等内容,欢迎下载使用。
专题12 数据统计分析
一、单选题
1.(2022·全国·高二单元测试)已知变量、、都是正数,与的回归方程:,且每增加个单位,减少个单位,与的回归方程:,则( ).
A.与正相关,与正相关
B.与正相关,与负相关
C.与负相关,与正相关
D.与负相关,与负相关
【答案】D
【解析】:由题意与的回归方程:,且每增加1个单位,减少2个单位,变量,,都是正数,
可得:,又,故与正相关,与负相关,可得与负相关.
故选:D.
2.(2022·山东临沂·高二期中)用模型拟合一组数据时,设,将其变换后得到经验回归方程为,则( )
A. B. C. D.2
【答案】D
【解析】解:,
两边取对数,可得,
令,可得,
经验回归方程,
,,
令,则,所以是,当时,
所以当时取得极大值,即最大值,又,所以.
所以
故选:D
3.(2022·山东临沂·高二期中)如图,在一组样本数据,,,,的散点图中,若去掉后,则下列说法正确的为( )
A.相关系数r变小,决定系数变小 B.相关系数r变大,决定系数变小
C.相关系数r变大,决定系数变大 D.相关系数r变小,决定系数变大
【答案】C
【解析】从散点图分析可知,只有D点偏离直线较远,去掉D点后,x与y的线性相关程度变强,相关系数r变大,决定系数变大.
故选:C
4.(2022·辽宁·高二期中)某工厂节能降耗技术改造后,在生产某产品过程中记录的产量(吨)与相应的生产能耗(吨)的几组对应数据如下表,现发现表中有个数据看不清,已知回归直线方程为,则看不清的数据★的值为( )
★
A. B. C. D.
【答案】A
【解析】设看不清的数据★的值为,则,,
将样本中心点的坐标代入回归直线方程可得,解得.
故选:A.
5.(2022·新疆·乌市八中高二期中)设某中学的高中女生体重(单位:与身高(单位:)具有线性相关关系,根据一组样本数据,用最小二乘法近似得到回归直线方程为,则下列结论中不正确的是( )
A.与具有正线性相关关系
B.回归直线过样本的中心点
C.若该中学某高中女生身高增加,则其体重约增加
D.若该中学某高中女生身高为,则可断定其体重必为
【答案】D
【解析】由于线性回归方程中的系数为,因此与具有正的线性相关关系,A正确;
由线性回归方程必过样本中心点,因此B正确;
由线性回归方程中系数的意义知,每增加,其体重约增加,C正确;
当某女生的身高为时,其体重估计值是,而不是确定值,因此D错误.
故选:D.
6.(2022·广西·钦州一中高二期中(理))下对于两个变量和进行回归分析,得到一组样本数据:,,,,则下列说法正确的是( )
①由样本数据得到的回归直线必经过样本点中心
②用来刻画回归效果,的值越小,说明模型的拟合效果越好
③残差平方和越小的模型,拟合的效果越好
④用相关系数来衡量两个变量之间线性关系的强弱时,越接近于,相关性越弱;
A.①② B.①③④ C.①②③ D.①③
【答案】D
【解析】:由题意得:
样本中心点在回归直线上,故①正确;
越大拟合效果越好,故②不正确;
残差平方和越小的模型,拟合效果越好,故③正确;
用相关系数来衡量两个变量之间线性关系的强弱时,越接近于,相关性越强,故④不正确.
故选:D
7.(2022·河南·高二阶段练习(文))给出以下四个说法:
①残差点分布的带状区域的宽度越窄相关指数越小;
②若两个变量的线性相关性越强,则相关系数的绝对值越接近于1;
③在回归直线方程中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位;
④对分类变量X与Y,若它们的随机变量的观测值越小,则判断“X与Y有关系”的把握程度越大.
其中正确的说法是( )
A.①④ B.②④ C.①③ D.②③
【答案】D
【解析】对于①,残差点分布的带状区域的宽度越窄相关指数越大,所以①错误,
对于②,若两个变量的线性相关性越强,则相关系数的绝对值越接近于1,所以②正确,
对于③,在回归直线方程中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位,所以③正确,
对于④,对分类变量X与Y,若它们的随机变量的观测值越小,则判断“X与Y有关系”的把握程度越小,所以④错误,
故选:D
二、解答题
8.(2022·安徽·六安一中高二期中)流行性感冒(简称流感)是流感病毒引起的急性呼吸道感染,是一种传染性强、传播速度快的疾病.其主要通过空气中的飞沫、人与人之间的接触或与被污染物品的接触传播.流感每年在世界各地均有传播,在我国北方通常呈冬春季流行,南方有冬春季和夏季两个流行高峰,某幼儿园将去年春季该园患流感小朋友按照年龄与人数统计,得到如下数据:
年龄x
2
3
4
5
6
患病人数y
22
22
17
14
10
(1)求y关于x的线性回归方程;
(2)计算变量x,y的样本相关系数r(计算结果精确到0.01),并判断是否可以认为该幼儿园去年春季患流感人数与年龄负相关程度很强.(若,则x,y相关程度很强;若,则x,y相关程度一般;若,则x,y相关程度较弱.)
参考数据:.参考公式:相关系数,
线性回归方程
【答案】(1)
(2), y与x之间的线性相关关系很强
【解析】(1)由表中数据和附注中的参考数据,得
,,
,
,
,
所以,,
所以y关于x的线性回归方程是;
(2)
,因为,所以y与x之间的线性相关关系很强.
9.(2022·河北·高二期中)某科技公司研发了一项新产品A,经过市场调研,对公司1月份至7月份的推广费用以及销售量进行统计,推广费用x(万元)和销售量y(万件)之间的一组数据如下表所示;
月份i
1
2
3
4
5
6
7
推广费用
2
3
4
5
6
8
10
销售量
2.5
3
4
4.5
6
8
8.5
(1)试根据1月份至5月份的数据,建立.y关于x的回归直线方程;
(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差都不超过0.7万件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?
参考公式:回归直线方程,其中
【答案】(1)
(2)可以认为(1)中所得到的回归直线方程是理想的
【解析】.
(1)因为.
,
,
所以,
所以,于是关于的回归直线方程为.
(2)
当时,,则,
当时,,则,
故可以认为(1)中所得到的回归直线方程是理想的.
10.(2022·陕西·榆林市第十中学高二期中(理))“冰桶挑战赛”是一项社交网络上发起的慈善公益活动,活动规定:被邀请者要么在24小时内接受挑战,要么选择为慈善机构捐款(不接受挑战),并且不能重复参加该活动.若被邀请者接受挑战,则他需在网络上发布自己被冰水浇遍全身的视频内容,然后便可以邀请另外3个人参与这项活动.假设每个人接受挑战与不接受挑战是等可能的,且互不影响.
(1)若某参与者接受挑战后,对其他3个人发出邀请,则这3个人中至少有2个人接受挑战的概率是多少?
(2)为了解冰桶挑战赛与受邀者的性别是否有关,某调查机构进行了随机抽样调查,调查得到如下2×2列联表:
接受挑战
不接受挑战
合计
男性
45
15
60
女性
25
15
40
合计
70
30
100
根据表中数据,能否有90%的把握认为“冰桶挑战赛与受邀者的性别有关”?
附:
P(K2≥k0)
0.100
0.050
0.010
0.001
k0
2.706
3.841
6.635
10.828
【答案】(1)3个人中至少有2个人接受挑战的概率是;
(2)没有90%的把握认为“冰桶挑战赛与受邀者的性别有关”.
【解析】(1)
设3个人中接受挑战的人数为,则随即变量的所有可能值为0,1,2,3
,
,
∴随即变量的分布列是
0
1
2
3
P
事件3个人中至少有2个人接受挑战可表示为,又,
所以事件3个人中至少有2个人接受挑战的概率为,
(2)
假设冰桶挑战赛与受邀者的性别无关,根据列联表,得到的观测值为:,
因为,,
所以没有90%的把握认为“冰桶挑战赛与受邀者的性别有关”.
11.(2022·浙江·高二阶段练习)龙井茶的最佳饮用温度为,某班同学对一杯温度的龙井茶放置多长时间到达最佳饮用温度展开研究.用不同口径的茶杯盛放温度的龙井茶,记录放置时的水温,得下表.
口径
温度
63
60
口径
温度
(1)根据所给数据,完成列联表,并判断是否有的把握认为茶杯的口径大小与茶水的温度变化的快慢有关?;
冷却至时间
总计
小口径(口径
大口径(口径
总计
(2)现用口径的茶杯盛放温度的龙井茶,记录茶水温度冷却过程中“水温”和“时间"的关系如下表,并作出散点图.根据散点图,该班两个小组的学生分别选择和模型拟合“水温”和“时间”的关系,经过数据处理和计算,得到表格信息如下.根据上述信息,求出模型一关于的回归方程(精确到),并用决定系数分析哪个模型拟合上度更优.
时间
0
1
2
3
4
5
6
7
8
9
10
口径温度
85
83
63
回归方程
残差平方和
总偏差平方和
模型一
600
模型二
6
600
参考数据:
385
参考公式:
【答案】(1)填表见解析;有的把握认为茶杯的口径大小与茶水的温度变化的快慢有关
(2);模型二的拟合度优于模型一
【解析】(1)
冷却至时间
总计
小口径口径
4
6
10
大口径口径
8
2
10
总计
12
8
20
有的把握认为茶杯的口径大小与茶水的温度变化的快慢有关.
(2)
.
模型一的回归方程:.
模型一决定系数.
模型二决定系数.
,
模型二的拟合度优于模型一.
一、单选题
1.(2022·全国·高二课时练习)如图是国家统计周公布的2020年下半年快递运输量情况,请根据图中信息选出错误的选项( )
A.2020年下半年,同城和异地快递量最高均出现在11月
B.2020年10月份异地快递增长率小于9月份的异地快递增长率(注.增长率指相对前一个月而言)
C.2020年下半年,异地快递量与月份呈正相关关系
D.2020年下半年,每个月的异地快递量都是同城快递量的6倍以上
【答案】D
【解析】对于A,由图可看出,同城和异地快递量最高都在11月份,故A正确;
对于B,因为,9月异地快递增长率明显高于10月异地快递增长率,故B正确;
对于C,由图可看出,除2020年12月异地快递量较11月略少,其余都有较明显增加,因此可以判断异地快递量与月份呈正相关关系,故C正确;
对于D,2020年7月的异地快递量为572812.9万件,同城快递量为105191.1万件,异地快递量不到同城快递量的6倍,故D不正确.
故选:D.
2.(2022·全国·高二单元测试)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )
A. B.
C. D.
【答案】D
【解析】由散点图分布可知,散点图分布在一个对数函数的图象附近,
因此,最适合作为发芽率和温度的回归方程类型的是.
故选:D.
3.(2022·黑龙江·双鸭山一中高二期中)对两个变量和进行回归分析,得到一组样本数据,,…,则下列说法不正确的是( )
A.若变量和之间的相关系数为,则变量和之间具有较强的线性相关关系
B.残差平方和越小的模型,拟合的效果越好
C.用决定系数来刻画回归效果,越小说明拟合效果越好
D.在残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高
【答案】C
【解析】变量和之间的相关系数为越大,则变量和之间具有较强的线性相关关系,故A正确;
残差平方和越小的模型,拟合的效果越好,故B正确;
用决定系数来刻画回归效果,越大说明拟合效果越好,故C错误;
在残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高,故D正确.
故选:C.
4.(2022·全国·高二课时练习)下列关于独立性检验的叙述:
①常用等高条形图展示列联表数据的频率特征;
②独立性检验依据小概率原理;
③样本不同,独立性检验的结论可能有差异;
④对分类变量与的随机变量的观测值来说,越小,与有关系的把握程度就越大.
其中正确的个数为
A.1 B.2 C.3 D.4
【答案】C分析:根据独立性检验的定义及思想,可得结论.
详解:①常用等高条形图展示列联表数据的频率特征;正确;
②独立性检验依据小概率原理;正确;
③样本不同,独立性检验的结论可能有差异;正确;
④对分类变量与的随机变量的观测值来说,越大,与有关系的把握程度就越大.故④错误.
故选C.
二、多选题
5.(2022·全国·高二单元测试)下列说法中,正确的命题是( ).
A.以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则、的值分别是和
B.设有一个回归直线方程,变量增加个单位时,平均增加个单位
C.线性回归方程必经过样本点的中心
D.已知一系列样本点()的回归直线方程,若样本点与的残差相等,则
【答案】ACD
【解析】∵,
∴两边取对数,可得,
令,可得,∵,
∴,即,,A选项对;
若有一个回归直线方程,随着的增大,会减小,B选项错;
线性回归方程必经过样本点的中心,C选项对;
回归直线方程为,且样本点与的残差相等,
则,D选项对.
故选:ACD.
6.(2022·湖南·南县第一中学高二期中)对两组数据进行统计后得到的散点图如图所示,关于其线性相关系数的结论正确的是( )
A. B.
C. D.与的大小关系无法判断
【答案】AB
【解析】由图可知,第一幅图负相关,第二幅图正相关,故A,B正确;第二幅图中的点比第一幅图中的点更趋于一直线附近,故第二幅图的相关性比第一幅图的相关性强,故,CD错误.
故选:
7.(2022·浙江·高二阶段练习)某淘宝商家想通过软件广告推荐功能吸引潜在客户.为使广告能够精准投放达到利益最大化,随机抽取了200名在本店一季度消费过的客户数据,现统计如下:
按照年龄分为年轻人(14607,即,
即,,模型①的相关指数小于模型②的,
说明回归模型②的拟合效果更好.
2021年时,,
预测旅游人数为(万人).
12.(2022·浙江嘉兴·高二期中)新冠肺炎疫情期间,各地均响应“停课不停学,停课不停教”的号召开展网课学习.为检验网课学习效果,某机构对名学生进行了网上调查,发现有些学生上网课时有家长在旁督促,而有些没有网课结束后进行考试,根据考试结果将这名学生分成“成绩上升”和“成绩没有上 升”两类,对应的人数如下表所示:
成绩上升
成绩没有上升
合计
有家长督促的学生
500
800
没有家长督促的学生
500
没有家长督促的学生
2000
(1)完成以上列联表,并通过计算(结果精确到)说明,是否有的把握认为家长督促学生上网课与学生的成绩上升有关联
(2)从有家长督促的名学生中按成绩是否上升,采用分层抽样的方法抽出人,再从人中 随机抽取 3人做进一步调查,记抽到名成绩上升的学生得分,抽到名成绩没有上升的学生得分,抽到名生的总得分用表示,求的分布列和数学期望.
附:
【答案】(1)列联表见解析,有的把握认为家长督促学生上网课与学生的成绩上升有关联;(2)分布列见解析,数学期望为.
【解析】(1)
成绩上升
成绩没有上升
合计
有家长督促的学生
500
300
800
没有家长督促的学生
700
500
1200
没有家长督促的学生
1200
800
2000
有的把握认为家长督促学生上网课与学生的成绩上升有关联.
(2)从有家长督促的名学生中按成绩是否上升,采用分层抽样的方法抽出人,其中成绩上升的有人,成绩没有上升的有人,再从人中随机抽取人,随机变量所有可能的取值为
的分布列如下:
-3
-1
1
8
相关试卷
这是一份高二数学下学期期末考试分类汇编直线与圆的方程新人教A版,共14页。试卷主要包含了故选等内容,欢迎下载使用。
这是一份高二数学下学期期末考试分类汇编椭圆新人教A版,共24页。
这是一份高二数学下学期期末考试分类汇编双曲线方程新人教A版,共22页。