2021年高考数学一轮复习夯基练习:变量间的相关关系与统计案例(含答案)
展开夯基练习 变量间的相关关系与统计案例
一 、选择题
1.下列说法中不正确的是( )
A回归分析中,变量x和y都是普通变量
B变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定
C回归系数可能是正的也可能是负的
D如果回归系数是负的,y的值随x的增大而减小
2.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m,如下表:
则试验结果体现A,B两变量有更强的线性相关性的是( )
A.甲 B.乙 C.丙 D.丁
3.对于线性相关系数r,下列说法正确的是( )
A、,越大,相关程度越大;反之,相关程度越小
B、,r越大,相关程度越大;反之,相关程度越小
C、≤1,且越接近于1,相关程度越大;越接近于0,相关程度越小
D、以上说法都不正确
4.观察下面频率等高条形图,其中两个分类变量x,y之间关系最强的是( )
5.若变量y与x之间的相关系数r=-0.9362,查表得到相关系数临界值r0.05=0.8013,则变量y与x之间( )
A、不具有线性相关关系 B、具有线性相关关系
C、它们的线性关系还要进一步确定 D、不确定
6.根据如下样本数据:
得到的回归方程为=bx+a,则( )
A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<0
7.为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用线性回归方法,求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法正确的是( )
A.l1和l2有交点(s,t)
B.l1与l2相交,但交点不一定是(s,t)
C.l1与l2必定平行
D.l1与l2必定重合
8.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=0.5x+1上,则这组样本数据的样本相关系数为( )
A.-1 B.0 C.0.5 D.1
9.下表提供了某厂节能降耗技术改造后在生产某产品的过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据,根据下表提供的数据,求出y关于x的线性回归方程为=0.7x+0.35,则下列结论错误的是( )
A.回归直线一定过点(4.5,3.5)
B.产品的生产能耗与产量呈正相关
C.t的值为3.15
D.该产品每多生产1吨,则相应的生产能耗约增加0.7吨
10.变量y与x之间的回归方程( )
A.表示y与x之间的函数关系
B.表示y和x之间的不确定关系
C.反映y和x之间真实关系的形式
D.反映y与x之间的真实关系达到最大限度的吻合
11.为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系.设其回归直线方程为=x+.已知i=225,i=1600,=4.该班某学生的脚长为24,据此估计其身高为( )
A.160 B.163 C.166 D.170
12.已知x与y之间的几组数据如下表:
假设根据上表数据所得线性回归直线方程为=x+.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( )
A.>b′,>a′ B.>b′,<a′ C.<b′,>a′ D.<b′,<a′
二 、填空题
13.叫做变量y与x之间的相关系数。
14.有下列关系:① 人的年龄与他(她)拥有的财富之间的关系;② 曲线上的点与该点的坐标之间的关系;③ 苹果的产量与气候之间的关系;④ 森林中的同一种树木,其断面直径与高度之间的关系;⑤ 学生与他(她)的学号之间的关系、其中有相关关系的是 。
15.自变量取值一定时,因变量的取值 两个变量之间的关系叫做相关关系。与函数关系 ,相关关系是一种 。
16.以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln y,其变换后得到线性回归方程z=0.3x+4,则c=________.
三 、解答题
17.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).
K2=.
18.随机选取15家销售公司,由营业报告中查出其上年度的广告费x(占总费用的百分比)及盈利额y(占销售总额的百分比)列表如下:
x | 1.5 | 0.8 | 2.6 | 1.0 | 0.6 | 2.8 | 1.2 | 0.9 |
y | 3.1 | 1.9 | 4.2 | 2.3 | 1.6 | 4.9 | 2.8 | 2.1 |
x | 0.4 | 1.3 | 1.2 | 2.0 | 1.6 | 1.8 | 2.2 |
|
y | 1.4 | 2.4 | 2.4 | 3.8 | 3.0 | 3.4 | 4.0 |
|
试根据上述资料:
画出散点图;
计算出这两组变量的相关系数;
在显著水平0、05的条件下,对变量x与y进行相关性检验;
如果变量x与y之间具有线性相关关系,求出回归直线防城;
已知某销售公司的广告费占其总费用的1、7%,试估计其盈利净额占销售总额的百分比。
19.下面是一周内某地申领结婚证的新郎与新娘的年龄,记作(新郎年龄y,新娘年龄x):
(37,30),(30,27),(65,56),(45,40),(32,30),(28,26),(45,31),(29,24),(26,23),(28,25),(42,29),(36,33),(32,29),(24,22),(32,33),(ZI,29),(37,46),(28,25),(33,34),(21,23),(24,23),(49,44),(28,29),(30,30),(24,25),(22,23),(68,60),(25,25),(32,27),(42,37),(24,24),(24,22),(28,27),(36,31),(23,24),(30,26)
以下考虑y关于x的回归问题:
(1)如果每个新郎和新娘都同岁,穿过这些点的回归直线的斜率和截距等于什么?
(2)如果每个新郎比他的新娘大5岁,穿过这些点的回归直线的斜率和截距等于什么?
(3)如果每个新郎比他的新娘大10%,穿过这些点的回归直线的斜率和截距等于什么?
(4)对于上面的实际年龄作出回归直线;
(5)从这条回归直线,你对新娘和新郎的年龄模型可得出什么结论?
20.某电视厂家准备在元旦期间举办促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费xi(万元)和销售量yi(万台)的数据如下.
(1)若用线性回归模型拟合y与x的关系,求出y关于x的线性回归方程;
(2)若用y=c+d模型拟合y与x的关系可得回归方程=1.63+0.99,经计算线性回归模型及该模型的R2分别为0.75和0.88,请用R2说明选择哪个回归模型更好;
(3)已知利润z与x,y的关系为z=200y-x,根据(2)的结果,当广告费x=20时,销售量及利润的预报值是多少?
参考公式:=,=- .参考数据:≈2.24.
参考答案
1.A;
2.答案为:D;
解析:r越大,m越小,线性相关性越强,丁同学的试验结果体现A,B两变量有更强的线性相关性.故选D.
3.C;
4.答案为:D
解析:在频率等高条形图中,与相差很大时,我们认为两个分类变量有关系,在四个选项中(等高的条形图)中,若x1,x2所占比例相差越大,则分类变量x,y的相关性越强.故选D.
5.B
6.答案为:B.
解析:在平面直角坐标系中描点作出散点图(图略),观察图象可知,
回归直线=bx+a的斜率b<0,截距a>0.故选B.
7.答案为:A
解析:由题意知(s,t)是甲、乙两位同学所做试验的样本点的中心,而线性回归直线恒过样本点的中心.故选A.
8.答案为:D
解析:由题设知,这组样本数据完全正相关,故其相关系数为1.故选D.
9.答案为:C.
解析:=(3+4+5+6)==4.5,则=0.7×4.5+0.35=3.5,即回归直线一定过点(4.5,3.5),
故A正确.∵0.7>0,∴产品的生产能耗与产量呈正相关,故B正确.
∵=(2.5+t+4+4.5)=3.5,∴t=3,故C错误.该产品每多生产1吨,
则相应的生产能耗约增加0.7吨,故D正确.
10.D;
11.答案为:C;
解析:∵i=225,∴=i=22.5.∵i=1600,∴=i=160.
又=4,∴=-=160-4×22.5=70.∴回归直线方程为=4x+70.
将x=24代入上式得=4×24+70=166.故选C.
12.答案为:C;
解析:
由两组数据(1,0)和(2,2)可求得直线方程为y=2x-2,从而b′=2,a′=-2.
而利用线性回归方程的公式与已知表格中的数据,可求得===,
=-=-×=-,所以<b′,>a′.选C.
二 、填空题
13.
14.①③④
15.带有一定随机性的 不同 非确定性关系
16.答案为:e4
解析:因为y=cekx,所以两边取对数,可得ln y=ln (cekx)=ln c+ln ekx=ln c+kx,令z=ln y,
可得z=ln c+kx.因为z=0.3x+4,所以ln c=4,所以c=e4.
三 、解答题
17.解:
(1)记B表示事件“旧养殖法的箱产量低于50 kg”,
C表示事件“新养殖法的箱产量不低于50 kg”.
由题意知P(A)=P(BC)=P(B)P(C).
旧养殖法的箱产量低于50 kg的频率为
(0.012+0.014+0.024+0.034+0.040)×5=0.62,
故P(B)的估计值为0.62.
新养殖法的箱产量不低于50 kg的频率为
(0.068+0.046+0.010+0.008)×5=0.66,
故P(C)的估计值为0.66.
因此,事件A的概率的估计值为0.62×0.66=0.4092.
(2)根据箱产量的频率分布直方图得列联表
由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg的直方图面积为
(0.004+0.020+0.044)×5=0.34<0.5,箱产量低于55 kg的直方图面积为
(0.004+0.020+0.044+0.068)×5=0.68>0.5,
故新养殖法产量的中位数的估计值为50+≈52.35(kg).
18.解:(1)散点图(略)
(2)这两组变量的相关系数是r=0、98831;
(3)在显著水平0、01的条件下进行相关系数的统计检验:查表求得在显著水平0、01和自由度15-2=13的相关系数临界值=0、641,因r=0、98831〉,这说明两变量之间存在显著的线性关系;
(4)线性回归方程是:y=1、41468x+0、82123
(5)当x=1、7时,由回归方程得y=3、23,捷克估算其盈利净额占销售总额的3、23%。
19.解(1)斜率为1,截距为0;(2)斜率为1,截距为5;(3)斜率为1.1,截距为0;(4)回归直线为:新郎年龄=-1.133+1.118×新娘年龄(=30.3333,lxx=2804,=32.7778,lxy=3134.67,=1.118,=-1.133).
(5)从(4)的回归方程可见,新郎的年龄一般比新娘大,尤其是在大龄夫妇中.
20.解:
(1)∵=8,=4.2,iyi=279.4,=708,
===0.17,=- =4.2-0.17×8=2.84.
∴y关于x的线性回归方程为=0.17x+2.84.
(2)R2越大反映残差平方和越小,拟合效果越好,
∵0.75<0.88,
∴选用非线性回归模型=1.63+0.99更好.
(3)由(2)知,当x=20时,销售量的预报值=1.63+0.99≈6.06(万台),
利润的预报值=200×(1.63+0.99)-20≈1 191.48(万元).