全国统考2022版高考数学大一轮复习第12章统计与统计案例第2讲变量间的相关关系与统计案例1备考试题(含解析)
展开第十二章 统计与统计案例
第二讲 变量间的相关关系与统计案例
x | 1 | 2 | 3 | 4 | 5 |
y | 5 | t | m | 10 | 12 |
练好题·考点自测
1.[2021福建模拟]下列四个命题说法正确的是 ( )
①在回归分析中,R2可以用来刻画回归效果,R2的值越大,模型的拟合效果越好;
②在独立性检验中,随机变量K2的值越大,说明两个分类变量有关系的可能性越大;
③在回归方程=0.2x+12中,当解释变量x每增加1个单位时,预报变量平均增加1个单位;
④两个随机变量相关性越弱,则相关系数的绝对值越接近于1.
A.①④ B.②④ C.①② D.②③
2.[2020全国卷Ⅰ,5,5分][文]某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到如图12-2-1所示的散点图:
图12-2-1
由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是 ( )
A.y=a+bx B.y=a+bx2
C.y=a+bex D.y=a+blnx
3.[2017山东,5,5分]为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为x+,已知xi=225,yi=1 600,=4.该班某学生的脚长为24,据此估计其身高为 ( )
A.160 B.163 C.166 D.170
4.[2021四省八校联考]具有线性相关关系的两个变量x,y的取值如表,
其回归直线x+经过点(3,8)的一个充分不必要条件是 ( )
A.t+m=13 B.t=m=6
C.t=m=7 D.t=6,m=7
5.[2021湖南模拟]通过随机询问100名大学生是否爱好踢毽子,得到如下列联表:
| 男 | 女 | 总计 |
爱好 | 10 | 40 | 50 |
不爱好 | 20 | 30 | 50 |
总计 | 30 | 70 | 100 |
P(K2≥k0) | 0.10 | 0.05 | 0.025 | 0.010 |
k0 | 2.706 | 3.841 | 5.024 | 6.635 |
附:
K2=,其中n=a+b+c+d.
下列结论正确的是 ( )
A.在犯错误的概率不超过5%的前提下,认为“爱好踢毽子与性别有关”
B.在犯错误的概率不超过5%的前提下,认为“爱好踢毽子与性别无关”
C.有97.5%以上的把握认为“爱好踢毽子与性别有关”
D.有97.5%以上的把握认为“爱好踢毽子与性别无关”
拓展变式
1.某芯片公司为制订下一年的研发投入计划,需了解年研发资金投入量xi(单位:亿元)对年销售额yi(单位:亿元)的影响.该公司对历史数据进行对比分析,建立了两个函数模型:①y=α+βx2,②y=eλx+t,其中α,β,λ,t均为常数,e为自然对数的底数.
现该公司收集了近12年的年研发资金投入量xi和年销售额yi的数据,i=1,2,…,12,并对这些数据作了初步处理,得到了如图12-2-3所示的散点图及一些统计量的值.
图12-2-3
令ui=x2,vi=ln yi(i=1,2,…,12),经计算得如下数据:
(xi)2 | (yi)2 | ||||
20 | 66 | 770 | 200 | 460 | 4.20 |
(ui)2 | (ui)· (yi) | (vi)2 | (xi)· (vi) |
3 125 000 | 21 500 | 0.308 | 14 |
(1)设{ui}和{yi}的相关系数为r1,{xi}和{vi}的相关系数为r2,请从相关系数的角度,选择一个拟合程度更好的模型.
(2)①根据(1)的选择及表中数据,建立y关于x的回归方程(系数精确到0.01);
②若下一年销售额y需达到90亿元,预测下一年的研发资金投入量x是多少亿元?
附:相关系数r=,
回归直线x中斜率和截距的最小二乘估计公式分别为,;
参考数据:308=4×77,≈9.486 8,e4.499 8≈90.
2.[2020全国卷Ⅲ,18,12分][文]某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次 空气质量等级 | [0,200] | (200,400] | (400,600] |
1(优) | 2 | 16 | 25 |
2(良) | 5 | 10 | 12 |
3(轻度污染) | 6 | 7 | 8 |
4(中度污染) | 7 | 2 | 0 |
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
| 人次≤400 | 人次>400 |
空气质量好 |
|
|
空气质量不好 |
|
|
附:K2=,
P(K2≥k) | 0.050 | 0.010 | 0.001 |
k | 3.841 | 6.635 | 10.828 |
3.在红外线照射下,组织温度升高,毛细血管扩张,血流加快,物质代谢增强,组织细胞活力及再生能力提高,因此红外线治疗仪对某些疾病的治疗有着很好的作用.某药店兼营某红外线治疗仪,经过近5个月的营销,对销售状况进行相关数据分析,发现月销售量与销售价格有关,统计数据如下表:
每台红外线治疗仪的销售价格x/元 | 140 | 150 | 160 | 170 | 180 |
红外线治疗仪的月销售量y/台 | 64 | 55 | 45 | 35 | 26 |
(1)根据表中数据求y关于x的线性回归方程.
(2)(i)每台红外线治疗仪的价格为165元时,预测红外线治疗仪的月销售量;(四舍五入为整数)
(ii)若该红外线治疗仪的成本为120元/台,要使每月获得最大的纯收益,利用(1)中结论,问每台红外线治疗仪的销售价格应定为多少?(四舍五入,精确到1元)
参考公式:回归直线方程x+,其中,.
4.[2020广州二模]全民健身旨在全面提高国民体质和健康水平,倡导全民做到每天参加一次以上健身活动,学会两种以上健身方法,每年进行一次体质测定(简称体测).为响应全民健身号召,某单位在职工体测后就某项健康指数(百分制)随机抽取了30名职工的体测数据作为样本,具体
图12-2-7
数据的茎叶图如图12-2-7所示,其中有1名女职工的健康指数的数据模糊不清(用x表示),已知这30名职工的健康指数的平均数为76.2.
(1)根据茎叶图,求样本中男职工健康指数的众数和中位数;
(2)根据茎叶图,按男、女用分层抽样的方法从这30名职工中随机抽取5人,再从抽取的5人中随机抽取2人,求抽取的2人都是男职工的概率;
(3)经计算,样本中男职工健康指数的平均数为81,女职工现有数据(即剔除x)健康指数的平均数为69,方差为190,求样本中所有女职工的健康指数的平均数和方差(结果精确到0.1).
答 案
第十二章 统计与统计案例
第二讲 变量间的相关关系与统计案例
1.C 由R2与K2的公式及性质可知,①②正确;在回归方程=0.2x+12中,当解释变量x每增加1个单位时,预报变量平均增加0.2个单位,③错误;两个随机变量相关性越强,则相关系数的绝对值越接近于1,④错误;故选C.
2.D 根据题中散点图可知,散点图中点的分布形状与对数函数的图象类似,故选D.
3.C 由题意可知=4x+,又=22.5,=160,因此160=22.5×4+,故=70,因此=4x+70.当x=24时,=4×24+70=96+70=166.故选C.
4.D 由表格数据,得 =3,.因为回归直线 x+必经过样本点的中心(,)(求回归直线方程的关键是抓住样本点的中心在回归直线上),且回归直线经过点(3,8),所以点(3,8)为回归直线 x+样本点的中心(题眼),所以=8,所以t+m=13,结合选项,知t=6,m=7是回归直线 x+经过点(3,8)的一个充分不必要条件(要求充分不必要条件而非充分条件,注意看题),故选D.
5.A 由题意得K2的观测值k=≈4.762>3.841,可得在犯错误的概率不超过5%的前提下,认为“爱好踢毽子与性别有关”,所以A正确,故选A.
1.(1)由题意,r1==0.86,r2=≈0.91,
则|r1|<|r2|,因此从相关系数的角度,模型y=eλx+t的拟合程度更好.
(2)①先建立v关于x的线性回归方程,
由y=eλx+t,得ln y=t+λx(两边同时取以e为底的对数),即v=t+λx(将非线性回归方程转化为线性回归方程);
由于λ=≈0.018,
t=λ=4.20-0.018×20=3.84,
所以v关于x的线性回归方程为=0.02x+3.84(系数精确到0.01,即0.018精确为0.02),
所以ln =0.02x+3.84,则=e0.02x+3.84.
②下一年销售额y需达到90亿元,即y=90,
代入=e0.02x+3.84,得90=e0.02x+3.84,
又e4.499 8≈90,所以4.499 8≈0.02x+3.84,
所以x≈=32.99,
所以下一年的研发资金投入量约是32.99亿元.
【方法技巧】常见非线性回归方程的转换方式
|
2. (1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如表:
空气质量等级 | 1 | 2 | 3 | 4 |
概率的估计值 | 0.43 | 0.27 | 0.21 | 0.09 |
(2)一天中到该公园锻炼的平均人次的估计值为(100×20+300×35+500×45)=350.
(3)根据所给数据,可得2×2列联表如下:
| 人次≤400 | 人次>400 |
空气质量好 | 33 | 37 |
空气质量不好 | 22 | 8 |
根据列联表得K2的观测值k=≈5.820.
由于5.820>3.841,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
3.(1)=160,
=45,
(xi)2=(140-160)2+(150-160)2+(160-160)2+(170-160)2+(180-160)2=1 000,(xi)(yi)=-20×19-10×10+0×0-10×10-20×19=-960,
∴^b==-0.96,
∴^b=45+0.96×160=198.6,
∴y关于x的回归方程为=-0.96x+198.6.
(2)(i)由(1)知,当x=165时,=-0.96×165+198.6=40.2≈40,即每台红外线治疗仪的价格为165元时,红外线治疗仪的月销售量为40台.
(ii)药店每月获得的纯收益Q(x)=(-0.96x+198.6)(x-120)=-0.96x2+313.8x-23 832,
∴当x=≈163时,Q(x)取得最大值,
即要使每月获得最大的纯收益,每台红外线治疗仪的销售价格应定为163元.
4.(1)由茎叶图可知,样本中男职工健康指数的众数为76,
中位数为=81.
(2)由于是分层抽样,因此抽取的5人中男职工有5×=3(人),分别记为A,B,C;女职工有2人,分别记为a,b.从5人中随机抽取2人的情况有:(A,B),(A,C),(A,a),(A,b),(B,C), (B,a),(B,b),(C,a), (C,b),(a,b), 共10种. 其中这2人都是男职工的情况有:(A,B),(A,C),(B,C),共3种.设“抽取的2人都是男职工”为事件D,所以所求概率P(D)=.
(3)因为样本中男职工健康指数的平均数为81,样本中女职工现有数据(即剔除x)健康指数的平均数为69,所以样本中所有女职工健康指数的平均数为=69.
则被剔除的女职工的健康指数为69×12-69×11=69,即x=9.
因为样本中女职工现有数据(即剔除x)健康指数的方差为190,
所以样本中所有女职工健康指数的方差为≈174.2.
高中数学高考2 第2讲 变量间的相关关系与统计案例: 这是一份高中数学高考2 第2讲 变量间的相关关系与统计案例,共19页。试卷主要包含了变量间的相关关系,两个变量的线性相关,独立性检验,下面是2×2列联表等内容,欢迎下载使用。
(新高考)高考数学一轮复习考点复习讲义第63讲《变量间的相关关系、统计案例》(讲)(解析版): 这是一份(新高考)高考数学一轮复习考点复习讲义第63讲《变量间的相关关系、统计案例》(讲)(解析版),共11页。试卷主要包含了变量间的相关关系,两个变量的线性相关,独立性检验等内容,欢迎下载使用。
高考数学大一轮复习第12章统计与统计案例第1讲随机抽样与用样本估计总体1试题文含解析: 这是一份高考数学大一轮复习第12章统计与统计案例第1讲随机抽样与用样本估计总体1试题文含解析,共7页。试卷主要包含了1C等内容,欢迎下载使用。