6.2021年高考数学(理)总复习(高考研究课件 高考达标检测 教师用书)第十六单元 统计与统计案例 (8份打包)
展开高考达标检测(四十八)变量间的相关关系、统计案例
一、选择题
1.相关变量x,y的样本数据如下表:
x | 1 | 2 | 3 | 4 | 5 |
y | 2 | 2 | 3 | 5 | 6 |
经回归分析可得y与x线性相关,并由最小二乘法求得回归直线方程为=1.1x+a,则a=( )
A.0.1 B.0.2
C.0.3 D.0.4
解析:选C ∵回归直线经过样本点的中心(,),且由题意得(,)=(3,3.6),∴3.6=1.1×3+a,∴a=0.3.
2.(2016·江西南昌一模)某商品的销售量y(件)与销售价格x(元/件)存在线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为 =-10x+200,则下列结论正确的是( )
A.y与x具有正的线性相关关系
B.若r表示变量y与x之间的线性相关系数,则r=-10
C.当销售价格为10元时,销售量为100件
D.当销售价格为10元时,销售量为100件左右
解析:选D y与x具有负的线性相关关系,所以A项错误;当销售价格为10元时,销售量在100件左右,因此C错误,D正确;B项中-10是回归直线方程的斜率.
3.(2016·山东泰安二模)登山族为了了解某山高y(km)与气温x(℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表:
气温(℃) | 18 | 13 | 10 | -1 |
山高(km) | 24 | 34 | 38 | 64 |
由表中数据,得到线性回归方程=-2x+.由此估计山高为72(km)处气温的度数为( )
A.-10 B.-8
C.-6 D.-4
解析:选C 因为=10,=40,所以样本中心点为(10,40),因为回归直线过样本中心点,所以40=-20+,即=60,所以线性回归方程为=-2x+60,所以山高为72(km)处气温的度数为-6,故选C.
4.(2016·常德一模)某机构为了解某地区中学生在校月消费情况,随机抽取了100名中学生进行调查,将月消费金额不低于550元的学生称为“高消费群”,调查结果如表所示:
| 高消费群 | 非高消费群 | 合计 |
男 | 15 | 35 | 50 |
女 | 10 | 40 | 50 |
合计 | 25 | 75 | 100 |
参照公式,得到的正确结论是( )
参考公式:K2=,
其中n=a+b+c+d.
P(K2≥k0) | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 |
k0 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
A.有90%以上的把握认为“高消费群与性别有关”
B.没有90%以上的把握认为“高消费群与性别有关”
C.在犯错误的概率不超过1%的前提下,认为“高消费群与性别无关”
D.在犯错误的概率不超过1%的前提下,认为“高消费群与性别有关”
解析:选B 将表格中的数据代入公式可得K2==≈1.33<2.706,所以没有90%以上的把握认为“高消费群与性别有关”.
5.(2017·河南八市质检)为了研究某大型超市当天销售额与开业天数的关系,随机抽取了5天,其当天销售额与开业天数的数据如下表所示:
开业天数x | 10 | 20 | 30 | 40 | 50 |
当天销售额y/万元 | 62 | 75 | 81 | 89 |
根据上表提供的数据,求得y关于x的线性回归方程为=0.67x+54.9,由于表中有一个数据模糊看不清,请你推断出该数据的值为( )
A.67 B.68
C.68.3 D.71
解析:选B 设表中模糊看不清的数据为m.因为==30,又样本中心点(,)在回归直线=0.67x+54.9上,所以==0.67×30+54.9,得m=68,故选B.
6.某研究机构对儿童记忆能力x和识图能力y进行统计分析,得到如下数据:
记忆能力x | 4 | 6 | 8 | 10 |
识图能力y | 3 | 5 | 6 | 8 |
由表中数据,求得线性回归方程为=x+,若某儿童的记忆能力为12,则他的识图能力为( )
A.7 B.9.5
C.10 D.12
解析:选B 由表中数据得==7,==,由(,)在直线=x+上,得=-,即线性回归方程为=x-.当x=12时,=×12-=9.5,即他的识图能力为9.5.
二、填空题
7.(2017·安徽阜阳质检)某班主任对全班30名男生进行了作业量多少的调查,数据如下表:
| 认为作业多 | 认为作业不多 | 总计 |
喜欢玩电脑游戏 | 12 | 8 | 20 |
不喜欢玩电脑游戏 | 2 | 8 | 10 |
总计 | 14 | 16 | 30 |
该班主任据此推断男生认为作业多与喜欢玩电脑游戏有关系,则这种推断犯错误的概率不超过________.
解析:计算得K2的观测值为k=≈4.286>3.841,则推断犯错误的概率不超过0.05.
答案:0.05
8.已知x与y之间的一组数据如下表所示,当m变化时,y与x的回归直线=bx+a必过定点________.
x | 0 | 1 | 2 | 3 |
y | 1 | 3 | 5-m | 7+m |
解析:因为线性回归直线一定经过样本中心点(,),
又==,==4,
所以回归直线=bx+a必过定点.
答案:
9.(2017·湖北黄冈质检)某企业为了增强自身竞争力,计划对职工进行技术培训,以提高产品的质量.为了解某车间对技术培训的态度与性别的关系,对该车间所有职工进行了问卷调查,利用2×2列联表计算得K2≈3.918,经查对临界值表知P(K2≥3.841)≈0.05.由此,三位领导得出以下判断:
p:有95%的把握认为“对技术培训的态度与性别有关”;
q:没有95%的把握认为“对技术培训的态度与性别有关”;
r:有5%的把握认为“对技术培训的态度与性别有关”.
则下列结论中,正确结论的序号是________.(把你认为正确的命题序号都填上)
①p∧(綈q);②(綈p)∨q;③(綈p)∧(綈q);④p∨r.
解析:由题意,得K2≈3.918,P(K2≥3.841)≈0.05,所以只有p的判断正确,即有95%的把握认为“对技术培训的态度与性别有关”.由真值表知①④为真命题.
答案:①④
三、解答题
10.(2017·宁夏银川一中期末)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
x | 3 | 4 | 5 | 6 |
y | 2.5 | 3 | 4 | 4.5 |
(1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a.
(2)已知该厂技改前,100吨甲产品的生产能耗为90吨标准煤.试根据(1)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
解:(1)由对照数据,计算得iyi=66.5,
=32+42+52+62=86,
=4.5,=3.5,===0.7,
=- =3.5-0.7×4.5=0.35,
所求的回归方程为=0.7x+0.35.
(2)当x=100时,=100×0.7+0.35=70.35,
预测生产100吨甲产品的生产能耗比技改前降低90-70.35=19.65(吨标准煤).
11.第31届夏季奥林匹克运动会于2016年8月5日至8月21日在巴西里约热内卢举行.下表是近五届奥运会中国代表团和俄罗斯代表团获得的金牌数的统计数据(单位:枚).
| 第30届伦敦 | 第29届北京 | 第28届雅典 | 第27届悉尼 | 第26届亚特兰大 |
中国 | 38 | 51 | 32 | 28 | 16 |
俄罗斯 | 24 | 23 | 27 | 32 | 26 |
(1)根据表格中两组数据完成近五届奥运会两国代表团获得的金牌数的茎叶图;
(2)下表是近五届奥运会中国代表团获得的金牌数之和y(从第26届算起,不包括之前已获得的金牌数)随时间x变化的数据:
时间x(届) | 26 | 27 | 28 | 29 | 30 |
金牌数之和y(枚) | 16 | 44 | 76 | 127 | 165 |
作出散点图如下:
由图可以看出,金牌数之和y与时间x之间存在线性相关关系,请求出y关于x的线性回归方程;并预测到第32届奥运会时中国代表团获得的金牌数之和为多少?
参考数据:=28,=85.6,(xi-)(yi-)=381,(xi-)2=10.
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线=x+的斜率和截距的最小二乘估计分别为:
=,=- .
解:(1)近五届奥运会两国代表团获得的金牌数的茎叶图如下:
(2)===38.1,
=- =85.6-38.1×28=-981.2,
所以金牌数之和y关于时间x的线性回归方程为=38.1x-981.2.
当x=32时,中国代表团获得的金牌数之和的预报值=38.1×32-981.2=238,
故预测到第32届奥运会时中国代表团获得的金牌数之和为238枚.
12.厦门理工学院为了了解大学生使用手机的情况,分别在大一和大二两个年级各随机抽取了100名大学生进行调查.下面是根据调查结果绘制的学生日均使用手机时间的频率分布直方图和频数分布表,将使用手机时间不低于80分钟的学生称为“手机迷”.
大一学生日均使用手机时间的频率分布直方图:
大二学生日均使用手机时间的频数分布表:
时间分组 | 频数 |
[0,20) | 12 |
[20,40) | 20 |
[40,60) | 24 |
[60,80) | 26 |
[80,100) | 14 |
[100,120] | 4 |
(1)将频率视为概率,估计哪个年级的大学生是“手机迷”的概率大?请说明理由.
(2)在大一的抽查中,已知随机抽到的女生共有55名,其中10名为“手机迷”.根据已知条件完成下面的2×2列联表,并据此资料判断有多大的把握认为“手机迷”与性别有关?
| 非“手机迷” | “手机迷” | 总计 |
男 |
|
|
|
女 |
|
|
|
总计 |
|
|
|
附:随机变量K2=(其中n=a+b+c+d为样本总量).
参考数据:
P(K2≥k0) | 0.15 | 0.10 | 0.05 | 0.025 |
k0 | 2.072 | 2.706 | 3.841 | 5.024 |
解:(1)由频率分布直方图可知,大一学生是“手机迷”的概率为P1=(0.002 5+0.010)×20=0.25,
由频数分布表可知,大二学生是“手机迷”的概率为P2==0.18,
因为P1>P2,所以大一年级的大学生是“手机迷”的概率大.
(2)由频率分布直方图可知,在抽取的100人中,
“手机迷”有(0.010+0.002 5)×20×100=25(人),非“手机迷”有100-25=75(人),
2×2列联表如下:
| 非“手机迷” | “手机迷” | 合计 |
男 | 30 | 15 | 45 |
女 | 45 | 10 | 55 |
合计 | 75 | 25 | 100 |
则K2的观测值k==≈3.030,
因为3.030>2.706,所以有90%的把握认为“手机迷”与性别有关.