![广西专版2023_2024学年新教材高中数学第8章成对数据的统计分析8.1成对数据的统计相关性训练提升新人教版选择性必修第三册01](http://img-preview.51jiaoxi.com/3/3/14785053/0-1693477428423/0.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![广西专版2023_2024学年新教材高中数学第8章成对数据的统计分析8.1成对数据的统计相关性训练提升新人教版选择性必修第三册02](http://img-preview.51jiaoxi.com/3/3/14785053/0-1693477428487/1.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
- 广西专版2023_2024学年新教材高中数学第7章随机变量及其分布过关检测A卷新人教版选择性必修第三册 试卷 0 次下载
- 广西专版2023_2024学年新教材高中数学第7章随机变量及其分布过关检测B卷新人教版选择性必修第三册 试卷 0 次下载
- 广西专版2023_2024学年新教材高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用训练提升新人教版选择性必修第三册 试卷 0 次下载
- 广西专版2023_2024学年新教材高中数学第8章成对数据的统计分析8.3列联表与独立性检验训练提升新人教版选择性必修第三册 试卷 0 次下载
- 广西专版2023_2024学年新教材高中数学第8章成对数据的统计分析过关检测A卷新人教版选择性必修第三册 试卷 0 次下载
广西专版2023_2024学年新教材高中数学第8章成对数据的统计分析8.1成对数据的统计相关性训练提升新人教版选择性必修第三册
展开第八章 成对数据的统计分析
8.1 成对数据的统计相关性
课后·训练提升
基础巩固
1.儿子的身高和父亲的身高是( )
A.正相关关系 B.负相关关系
C.函数关系 D.无任何关系
答案:A
解析:儿子的身高和父亲的身高是不确定性的关系,且是正相关关系.
2.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成散点图如图所示,根据该图,下列结论中正确的是( )
A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%
B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%
C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%
D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%
答案:B
解析:由题中散点图可知点的分布都集中在一条直线附近,由此可以判断两个变量具有相关关系,点的分布从左下角到右上角区城,因此是正相关.
由散点图可知共有10个点,则中位数为最中间两点的纵坐标的平均数,因为两数均小于20%,所以脂肪含量的中位数小于20%.
3.有人收集了春节期间平均气温x与某取暖商品销售额y的有关数据如表:
平均气温/℃ | -2 | -3 | -5 | -6 |
销售额/万元 | 20 | 23 | 27 | 30 |
则该商品销售额与平均气温有( )
A.无任何关系 B.正相关关系
C.负相关关系 D.函数关系
答案:C
解析:由表中数据可知,y随x的减小而增大,是负相关关系.
4.已知x,y是两个变量,下列四个散点图中,x,y呈负相关趋势的是( )
答案:C
解析:对于A,题中散点图中的点从左向右是上升的,且分布在一条直线附近,是正相关关系;对于B,题中散点图中的点杂乱无章,没有明显的相关关系;对于C,题中散点图中的点从左向右是下降的,且在一条直线附近,是负相关关系;对于D,题中散点图中的点杂乱无章,没有明显的相关关系.
5.(多选题)对两个变量的样本相关系数r,r∈[-1,1],下列说法正确的是( )
A.|r|越大,相关程度越大
B.|r|越小,相关程度越大
C.|r|趋近于0时,没有线性相关关系
D.|r|越接近1时,线性相关程度越强
答案:AD
解析:对于A,|r|越大,相关程度越大,A正确;对于B,|r|越小,相关程度越小,B错误;对于C,|r|趋近于0时,线性相关关系弱,C错误;对于D,|r|越接近1时,线性相关程度越强,D正确.故选AD.
6.下面各组变量之间具有线性相关关系的是 .(填序号)
①高原含氧量与海拔高度;
②速度一定时,汽车行驶的路程和所用的时间;
③学生的成绩和学生的学号.
答案:①
解析:由线性相关的定义可知①是线性相关关系.
7.甲、乙、丙、丁四名学生各自对A,B两变量进行线性相关试验,并用回归分析方法分别求得样本相关系数r如表:
学生 | 甲 | 乙 | 丙 | 丁 |
r | 0.85 | 0.80 | -0.82 | -0.90 |
则这四名学生的试验结果能体现出A,B两变量线性相关程度最强的是 .
答案:丁
解析:根据样本相关系数r的定义,当|r|越接近1,成对样本数据的线性相关程度越强,由题中表格可得能体现出A,B两变量线性相关程度最强的是丁.故答案为丁.
8.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间的样本相关系数,r2表示变量V与U之间的样本相关系数,则r1与r2的大小关系是 .
答案:r2<r1
解析:由变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),
可得变量Y与X之间正相关,因此r1>0.
而由变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),可知变量V与U之间负相关,因此r2<0.
故r1与r2的大小关系是r2<r1.
9.下面是水稻产量与施化肥量的一组观测数据:
施化肥量 | 15 | 20 | 25 | 30 | 35 | 40 | 45 |
水稻产量 | 320 | 330 | 360 | 410 | 460 | 470 | 480 |
(1)将上述数据制成散点图;
(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?
解(1)散点图如图所示:
(2)从图中发现数据点大致分布在一条直线附近,因此施化肥量和水稻产量近似成线性相关关系,施化肥量由小到大时,水稻产量由小到大,但水稻产量不会一直随施化肥量的增加而增长.
能力提升
1.在一个数据组中,已知(xi-)2是(yi-)2的2倍,(xi-)(yi-)是(yi-)2的1.2倍,试求这组数据的样本相关系数r.(精确到0.001)
解r=,
设(yi-)2=a,
则(xi-)(yi-)=1.2a,
(xi-)2=2a,
故r=≈0.849.
2.某地10户家庭的年收入和年饮食支出的统计资料如表所示.
年收入 x/万元 | 2 | 4 | 4 | 6 | 6 | 6 | 7 | 7 | 8 | 10 |
年饮食支 出y/万元 | 0.9 | 1.4 | 1.6 | 2.0 | 2.1 | 1.9 | 1.8 | 2.1 | 2.2 | 2.3 |
根据表中数据,判断两个变量是否线性相关,计算样本相关系数,并刻画它们的相关程度.
解先画出散点图,观察散点图,可以看出散点都集中在一条直线的附近,由此可以判断家庭的年收入和年饮食支出线性相关.
作散点图如图所示.
根据样本相关系数的定义,可得
r==.①
因为=6,=1.83,=406,=35.13,xiyi=117.7,
代入①得r=≈0.91,
所以可以推断出家庭年收入和年饮食支出正线性相关,且相关程度很强.
3.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:
抽取 次序 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
零件 尺寸 | 9.95 | 10.12 | 9.96 | 9.96 | 10.01 | 9.92 | 9.98 | 10.04 |
抽取 次序 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 |
零件 尺寸 | 10.26 | 9.91 | 10.13 | 10.02 | 9.22 | 10.04 | 10.05 | 9.95 |
经计算得xi=9.97,s=≈0.212,
≈18.439,(xi-)(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
(1)求(xi,i)(i=1,2,…,16)的样本相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检的零件中,如果出现了尺寸在区间[-3s,+3s]之外的零件,就认为这条生产线在这一天的生产过程中可能出现了异常情况,需对当天的生产过程进行检查.
①从这一天抽检的结果看,是否需对当天的生产过程进行检查?
②在区间[-3s,+3s]之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)
附:样本(xi,yi)(i=1,2,…,n)的样本相关系数
r=,≈0.09.
解:(1)r==≈-0.18.
∵|r|<0.25,
∴可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.
(2)①∵=9.97,s≈0.212,∴合格零件的尺寸范围是[9.334,10.606],显然第13号零件尺寸不在此范围之内,∴需要对当天的生产过程进行检查.
②剔除离群值后,剩下数据的平均值为×(16×9.97-9.22)=10.02,
=16×0.2122+16×9.972≈1591.134,
∴剔除离群值后样本方差为×(1591.134-9.222-15×10.022)≈0.008,
∴剔除离群值后样本标准差为≈0.09.