新教材北师大版步步高选择性必修一【学案+同步课件】第七章 章末复习课
展开一、回归分析
1.主要考查两个变量线性相关的判定,以及利用最小二乘法求线性回归方程.
2.掌握求线性回归方程的方法和步骤,提升数学运算、数据分析的素养.
例1 如图所示的是某企业2014年至2020年污水净化量(单位:吨)的折线图.
(1)由折线图看出,可用一元线性回归模型拟合Y和T的关系,请用样本相关系数加以说明;
(2)建立Y关于T的线性回归方程,预测2022年该企业污水净化量.
参考数据:=54,(ti-)(yi-)=21,≈3.74,(yi-)2=18.参考公式:样本相关系数r=,线性回归方程Y=+T中的系数分别为=,=-.
解 (1)由题意,=4,(ti-)2=28,
∴r==≈0.94.
故Y与T之间存在较强的正相关关系,可用一元线性回归模型拟合Y和T的关系.
(2)由(1)得===,
=-=54-×4=51,
∴Y关于T的线性回归方程为Y=T+51.
当T=9时,Y=×9+51=57.75,
预测2022年该企业污水净化量约为57.75吨.
反思感悟 解决回归分析问题的一般步骤
(1)画散点图.根据已知数据画出散点图.
(2)判断变量的相关性并求线性回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出线性回归方程.
(3)实际应用.依据求得的线性回归方程解决实际问题.
跟踪训练1 某研究机构对高三学生的记忆力X和判断力Y进行统计分析,得下表数据:
X | 6 | 8 | 10 | 12 |
Y | 2 | 3 | 5 | 6 |
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出Y关于X的线性回归方程Y=X+;
(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.
参考公式:=,=-.
解 (1)如图:
样本点分布在一条直线附近,Y与X具有线性相关关系.
(2)iyi=6×2+8×3+10×5+12×6=158,
==9,
==4,
=62+82+102+122=344,
===0.7,
=-=4-0.7×9=-2.3,
故线性回归方程为Y=0.7X-2.3.
(3)由(2)中线性回归方程可知,当X=9时,
Y=0.7×9-2.3=4,
故预测记忆力为9的同学的判断力约为4.
二、独立性检验
1.主要考查根据样本制作2×2列联表,由2×2列联表计算χ2,分析并判断相关性结论的可信程度.
2.通过计算χ2的值,进而分析相关性结论的可信程度,提升数学运算、数据分析素养.
例2 电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.如图是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.
(1)根据已知条件完成下面的2×2列联表,试问:“体育迷”与性别是否有关?
| “非体育迷” | “体育迷” | 总计 |
男 |
|
|
|
女 |
|
|
|
总计 |
|
|
|
(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.
解 (1)由所给的频率分布直方图知,“体育迷”人数为100×(10×0.020+10×0.005)=25.
“非体育迷”人数为75,根据题意完成2×2列联表:
| “非体育迷” | “体育迷” | 总计 |
男 | 30 | 15 | 45 |
女 | 45 | 10 | 55 |
总计 | 75 | 25 | 100 |
将2×2列联表的数据代入公式计算:
χ2==≈3.030,
因为3.030>2.706,所以有90%的把握判断“体育迷”与性别有关.
(2)由所给的频率分布直方图知“超级体育迷”人数为100×(10×0.005)=5,记ai(i=1,2,3)表示男性,bj(j=1,2)表示女性.
方法一 所有可能结果构成的样本空间为Ω={(a1,a2),(a1,a3),(a2,a3),(a1,b1),(a2,b1),(a3,b1),(a1,b2),(a2,b2),(a3,b2),(b1,b2)},共有10个样本点,且每个样本点出现是等可能的;用A表示事件“任选2人,至少有1名女性”,则A={(a1,b1),(a2,b1),(a3,b1),(a1,b2),(a2,b2),(a3,b2),(b1,b2)},共有7个样本点,故“任选2人,至少有1名女性”的概率为P(A)=.
方法二 设“任选2人,至少有1名女性”为A,则P(A)=1-=1-=.
反思感悟 独立性检验问题的一般步骤
(1)认真读题,指出相关数据,得出2×2列联表.
(2)根据2×2列联表中的数据,计算统计量χ2.
(3)通过统计量χ2与已知临界值的比较判断“X与Y有关系”的把握的大小.
跟踪训练2 户外运动已经成为一种时尚运动,某单位为了了解员工喜欢户外运动是否与性别有关,决定从本单位全体650人中采用分层随机抽样的办法抽取50人进行问卷调查,得到了如下列联表:
| 喜欢户外运动 | 不喜欢户外运动 | 总计 |
男性 |
| 5 |
|
女性 | 10 |
|
|
总计 |
|
| 50 |
已知在这50人中随机抽取1人抽到喜欢户外运动的员工的概率是.
(1)请将上面的列联表补充完整;
(2)求该公司男、女员工各多少人;
(3)试问:喜欢户外运动与性别是否有关?
参考公式:χ2=,其中n=a+b+c+d.
解 (1)因为在全部50人中随机抽取1人抽到喜欢户外运动的员工的概率是,所以喜欢户外运动的男女员工共30人,其中男员工20人,列联表补充如下:
| 喜欢户外运动 | 不喜欢户外运动 | 总计 |
男性 | 20 | 5 | 25 |
女性 | 10 | 15 | 25 |
总计 | 30 | 20 | 50 |
(2)该公司男员工人数为25÷50×650=325,则女员工有325人.
(3)χ2=≈8.333>6.635,
所以有99%的把握判断喜欢户外运动与性别有关.
新教材北师大版步步高选择性必修一【学案+同步课件】章末检测试卷六(第七章): 这是一份新教材北师大版步步高选择性必修一【学案+同步课件】章末检测试卷六(第七章),文件包含章末检测试卷六第七章pptx、章末检测试卷六第七章docx等2份课件配套教学资源,其中PPT共57页, 欢迎下载使用。
新教材北师大版步步高选择性必修一【学案+同步课件】第六章 章末复习课: 这是一份新教材北师大版步步高选择性必修一【学案+同步课件】第六章 章末复习课,文件包含第六章章末复习课pptx、第六章章末复习课docx等2份课件配套教学资源,其中PPT共44页, 欢迎下载使用。
新教材北师大版步步高选择性必修一【学案+同步课件】第五章 章末复习课: 这是一份新教材北师大版步步高选择性必修一【学案+同步课件】第五章 章末复习课,文件包含第五章章末复习课pptx、第五章章末复习课docx等2份课件配套教学资源,其中PPT共37页, 欢迎下载使用。