人教版新课标A选修1-2第一章 统计案例1.1回归分析的基本思想及其初步应用教学设计
展开独立性检验与回归分析
1.了解变量间的相关关系,能根据给出的线性回归方程系数建立线性回归方程.
2.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.
3.了解回归分析的基本思想、方法及其简单应用.
1.独立性检验
(1)概念:用统计量研究独立性问题的检验的方法称为独立性检验.
(2)m×n列联表指有m行n列的列联表
(3)必备公式
2.统计量中的四个临界值
经过对统计量分布的研究,已经得到了四个经常用到的临界值:2.706、3.841、6.635、10.828.
由2×2列联表计算出,然后与相应的临界值进行比较,当>2.706时,有90%的把握说事件A与B有关.当>3.841时,有95%的把握说事件A与B有关.当>6.635时,有99%的把握说事件A与B有关.当>10.828时,有99.9%的把握说事件A与B有关.当≤2.706时,认为事件A与B是无关的.
3.回归分析
(1)线性回归模型是指方程,其中称为确定性函数,称为随机误差.
(2)线性回归方程是指直线方程,其中回归截距、回归系数公式如下:
==.
(3)参数r检验线性相关的程度,计算公式为r=,
即r=化简后r=,其中表示数据(i=1,2,…,n)的标准差,这个r称为y与x的样本相关系数,简称相关系数,其中-1≤r≤1.若r>0,则x与y是正相关,若r<0,则x与y是负相关,若r=0,则x与y不相关,r=1或r=-1时,x与y为完全线性相关.
类型一.独立性检验
例1:为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:
| 喜欢数学课程 | 不喜欢数学课程 | 合计 |
男生 | 37 | 85 | 122 |
女生 | 35 | 143 | 178 |
合计 | 72 | 228 | 300 |
判断性别与是否喜欢数学课程有关吗?
[解析] 假设:性别与是否喜欢数学课程无关,由卡方计算公式得
所以我们可以拒绝从而有95%的把握认为性别与是否喜欢数学课程有关系.
练习1:为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:
| 父母吸烟 | 父母不吸烟 | 合计 |
子女吸烟 | 237 | 83 | 320 |
子女不吸烟 | 678 | 522 | 1200 |
合计 | 915 | 605 | 1520 |
用独立性检验方法判断父母吸烟对子女是否吸烟有影响.
[解析] 提出假设:父母吸烟对子女是否吸烟没有影响,由列联表中的数据得到:
所以有99.9%的把握认为:父母吸烟对子女是否吸烟有影响.
类型二.变量间的相关关系及线性回归方程
例2:下列关系中,是带有随机性相关关系的是______.
①正方形的边长与面积之间的关系;
②水稻产量与施肥量之间的关系;
③人的身高与年龄之间的关系;
④降雪量与交通事故的发生率之间的关系.
[答案] ②④
[解析] 两变量之间的关系有两种:函数关系与带有随机性的相关关系.①正方形的边长与面积之间的关系是函数关系.②水稻产量与施肥量之间不是严格的函数关系,但是具有相关性,因而是相关关系.③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而他们不具有相关关系.④降雪量与交通事故的发生率之间具有相关关系.
例3:某工业部门进行一项研究,分析该部门的产量与生产费用的关系,从这个工业部门内随机抽选了10个企业作样本,资料如下表:
产量x(千克) | 40 | 42 | 48 | 55 | 65 | 79 | 88 | 100 | 120 | 140 |
生产费用y(千克) | 150 | 140 | 160 | 170 | 150 | 162 | 185 | 165 | 190 | 185 |
根据表格求出回归直线方程.
[解析]
∴回归直线方程为
练习1:下列两个变量之间的关系哪个不是函数关系( )
(A)角度和它的余弦值
(B)正方形边长和面积
(C)正n边形的边数和顶点角度之和
(D)人的年龄和身高
[答案] D
[解析] 人的身高与年龄只具有相关性
类型三.相关检验与回归分析
例3:某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系.从这个工业部门内随机抽选了10个企业作样本,有如下资料:
产量x(千克) | 40 | 42 | 48 | 55 | 65 | 79 | 88 | 100 | 120 | 140 |
生产费用y(千克) | 150 | 140 | 160 | 170 | 150 | 162 | 185 | 165 | 190 | 185 |
完成下列问题:
(1)计算x与y的相关系数;
(2)对这两个变量之间是否线性相关进行相关性检验;
(3)设线性回归方程为求系数
[解析] 由表可计算得:
(1)
(2)因为0.808>=0.632,所以认为x与y之间具有线性相关关系.(3)代入公式得
练习1:某运动员训练次数与运动成绩之间的数据关系如下:
次数(x) | 30 | 33 | 35 | 37 | 39 | 44 | 46 | 50 |
成绩(y) | 30 | 34 | 37 | 39 | 42 | 46 | 48 | 51 |
试预测该运动员训练47次以及55次的成绩.
[解析] (1)可求得
所以
所以回归直线方程为
(2)计算相关系数
将上述数据代入得r≈0.992704,查表可知0.707,而故y与x之间存在显著的线性相关关系.
(3)作出预报:由上述分析可知,我们可用回归方程1.0415x-0.00386作为该运动员成绩的预测值,将x=47和x=55分别代入该方程得和故预测该运动员训练47次和55次成绩分别为49和57.
1.在调查中学生近视情况中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )
A.期望与方差 B.排列与组合 C.独立性检验 D.概率
[答案] C
2.通过对统计量的研究,得到了若干临界值,当≤2.706时,我们认为事件A与B( )
A.有90%的把握认为A与B有关系
B.有95%的把握认为A与B有关系
C.没有充分理由说明事件A与B有关系
D.不能确定
[答案] C
3.下列关于的说法中正确的是( )
A.在任何相互独立问题中都可以用来检验有关还是无关
B.的值越大,两个事件的相关性就越大
C.是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合
D.的观测值的计算公式为
[答案] C
4.下列两个变量之间的关系是相关关系的是( )
A.角度和它的余弦值 B.正方形边长和面积
C.正n边形的边数和顶点数 D.人的年龄和身高
[答案] D
5.由一组样本数据得到的回归方程为下面说法不正确的是( )
A.直线必经过点
B.直线至少经过点中的一个点
C.直线的斜率为
D.直线和各点的偏差平方和是该坐标平面上所有直线与这些点的偏差平方和中最小的直线
[答案] B
6.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下非优秀统计成绩,得到如下所示的列联表:
| 优秀 | 非优秀 | 总计 |
甲班 | 10 | b |
|
乙班 | c | 30 |
|
合计 |
|
|
|
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.根据列联表中的数据,若按97.5%的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,若按97.5%的可靠性要求,不能认为“成绩与班级有关系”
[答案] C
7.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:
| 理科 | 文科 |
男 | 13 | 10 |
女 | 7 | 20 |
已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.
根据表中数据,得到K2=≈4.844.
则认为选修文科与性别有关系出错的可能性为________.
[答案] 5%
8.某数学老师身高176cm,他爷爷、父亲和儿子的身高分别是173cm、170cm和182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm.
[答案] 185
_________________________________________________________________________________
_________________________________________________________________________________
基础巩固
1.(2014重庆卷)已知变量x与y正相关,且由观测数据算得样本平均数x=3,y=3.5,则由该观测数据算得的线性回归方程可能是( )
A.y^=0.4x+2.3 B.y^=2x-2.4
C.y^=-2x+9.5 D.y^=-0.3x+4.4
[答案] A
2.(2014湖北卷)根据如下样本数据:
x | 3 | 4 | 5 | 6 | 7 | 8 |
y | 4.0 | 2.5 | -0.5 | 0.5 | -2.0 | -3.0 |
得到的回归方程为=bx+a,则( )
A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<0
[答案] B
3.(2014江西卷)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )
成绩 性别 | 不及格 | 及格 | 总计 |
男 | 6 | 14 | 20 |
女 | 10 | 22 | 32 |
总计 | 16 | 36 | 52 |
视力 性别 | 好 | 差 | 总计 |
男 | 4 | 16 | 20 |
女 | 12 | 20 | 32 |
总计 | 16 | 36 | 52 |
智商 性别 | 偏高 | 正常 | 总计 |
男 | 8 | 12 | 20 |
女 | 8 | 24 | 32 |
总计 | 16 | 36 | 52 |
阅读量 性别 | 丰富 | 不丰 富 | 总计 |
男 | 14 | 6 | 20 |
女 | 2 | 30 | 32 |
总计 | 16 | 36 | 52 |
A.成绩 B.视力 C.智商 D.阅读量
[答案] D
4.下列两个变量之间的关系是相关关系的是( )
A.正方体的棱长和体积 B.角的弧度数和它的正弦值
C.单产为常数时,土地面积和总产量 D.日照时间与水稻的亩产量
[答案] D
5.(2015福建)为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入(万元) | 8.2 | 8.6 | 10.0 | 11.3 | 11.9 |
支出(万元) | 6.2 | 7.5 | 8.0 | 8.5 | 9.8 |
根据上表可得回归直线方程,其中,据此估计,该社区一户收入为15万元家庭年支出为( )
A.11.4万元 B.11.8万元 C.12.0万元 D.12.2万元
[答案] B
6.“回归”一词是在研究子女的身高与父母的身高之间的遗传关系时,由高尔顿提出的.他的研究结果是子代的平均身高向中心回归.根据他的结论,在儿子的身高y与父亲的身高x的回归方程中,( )
A.在(-1,0)内 B.等于0 C.在(0,1)内 D.在[1,+∞)
[答案] C
7.线性回归方程中,回归系数的含义是________________.
[答案] x每增加一个单位,y相应地平均变化个单位
8.在一项打鼾与患心脏病是否有关的调查中,共调查了1978人,经过计算28.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(填“有关”、“无关”)
[答案] 有关
能力提升
1.下列说法:
①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;
②设有一个线性回归方程=3-5x,变量x增加1个单位时,y平均增加5个单位;
③设具有相关关系的两个变量x,y的相关系数为r,则|r|越接近于0,x和y之间的线性相关程度越强;
④在一个2×2列联表中,由计算得K2的值,则K2的值越大,判断两个变量间有关联的把握就越大.
其中错误的个数是( )
A.0 B.1 C.2 D.3
[答案] C
2.已知x与y之间的几组数据如下表:
x | 1 | 2 | 3 | 4 | 5 | 6 |
y | 0 | 2 | 1 | 3 | 3 | 4 |
假设根据上表数据所得线性回归直线方程=x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是( )
A.>b′,>a′ B.>b′,<a′
C.<b′,>a′ D.<b′,<a′
[答案] C
3.对相关系数r,下列说法正确的是( )
A.越大,相关程度越小 B.越小,相关程度越大
C.越大,相关程度越小,越小,相关程度越大
D.≤1且越接近1,相关程度越大,越接近0,相关程度越小
[答案] D
4.假设关于某设备的使用年限x(年)与所支出的维修费用y(万元)有如下统计资料:
x | 2 | 3 | 4 | 5 | 6 |
y | 2.2 | 3.8 | 5.5 | 6.5 | 7.0 |
若由资料知,y对x呈线性相关关系,试求:
(1)线性回归方程;
(2)估计设备的使用年限为10年时,维修费用约是多少?
[答案] (1)
i | 1 | 2 | 3 | 4 | 5 |
xi | 2 | 3 | 4 | 5 | 6 |
yi | 2.2 | 3.8 | 5.5 | 6.5 | 7.0 |
xiyi | 4.4 | 11.4 | 22.0 | 32.5 | 42.0 |
所以线性回归方程是1.23x+0.08.
(2)当x=10时,1.23×10+0.08=12.38(万元),即估计设备用10年时,维修费用约是12.38万元.
5.假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下表的统计资料:
使用年限x(年) | 2 | 3 | 4 | 5 | 6 |
维修费用y(万元) | 2.2 | 3.8 | 5.5 | 6.5 | 7.0 |
若由资料可知y对x呈线性相关关系,试求:
(1)线性回归直线方程;
(2)根据回归直线方程,估计使用年限为12年时,维修费用是多少?
[答案] (1)列表
i | 1 | 2 | 3 | 4 | 5 | 合计 |
xi | 2 | 3 | 4 | 5 | 6 | 20 |
yi | 2.2 | 3.8 | 5.5 | 6.5 | 7.0 | 25 |
xiyi | 4.4 | 11.4 | 22.0 | 32.5 | 42.0 | 112.3 |
x | 4 | 9 | 16 | 25 | 36 | 90 |
=4,=5; x=90;xiyi=112.3 |
=1.23,于是=5-1.23×4=0.08
(2)当x=12时,=1.23×12+0.08=14.84(万元)
6.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为思心脏病而住院的男性病人中有175人秃顶,利用独立性检验方法判断秃顶与患心脏病是否有关系?
[答案] 根据题目中所给数据得到如下列联表.
| 患心脏病 | 患其他病 | 合计 |
秃顶 | 214 | 175 | 389 |
不秃顶 | 451 | 597 | 1048 |
合计 | 665 | 772 | 1437 |
假设秃顶与患心脏病无关.
由于a=214,b=175,c=451,d=597,a+b=389,c+d=1048,a+c=665,b+d=772,n=1437.
因此
因而我们有99.9%的把握认为秃顶与患心脏病有关系.
数学选修1-23.1数系的扩充和复数的概念教案: 这是一份数学选修1-23.1数系的扩充和复数的概念教案,共8页。
人教版新课标A选修1-23.2复数代数形式的四则运算教学设计: 这是一份人教版新课标A选修1-23.2复数代数形式的四则运算教学设计,共8页。
高中数学2.1合情推理与演绎推理教案: 这是一份高中数学2.1合情推理与演绎推理教案,共14页。