高教版(2021·十四五)拓展模块一(下册)第10章 统计优秀课时训练
展开二、知识梳理
知识点一:集中趋势与离散程度
1.众数、中位数和平均数的定义
(1)众数:一组数据中出现次数最多的数.
(2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果个数是偶数,则取中间两个数据的平均数.
(3)平均数:一组数据的和除以数据个数所得到的数.
2. 方差、标准差的定义
一组数据x1,x2,…,xn,用eq \x\t(x)表示这组数据的平均数,
则这组数据的方差为=(-)
标准差为.
3. 总体方差、总体标准差的定义
如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则称S2=eq \f(1,N)
为总体方差,S=eq \r(S2)为总体标准差.
如果总体的N个变量值中,不同的值共有k(k≤N)个,记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=eq \f(1,N).
4. 样本方差、样本标准差的定义
如果一个样本中个体的变量值分别为y1,y2,…,yn,样本平均数为,
则称
为样本方差,s=eq \r(s2)为样本标准差.
5. 方差、标准差特征
标准差、方差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.
知识点二:一元线性回归
1 一元线性回归模型
用x表示父亲身高,Y表示儿子身高,e表示随机误差,假定随机误差e的均值为0,方差为与父亲身高无关的定值σ2,则它们之间的关系可以表示为
Y=bx+a+eEe=0 , De=σ2
我们称它为Y关于x的一元线性回归模型.
2 线性回归方程
对于变量x和变量y,设经过随机抽样获得的成对样本数据为x1 , y1 , x2 , y2 , … , (xn , yn),其中x1 , x2 , … , xn和y1 , y2 , … , yn的均值分别为x和y,其中
b=i=1n(xi-x)(yi-y)i=1nxi-x2=i=1nxiyi-nxyi=1nxi-x2a=y-bx
我们将y=b x+a称为Y关于x的经验回归方程,其图形称为经验回归直线,这种求经验回归方程的方法叫做最小二乘法.
备注 线性回归直线经过定点(x , y) .
3 残差分析
通过观测得到的数据称为观测值,通过经验回归方程得到的y称为预测量,观测值减去预测值称为残差,残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判定原始数据是否存在可疑数据,这方面的工作称为残差分析.
通过观察残差图可以直观判断模型是否满足一元线性回归模型中对随机误差的假设,那残差应是均值为0,方差为σ2的随机变量的观测值.
4 比较模型的拟合效果
(i) 残差平方和
残差平方和Q=i=1nyi-y2越小,拟合效果越好.
(ii) 相关指数R2
R2=1-i=1nyi-y2i=1nyi-y2
R2越大,残差平方和i=1nyi-y2越小,模型拟合效果越好.
四、常考题型探究
考点一 集中趋势与离散程度
1.下列说法错误的是( )
A.一个样本的众数、中位数和平均数不可能是同一个数
B.统计中,我们可以用样本平均数去估计总体平均数
C.样本平均数既不可能大于也不可能小于这个样本中的所有数据
D.众数、中位数和平均数从不同的角度描述了一组数据的集中趋势
2.一组样本数据为:19,23,12,14,14,17,10,12,18,14,27,则这组数据的众数和中位数分别为( )
A.14,14 B.12,14 C.14,15.5 D.12,15.5
3.已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有( )
A.a>b>c B.a>c>b
C.c>a>b D.c>b>a
4. 我校在科技文化节活动中,8位评委给某个节目的评分各不相同,去掉1个最高分和1个最低分,剩下的6个评分与原始的8个评分相比一定不发生变化的是( )
A.平均数B.中位数C.方差D.众数
5.在一次科技作品制作比赛中,某小组六件作品的成绩(单位:分)分别是:7,10,9,8,7,9,对这组数据,下列说法正确的是( )
A.平均数是8B.中位数8.5C.众数是8D.极差是4
6.两年前,某校七(1)班的学生平均年龄为13岁,方差为4,若学生没有变动,则今年升为九(1)班的学生年龄中( )
A.平均年龄为13岁,方差改变 B.平均年龄为15岁,方差不变
C.平均年龄为15岁,方差改变 D.平均年龄不变,方差不变
7.一组数据23,27,20,18,x,12,它们的中位数是21,则x=___________,已知一个样本-1,0,2,x,3,它们的平均数是2,则这个样本的方差为s2=_______.
8.已知一组数据8,5,x,8,10的平均数是8,以下说法错误的是( )
A.极差是5B.众数是8C.中位数是9D.方差是2.8
9.李老师为了了解学生暑期在家的阅读情况,随机调查了20名学生某一天的阅读小时数,具体情况统计如表:
则关于这20名学生阅读小时数的说法正确的是( )
A.中位数是3B.平均数是3.3
C.众数是8D.极差是7
10.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为( )
A.1 B.eq \r(2) C.eq \r(3) D.2
答案 B
11.若样本x1,x2,x3,⋯,xn的平均数为8,方差为4,则对于样本x1﹣3,x2﹣3,x3﹣3,xn﹣3,下列结论正确的是( )
A.平均数为8,方差为1B.平均数为5,方差为1
C.中位数变小,方差不变D.众数不变,方差为4
12.一组数据的方差计算公式为,则这组数据的方差是 .
13.如果有一组数据-2,0,1,3,的极差是6,那么的值是 .
考点二 一元线性回归
14.由变量与相对应的一组数据得到的线性回归方程为,根据样本中心满足线性回归方程,则( )
A.45B.51C.67D.63
15.我国西北某地区开展改造沙漠的巨大工程,该地区对近5年投入的沙漠治理经费x(亿元)和沙漠治理面积y(万亩)的相关数据统计如下表所示.
根据表中所给数据,得到y关于x的线性回归方程为,则( )
A.1B.2C.3D.4
16.根据变量与的对应关系(如表),求得关于的线性回归方程为,则表中的值为( )
A.60B.55C.50D.45
17.已知x与y之间的一组数据如下,则y与x的线性回归方程表示的直线必过点( )
A.B.C.D.
18.在下列所示的四个图中,两个变量间具有较强线性相关关系的是( )
A.B.C.D.
19.某市物价部门对本市的5家商场的某商品的一天销售量及其售价进行调查,5家商场的售价(元)和销售量(件)之间的一组数据如下表所示:
已知销售量与售价之间有较强的线性相关关系,其线性回归方程是,且,则其中的______,样本中心为______.
20.某城市2017年到2021年人口总数与年份的关系如表所示,据此估计2022年该城市人口总数______(单位十万).(参考数据和公式:,)
21.假定产品产量x(千件)与单位成本y(元/件)之间存在相关关系.数据如下:
(1)以x为解释变量,y为预报变量,作出散点图;
(2)求y与x之间的回归直线方程,对于单位成本70元/件时,预报产量为多少;
阅读时间
(小时)
2
2.5
3
3.5
4
学生人数(名)
1
2
8
6
3
治理经费x/亿元
3
4
5
6
7
治理面积y/万亩
10
12
11
12
20
2
4
5
6
8
30
40
50
70
x
0
1
2
3
y
1
2
4
6
售价(元)
9
9.5
10.5
11
销售量(件)
11
8
6
5
年份(年)
0
1
2
3
4
人口数(十万)
5
7
8
11
19
x
2
3
4
3
4
5
y
73
72
71
73
69
68
数学拓展模块一(下册)第10章 统计优秀习题: 这是一份数学拓展模块一(下册)<a href="/sx/tb_c4053696_t7/?tag_id=28" target="_blank">第10章 统计优秀习题</a>,文件包含专题10统计专题测试原卷版docx、专题10统计专题测试解析版docx等2份试卷配套教学资源,其中试卷共22页, 欢迎下载使用。
中职数学高教版(2021·十四五)拓展模块一(下册)第10章 统计优秀精练: 这是一份中职数学高教版(2021·十四五)拓展模块一(下册)<a href="/sx/tb_c4053696_t7/?tag_id=28" target="_blank">第10章 统计优秀精练</a>,文件包含专题10统计知识点串讲原卷版docx、专题10统计知识点串讲解析版docx等2份试卷配套教学资源,其中试卷共9页, 欢迎下载使用。
中职数学高教版(2021·十四五)拓展模块一(下册)第10章 统计优秀课时作业: 这是一份中职数学高教版(2021·十四五)拓展模块一(下册)<a href="/sx/tb_c4053696_t7/?tag_id=28" target="_blank">第10章 统计优秀课时作业</a>,文件包含专题05统计专题测试高教版2021·基础模块下册原卷版docx、专题05统计专题测试高教版2021·基础模块下册解析版docx等2份试卷配套教学资源,其中试卷共16页, 欢迎下载使用。