所属成套资源:高考数学二轮专题——核心热点突破
- 高考数学二轮专题回顾5 不等式与推理证明 试卷 0 次下载
- 高考数学二轮专题回顾7 立体几何与空间向量 试卷 0 次下载
- 高考数学二轮专题回顾6 数列 试卷 0 次下载
- 高考数学二轮专题回顾8 平面解析几何 试卷 0 次下载
- 高考数学二轮专题回顾9 计数原理、概率、随机变量及其分布列 试卷 0 次下载
高考数学二轮专题回顾10 统计与统计案例
展开
这是一份高考数学二轮专题回顾10 统计与统计案例,共5页。试卷主要包含了频率分布直方图,003 5 670,统计中的四个数据特征,1,4,5 B A,619>10,635等内容,欢迎下载使用。
(1)小长方形面积=组距×eq \f(频率,组距)=频率;所有小长方形面积的和=各组频率和=1.
(2)不要混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.
[检验1] 某学校共有1 000名学生,其中男生400人,为了解该校学生在学校的月消费情况,采取分层抽样的方法随机抽取了100名学生进行调查,月消费金额(单位:元)分布在450~950之间.根据调查的结果绘制学生在校月消费金额的频率分布直方图如图所示.
则图中a的值为________,估计该校学生月消费金额的平均数为________元(同组中的数据用该组区间的中点值作代表).
答案 0.003 5 670
解析 由题意知100×(0.001 5+a+0.002 5+0.001 5+0.001 0)=1,
解得a=0.003 5,
该校学生月消费金额的平均数
eq \(x,\s\up6(-))=500×0.15+600×0.35+700×0.25+800×0.15+900×0.1=670(元).
2.统计中的四个数据特征
(1)众数:在样本数据中,出现次数最多的那个数据.
(2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.
(3)平均数:eq \(x,\s\up6(-))=eq \f(1,n)(x1+x2+…+xn).
(4)方差与标准差:方差:s2=eq \f(1,n)[(x1-eq \(x,\s\up6(-)))2+(x2-eq \(x,\s\up6(-)))2+…+(xn-eq \(x,\s\up6(-)))2].
标准差:s=eq \r(\f(1,n)[(x1-\(x,\s\up6(-)))2+(x2-\(x,\s\up6(-)))2+…+(xn-\(x,\s\up6(-)))2]).
[检验2] (1)已知一组数据-3, 2a,4,5-a,1,9的平均数为3(其中a∈R),则中位数为________.
(2)为了解某校学生的视力情况,现采用随机抽样的方式从该校的A,B两班中各抽4名学生进行视力检测.检测的数据如下:
A班:4.1,4.6,4.4,4.9;
B班:4.9,4.6,4.2,4.5.
①分别计算两组数据的平均数,从计算结果看,________班的4名学生视力较好;
②________班的4名学生视力方差较大.
答案 (1)3.5 (2)B A
解析 (1)因为数据-3,2a, 4,5-a,1,9的平均数为3,所以-3+2a+4+5-a+1+9=3×6,解得a=2,所以这组数据分别是-3,4,4,3,1,9,按从小到大排列分别为-3,1,3,4,4,9,故中位数为eq \f(3+4,2)=3.5.
(2)①A班数据的平均数eq \(x,\s\up6(-))=eq \f(1,4)×(4.1+4.6+4.4+4.9)=4.5,
B班数据的平均数eq \(y,\s\up6(-))=eq \f(1,4)×(4.9+4.6+4.2+4.5)=4.55,
从计算结果看,B班的4名学生视力较好.
②A班数据的方差seq \\al(2,A)=eq \f(1,4)×[(4.1-4.5)2+(4.6-4.5)2+(4.4-4.5)2+(4.9-4.5)2]=eq \f(1,4)×[0.42+0.12+0.12+0.42]=0.085,
B班数据的方差seq \\al(2,B)=eq \f(1,4)×[(4.9-4.55)2+(4.6-4.55)2+(4.2-4.55)2+(4.5-4.55)2]=eq \f(1,4)[0.352+0.052+0.352+0.052]=0.062 5,
所以A班的4名学生视力方差较大.
3.线性回归方程
(1)方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))称为线性回归方程,其中eq \(b,\s\up6(^))=eq \f(\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))2)=eq \f(\(∑,\s\up6(n),\s\d4(i=1))xiyi-n\(x,\s\up6(-))\(y,\s\up6(-)),\(∑,\s\up6(n),\s\d4(i=1))xeq \\al(2,i)-n\(x,\s\up6(-))2),eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-)),(eq \(x,\s\up6(-)),eq \(y,\s\up6(-)))称为样本点的中心.
(2)注意区分一般直线方程y=ax+b与回归直线方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))系数及斜率与截距的含义.
[检验3] 根据统计,某蔬菜基地西红柿亩产量的增加量y(单位:百千克)与某种液体肥料每亩使用量x(单位:千克)之间的对应数据的散点图如图所示.
(1)依据散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若|r|∈[0.75,1],则线性相关程度很高,可用线性回归模型拟合);
(2)求y关于x的回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少.
附:相关系数r=eq \f(\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))2\(∑,\s\up6(n),\s\d4(i=1)) (yi-\(y,\s\up6(-)))2)),回归直线eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))的斜率和截距的最小二乘估计分别为eq \(b,\s\up6(^))=eq \f(\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))2),eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-)).
解 (1)eq \(x,\s\up6(-))=eq \f(2+4+5+6+8,5)=5,eq \(y,\s\up6(-))=eq \f(3+4+5+6+7,5)=5.
eq \(∑,\s\up6(5),\s\d4(i=1)) (xi-eq \(x,\s\up6(-)))(yi-eq \(y,\s\up6(-)))=(-3)×(-2)+(-1)×(-1)+0×0+1×1+3×2=14,
eq \(∑,\s\up6(5),\s\d4(i=1)) (xi-eq \(x,\s\up6(-)))2=(-3)2+(-1)2+02+12+32=20,
eq \(∑,\s\up6(5),\s\d4(i=1)) (yi-eq \(y,\s\up6(-)))2=(-2)2+(-1)2+02+12+22=10.
因为r=eq \f(\(∑,\s\up6(5),\s\d4(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\(∑,\s\up6(5),\s\d4(i=1)) (xi-\(x,\s\up6(-)))2\(∑,\s\up6(5),\s\d4(i=1)) (yi-\(y,\s\up6(-)))2))=eq \f(14,\r(20×10))=eq \f(7\r(2),10)≈0.99,
0.99∈[0.75,1].
所以可用线性回归模型拟合y与x的关系.
(2)eq \(b,\s\up6(^))=eq \f(\(∑,\s\up6(5),\s\d4(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\(∑,\s\up6(5),\s\d4(i=1)) (xi-\(x,\s\up6(-)))2)=eq \f(14,20)=0.7,
则eq \(a,\s\up6(^))=5-0.7×5=1.5,
所以eq \(y,\s\up6(^))=0.7x+1.5.
当x=12时,eq \(y,\s\up6(^))=0.7×12+1.5=9.9.
所以预测当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为990千克.
4.在独立性检验中,
K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))(其中n=a+b+c+d)所给出的检验随机变量K2的观测值k,并且k的值越大,说明“X与Y有关系”成立的可能性越大,可以利用数据来确定“X与Y有关系”的可信程度.
[检验4] “云课堂”是一类面向教育的互联网服务,通过网络互动直播技术服务的方式,可以实现面向全国高质量的网络同步和异步教学,是一种真正完全突破时空限制的全方位互动性学习模式.某市随机抽取1 000人进行对“云课堂”的了解程度的问卷调查,并对参与调查的1 000人的性别以及是否了解“云课堂”情况进行了分类,得到的数据如下表所示:
(1)根据表中的数据,能否在犯错误的概率不超过0.001的前提下,认为对“云课堂”的了解程度与性别有关?
(2)现按照分层抽样的方法从被调查的不了解“云课堂”的人员中随机抽取6人,再从6人中随机抽取2人赠送“云课堂”解读宣传画,求抽取的2人中恰有1人是女性的概率.
参考公式:K2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),n=a+b+c+d.
解 (1)根据2×2列联表,得
K2的观测值k=eq \f(1 000×(400×200-300×100)2,700×300×500×500)=eq \f(1 000,21)≈47.619>10.828,
又P(K2≥10.828)=0.001,
故能在犯错误的概率不超过0.001的前提下,认为对“云课堂”的了解程度与性别有关.
(2)由分层抽样的知识可得抽取的男性人数为6×eq \f(100,300)=2,女性人数为6×eq \f(200,300)=4,
则抽取的2人中恰有1人是女性的概率为P=eq \f(Ceq \\al(1,2)·Ceq \\al(1,4),Ceq \\al(2,6))=eq \f(8,15).
男性
女性
总计
了解“云课堂”
400
300
700
不了解“云课堂”
100
200
300
总计
500
500
1 000
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
相关试卷
这是一份新高考数学二轮复习专题突破练17统计与统计案例含答案,共6页。试卷主要包含了遵守交通规则,人人有责,024,635,879等内容,欢迎下载使用。
这是一份高考数学二轮复习专题检测15 统计、统计案例 含解析,共11页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
这是一份2023高考数学二轮名师原创数学专题卷:专题16 统计与统计案例,共15页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。