2022届高三统考数学(文科)人教版一轮复习学案:11.4 用样本估计总体
展开【知识重温】
一、必记3个知识点
1.频率分布直方图
(1)通常我们对总体作出的估计一般分成两种.一种是用样本的①________估计总体的分布.另一种是用样本的②________估计总体的数字特征.
(2)在频率分布直方图中,纵轴表示③________,数据落在各小组内的频率用各小长方形的④________表示.各小长方形的面积总和⑤________.
(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着⑥________的增加,作图时所分的⑦________增加,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为⑧________________,它能够更加精细地反映出总体在各个范围内取值的⑨________.
(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.
2.众数,中位数,平均数
(1)众数:在一组数据中,出现次数⑩________的数据叫做这组数据的众数.
(2)中位数:将一组数据按大小依次排列,把处在⑪________位置的一个数据(或最中间两个数据的平均数)叫做这组数据的⑫________.
(3)平均数:样本数据的算术平均数.即eq \x\t(x)=⑬__________.在频率分布直方图中,中位数左边和右边的直方图的面积应该⑭________.
3.样本方差,标准差
标准差
s= eq \r(\f(1,n)[x1-\x\t(x)2+x2-\x\t(x)2+…+xn-\x\t(x)2]),
其中xn是样本数据的第n项,n是样本容量,eq \x\t(x)是⑮________.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量⑯________总体容量时,样本方差越接近总体方差.
二、必明1个易误点
不要把直方图错认为条形图,两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,纵坐标刻度为频率/组距,连续随机变量在某一点上是没有频率的.
【小题热身】
一、判断正误
1.判断下列说法是否正确(请在括号中打“√”或“×”).
(1)在频率分布直方图中,小矩形的高表示频率.( )
(2)频率分布直方图中各个长方形的面积之和为1.( )
(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.( )
(4)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )
(5)一组数据的方差越大,说明这组数据的波动越大.( )
二、教材改编
2.四名同学各掷骰子5次,分别记录每次骰子出现的点数.根据四名同学的统计结果,可以判断出一定没有出现点数6的是( )
A.平均数为3,中位数为2
B.中位数为3,众数为2
C.平均数为2,方差为2.4
D.中位数为3,方差为2.8
3.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.
三、易错易混
4.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是( )
A.0.05 B.0.25
C.0.5 D.0.7
5.若数据x1,x2,x3,…,xn的平均数eq \(x,\s\up6(-))=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为________.
四、走进高考
6.[2019·全国卷Ⅱ]演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )
A.中位数 B.平均数
C.方差 D.极差
eq \x(考点一) 样本的数字特征[自主练透型]
1.[2018·江苏卷]
已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.
2.[2021·甘肃、青海、宁夏联考]从某小学随机抽取100名学生,将他们的身高(单位:厘米)分布情况汇总如下:
由此表估计这100名小学生身高的中位数为(结果保留4位有效数字)( )
A.119.3 B.119.7
C.123.3 D.126.7
3.[2021·惠州市调研考试试题]某工厂为了解产品的生产情况,随机抽取了100个产品为样本.若样本数据x1,x2,…,x100的方差为8,则数据2x1-1,2x2-1,…,2x100-1的方差为( )
A.8 B.15
C.16 D.32
悟·技法
众数、中位数、平均数及方差的意义及计算公式
(1)平均数与方差都是重要的数字特征,是对总体的一种简明地描述,平均数、中位数、众数描述数据集中趋势,方差和标准差描述波动的大小.
(2)平均数、方差的公式推广.
①若数据x1,x2,…,xn的平均数为eq \x\t(x),那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是meq \(x,\s\up6(-))+a.
②数据x1,x2,…,xn的方差为s2.
(ⅰ)数据x1+a,x2+a,…,xn+a的方差也为s2;
(ⅱ)数据ax1,ax2,…,axn的方差为a2s2.
(3)方差的简化计算公式.
s2=eq \f(1,n)[(xeq \\al(2,1)+xeq \\al(2,2)+…+xeq \\al(2,n))-neq \(x,\s\up6(-))2]或写成s2=eq \f(1,n)(xeq \\al(2,1)+xeq \\al(2,2)+…+xeq \\al(2,n))-eq \(x,\s\up6(-))2,即方差等于原数据平方的平均数减去平均数的平方.
考点二 茎叶图[自主练透型]
4.[2021·广东广雅中学、江西南昌二中联考]某市重点中学奥数培训班共有14人,分为两个小组,在一次阶段考试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则m+n的值是( )
A.10 B.11
C.12 D.13
5.[2021·陕西商洛质检]在一次53.5千米的自行车个人赛中,25名参赛选手成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为1~25号,再用系统抽样的方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为( )
A.95 B.96
C.97 D.98
悟·技法
茎叶图的应用
(1)茎叶图中的“茎”上的数字代表十位上的数字,“叶”上的数字代表个位上的数字(若没有则表示该数据不存在);
(2)解题时,可把茎叶图中的数字按大小顺序转化为总体的个体数字再求解.
考点三 频率分布直方图[互动讲练型]
[例1] [2020·天津卷]从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )
A.10 B.18
C.20 D.36
悟·技法
1.绘制频率分布直方图时的2个注意点
(1)制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确.
(2)频率分布直方图的纵坐标是eq \f(频率,组距),而不是频率.
2.由频率分布直方图进行相关计算时,需掌握的2个关系式
(1)eq \f(频率,组距)×组距=频率.
(2)eq \f(频数,样本容量)=频率,此关系式的变形为eq \f(频数,频率)=样本容量,样本容量×频率=频数.
[变式练]——(着眼于举一反三)
1.[2021·长沙市统一模拟考试]某学校对本校高三500名学生的视力进行了一次调查,随机抽取了100名学生的体检表,得到的频率分布直方图如图所示,若频率分布直方图后四组的频数成等差数列,则估计本校高三这500名学生中视力在4.8以上(含4.8)的人数为( )
A.185 B.180
C.195 D.200
eq \x(考点四) 扇形图与折线图[互动讲练型]
[例2] (1)[2018·全国卷Ⅰ]某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼状图:
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
(2)[2021·山东济宁模拟]如图为某市国庆节7天假期的楼房认购量与成交量的折线图,小明同学根据折线图对这7天的认购量(单位:套)与成交量(单位:套)作出如下判断,其中判断正确的是( )
A.日成交量的中位数是26
B.日成交量超过日平均成交量的有2天
C.认购量与日期正相关
D.10月7日认购量的增幅大于10月7日成交量的增幅
悟·技法
(1)通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.
(2)折线图可以显示随时间(根据常用比例放置)而变化的数据,因此非常适用于显示在相等时间间隔下数据的变化趋势.
[变式练]——(着眼于举一反三)
2.[2021·开封市第一次模拟考试]某省普通高中学业水平考试成绩由高分到低分按人数所占比例依次分为A,B,C,D,E五个等级,A等级15%,B等级30%,C等级30%,D,E等级共25%.其中E等级为不合格,原则上比例不超过5%.该省某校高二年级学生都参加学业水平考试,先从中随机抽取了部分学生的考试成绩进行统计,统计结果如图所示.若该校高二年级共有1 000名学生,则估计该年级拿到C等级及以上级别的学生人数为( )
A.45 B.660
C.880 D.900
3.某市气象部门根据2018年各月的每天最高气温平均值与最低气温平均值(单位:℃)数据,绘制如下折线图:
那么,下列叙述不正确的是( )
A.各月最高气温平均值与最低气温平均值总体呈正相关
B.全年中,2月份的最高气温平均值与最低气温平均值的差值最大
C.全年中各月最低气温平均值不高于10 ℃的月份有5个
D.从2018年7月至12月该市每天最高气温平均值与最低气温平均值呈下降趋势
第四节 用样本估计总体
【知识重温】
①频率分布 ②数字特征 ③eq \f(频率,组距) ④面积
⑤等于1 ⑥样本容量 ⑦组数 ⑧总体密度曲线 ⑨百分比 ⑩最多 ⑪最中间
⑫中位数 ⑬eq \f(1,n)(x1+x2+…+xn) ⑭相等
⑮平均数 ⑯接近
【小题热身】
1.答案:(1)× (2)√ (3)× (4)√
(5)√
2.答案:C
3.解析:5个数的平均数eq \(x,\s\up6(-))=eq \f(4.7+4.8+5.1+5.4+5.5,5)=5.1,所以它们的方差s2=eq \f(1,5)[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.
答案:0.1
4.解析:由题意知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为eq \f(14,20)=0.7.
答案:D
5.解析:∵x1,x2,x3,…,xn的平均数为5,∴eq \f(x1+x2+x3+…+xn,n)=5,∴eq \f(3x1+3x2+3x3+…+3xn,n)+1=3×5+1=16,∵x1,x2,x3,…,xn的方差为2,∴3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18.
答案:16,18
6.解析:记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.
答案:A
课堂考点突破
考点一
1.解析:这5位裁判打出的分数分别是89,89,90,91,91,因此这5位裁判打出的分数的平均数为eq \f(89+89+90+91+91,5)=90.
答案:90
2.解析:本题考查中位数,体现了数学运算的核心素养.由题意知身高在(100,110],(110,120],(120,130]的频率依次为0.05,0.35,0.3,前两组频率和为0.4,组距为10,设中位数为x,则(x-120)×eq \f(0.3,10)=0.1,解得x≈123.3.故选C.
答案:C
3.解析:样本数据x1,x2,…,x100的方差为8,则数据2x1-1,2x2-1,…,2x100-1的方差为22×8=32,故选D.
答案:D
考点二
4.解析:∵甲组学生成绩的平均数是88,
∴由茎叶图可知78+86+84+88+95+90+m+92=88×7,∴m=3,
∵乙组学生成绩的中位数是89,∴n=9,
∴m+n=12.故选C.
答案:C
5.解析:由系统抽样法及已知条件可知被选中的其他4人的成绩分别是88,94,99,107,故平均数为eq \f(88+94+99+107,4)=97,故选C.
答案:C
考点三
例1 解析:由题知[5.43,5.45)与[5.45,5.47)所对应的小矩形的高分别为6.25,5.00,所以[5.43,5.47)的频率为(6.25+5.00)×0.02=0.225,所以直径落在区间[5.43,5.47)内的个数为80×0.225=18,故选B.
答案:B
变式练
1.解析:由题意得频率分布直方图前三组的频率依次为0.03,0.07,0.27,所以前三组的频数依次为3,7,27,则后四组的频数和为90,又后四组的频数成等差数列,所以后四组的频数依次为27,24,21,18,所以视力在4.8以上(含4.8)的频率为39%,故本校高三这500名学生中视力在4.8以上(含4.8)的人数约为500×39%=195.选C.
答案:C
考点四
例2 解析:(1)设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济收入为2a.新农村建设前后,各项收入的对比如下表:
故选A.
(2)7天假期楼房的成交量从小到大依次为8,13,16,26,32,38,166,所以日成交量的中位数为26,所以A正确;日平均成交量为eq \f(8+13+16+26+32+38+166,7)≈42.7,只有一天日成交量超过日平均成交量,所以B错误;由折线图的起伏变化可知,认购量与日期不是正相关,所以C错误;10月7日认购量的增幅为eq \f(276-112,112)×100%≈146.4%,10月7日成交量的增幅为eq \f(166-38,38)≈336.8%,显然10月7日认购量的增幅小于10月7日成交量的增幅,所以D错误,故选A.
答案:(1)A (2)A
变式练
2.解析:由题中两图可知C等级所占比例为12÷eq \f(10,20%)=24%,所以C等级及以上级别所占比例为20%+24%+46%=90%,所以C等级及以上级别的学生人数为1 000×90%=900.故选D.
答案:D
3.解析:对于A,根据折线图可以发现除2月份外,各月最低气温平均值越高,最高气温平均值也越高,总体呈正相关,A正确;对于B,通过折线图观察,2月份的两个点距离最大,B正确;对于C,各月最低气温平均值不高于10 ℃的有1月,2月,3月,11月,12月,共有5个月,C正确;对于D,观察折线图可知,7月份到8月份气温在上升,D错误.
答案:D
身高
(100,110]
(110,120]
(120,130]
(130,140]
(140,150]
频数
5
35
30
20
10
新农村
建设前
新农村
建设后
新农村建设
后变化情况
结论
种植收入
60%a
37%×2a=74%a
增加
A错
其他收入
4%a
5%×2a=10%a
增加了一倍以上
B对
养殖收入
30%a
30%×2a=60%a
增加了一倍
C对
养殖收入
+第三产
业收入
(30%+6%)a
=36%a
(30%+28%)
×2a=116%a
超过经济收
入2a的一半
D对
高考数学统考一轮复习第11章11.4用样本估计总体学案: 这是一份高考数学统考一轮复习第11章11.4用样本估计总体学案,共10页。学案主要包含了知识重温,小题热身等内容,欢迎下载使用。
2022届高三统考数学(文科)人教版一轮复习学案:1.1 集合: 这是一份2022届高三统考数学(文科)人教版一轮复习学案:1.1 集合,共6页。学案主要包含了知识重温,小题热身等内容,欢迎下载使用。
2022届高三统考数学(文科)人教版一轮复习学案:11.3 随机抽样: 这是一份2022届高三统考数学(文科)人教版一轮复习学案:11.3 随机抽样,共5页。学案主要包含了知识重温,小题热身等内容,欢迎下载使用。