还剩11页未读,
继续阅读
2021版新高考数学(山东专用)一轮学案:第十章第二讲 用样本估计总体
展开
第二讲 用样本估计总体
ZHI SHI SHU LI SHUANG JI ZI CE
知识梳理·双基自测
知识梳理
知识点一 用样本的频率分布估计总体分布
(1)频率分布表与频率分布直方图
频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,从中可以看到整个样本数据的频率分布情况.
绘制频率分布直方图的步骤为:
①__求极差__;②__决定组距与组数__;③__将数据分组__;④__列频率分布表__;⑤__画频率分布直方图__.
(2)频率分布折线图
顺次连接频率分布直方图中__各小长方形上端的中点__,就得到频率分布折线图.
(3)总体密度曲线
总体密度曲线反映了总体在各个范围内取值的百分比,它能提供更加精细的信息.
知识点二 茎叶图
(1)茎叶图中茎是指__中间__的一列数,叶是从茎的__旁边__生长出来的数.
(2)茎叶图的优点是可以__保留__原始数据,而且可以__随时__记录,这对数据的记录和表示都能带来方便.
知识点三 样本的数字特征
(1)众数:一组数据中出现次数最多的数.
(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.
(3)平均数:=____,反映了一组数据的平均水平.
(4)标准差:
s=____,反映了样本数据的离散程度.
(5)方差:s2=__[(x1-)2+(x2-)2+…+(xn-)2]__,反映了样本数据的离散程度.
重要结论
频率分布直方图与众数、中位数与平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的,均为.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
双基自测
题组一 走出误区
1.(多选题)下列结论中正确的是( ABD )
A.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势
B.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了
C.茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次
D.在频率分布直方图中,最高的小长方形底边中点的横坐标是众数
题组二 走进教材
2.(P81A组T1改编)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( B )
A.95,94 B.92,86
C.99,86 D.95,91
[解析] 由茎叶图可知,此组数据由小到大排列依次76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B .
3.(P7T1)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有__25__人.
[解析] 100×(0.5×0.5)=25(人).
题组三 考题再现
4.(2020·安徽六校教育研究会素质测试)甲、乙两名同学在6次数学考试中,所得成绩用茎叶图表示如下,若甲、乙两人这6次考试的平均成绩分别用甲,乙,表示,则下列结论正确的是( C )
A.甲>乙,且甲成绩比乙成绩稳定
B.甲>乙,且乙成绩比甲成绩稳定
C.甲<乙,且甲成绩比乙成绩稳定
D.甲<乙,且乙成绩比甲成绩稳定
[解析] 甲=80+=82,
乙=80+=83,
所以甲<乙,
因为甲数据比较集中,所以成绩比较稳定.
5.(2019·湖南师大附中模拟)学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人,则n的值为( A )
A.100 B.1 000
C.90 D.900
[解析] 支出在[50,60)元的频率为1-(0.1+0.24+0.36)=0.3.∴样本容量n==100.
KAO DIAN TU PO HU DONG TAN JIU
考点突破·互动探究
考点一 频率分布直方图——自主练透
例1 (1)(2019·江西赣州十四县联考)中央电视台播出《中国诗词大会》火遍全国,下面是组委会在选拔赛时随机抽取的100名选手的成绩,按成绩分组,得到的频率分布表如下所示:
组号
分组
频数
频率
第1组
[160,165)
0.100
笫2组
[165,170)
①
第3组
[170,175)
20
②
第4组
[175,180)
20
0.200
第5组
[180,185)
10
0.100
合计
100
1.00
(ⅰ)请先求出频率分布表中①、②位置的相应数据,再完成频率分布直方图(用阴影表示).
(ⅱ)为了能选拔出最优秀的选手,组委会决定在笔试成绩高的第3,4,5组中用分层抽样抽取5名选手进入第二轮面试,则第3,4,5组每组各抽取多少名选手进入第二轮面试?
(ⅲ)在(ⅱ)的前提下,组委会决定在5名选手中随机抽取2名选手接受考官A面试,求第4组至少有一名选手被考官A面试的概率.
(2)(2020·福建漳州质检)2018年9月的台风“山竹”对我国多个省市的财产造成重大损害,据统计直接经济损失达52亿元.某青年志愿者组织调查了某地区的50个农户在该次台风中造成的直接经济损失,将收集的损失数据分成五组:[0,2 000],(2 000,4 000],(4 000,6 000],(6 000,8 000],(8 000,10 000](单位:元),得到如图所示的频率分布直方图.
(ⅰ)试根据频率分布直方图估计该地区每个农户的损失(同一组中的数据用该区间的中点值代表);
(ⅱ)台风后该青年志愿者与当地政府向社会发出倡议,为该地区的农户捐款帮扶,现从这50户损失超过4 000元的农户中随机抽取2户进行重点帮扶,设抽出损失超过8 000元的农户数为X,求X的分布列和数学期望.
[解析] (1)(ⅰ)第1组的频数为100×0.100=10,
所以①处应填的数为100-(10+20+20+10)=40,
从而第2组的频率为=0.400.
②处应填的数为1-(0.1+0.4+0.2+0.1)=0.200.
频率分布直方图如图所示.
(ⅱ)因为第3,4,5组共有50名选手,所以利用分层抽样在50名选手中抽取5名选手进入第二轮面试时,每组抽取的人数分别为:
第3组:×5=2,第4组:×5=2,第5组:×5=1,
所以第3,4,5组分别抽取2人,2人,1人进入第二轮面试.
(ⅲ)记“第4组至少有一名选手被考官A面试”为事件A,
则P(A)==.
(或P(A)=1-P()=1-=)
(2)(ⅰ)记每个农户的平均损失为元,
则=1 000×0.3+3 000×0.4+5 000×0.18+7 000×0.06+9 000×0.06=33 601;
(ⅱ)由频率分布直方图,可得损失超过4 000元的农户共有(0.000 09+0.000 03+0.000 03)×2 000×50=15(户),损失超过8 000元的农户共有
0.000 03×2 000×50=3(户),
随机抽取2户,则X的可能取值为0,1,2;
计算P(X=0)==,
P(X=1)==,
P(X=2)==.
所以X的分布列为:
X
0
1
2
P
数学期望为E(X)=0×+1×+2×=.
名师点拨 ☞
应用频率分布直方图时的注意事项
用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距;(2)频率分布直方图中各长方形高的比也就是其频率之比;(3)频率分布直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.
〔变式训练1〕
(2020·安徽“皖南八校”摸底)某校高三年级有400名学生,在一次数学测试中,成绩都在[80,130](单位:分)内,其频率分布直方图如图,则这次测试数学成绩不低于100分的人数为__220__.
[解析] 根据频率分布直方图知:
(2a+0.04+0.03+0.02)×10=1⇒a=0.005;
计算出数学成绩不低于100分的频率为:
(0.03+0.02+0.005)×10=0.55;
所以这次测试数学成绩不低于100分的人数为0.55×400=220人.
考点二 茎叶图——师生共研
例2 (多选题)(2020·四川省乐山市调研改编)胡萝卜中含有大量的β-胡萝卜素,摄入人体消化器官后,可以转化为维生素A,现从a,b两个品种的胡萝卜所含的β-胡萝卜素(单位mg)得到茎叶图如图所示,则下列说法正确的是( ABD )
A.a B.a的方差大于b的方差
C.b品种的众数为3.31
D.a品种的中位数为3.27
[解析] 由茎叶图得:
b品种所含β-胡萝卜素普遍高于a品种,
∴a a品种的数据波动比b品种的数据波动大,
∴a的方差大于b的方差,故B正确;
b品种的众数为3.31与3.41,故C错误;
a品种的数据的中位数为:=3.27,故D正确.
名师点拨 ☞
茎叶图的绘制及应用
(1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.
(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.
〔变式训练2〕
(2019·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x与y的值分别为( A )
A.3,5 B.5,5
C.3,7 D.5,7
[解析] 甲组数据的中位数为65,由甲、乙两组数据的中位数相等,得y=5.又甲、乙两组数据的平均值相等,
∴×(56+65+62+74+70+x)=×(59+61+67+65+78),∴x=3.故选A.
考点三 样本数字特征——多维探究
角度1 样本数字特征与频率分布直方图
例3 如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是( B )
A.12.5,12.5 B.12.5,13
C.13,12.5 D.13,13
[解析] 由频率分布直方图可知,众数为=12.5,因为0.04×5=0.2,0.1×5=0.5,在频率分布直方图中,中位数左边和右边的面积相等,所以中位数在区间[10,15)内.设中位数为x,则(x-10)×0.1=0.5-0.2,解得x=13.
角度2 样本数字特征与茎叶图
例4 将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
则7个剩余分数的方差为____.
[解析] 由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x=91×7,解得x=4,∴s2=[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=.
角度3 样本数字特征的计算
例5 (2019·山东济南模拟)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为s2,则( A )
A.=4,s2<2 B.=4,s2>2
C.>4,s2<2 D.>4,s2>2
[解析] ∵某7个数的平均数为4,∴这7个数的和为4×7=28,∵加入一个新数据4,∴==4,又∵这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s2==<2,故选A.
名师点拨 ☞
平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数,中位数,众数描述其集中趋势,方差和标准差描述其波动大小.
〔变式训练3〕
(1)(角度1)(2019·固原模拟)某小区共有1 000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为__155__,平均数为__156.8__.
(2)(角度2)(2020·陕西西安八校联考)在一次技能比赛中,共有12人参加,他们的得分(百分制)茎叶图如图,则他们得分的中位数和方差分别为( B )
A.89 54.5 B.89 53.5
C.87 53.5 D.89 54
(3)(2019·湖南衡阳模拟)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x1,x2,x3,…,x100,它们的平均数为,方差为s2:其中扫码支付使用的人数分别为3x1+2,3x2+2,3x3+2,…,3x100+2,它们的平均数为′,方差为s′2,则′,s′2分别为( C )
A.3+2,3s2+2 B.3,3s2
C.3+2,9s2 D.3+2,9s2+2
[解析] (1)中位数为:150+(170-150)×=155.该组数据的平均数为=0.005×20×120+0.015×20×140+0.020×20×160+0.005×20×180+0.003×20×200+0.002×20×220=156.8.
(2)由题可知,中位数为:=89,先求平均数:
==90,
S2=[(-12)2+(-11)2+(-6)2+(-4)2+(-3)2+(-3)2+12+42+82+82+92+92]=53.5,
故中位数为:89,方差为53.5,故选:B.
(3)显然′=3+2,而每个数据上都加上或减去相同数不影响方差,但每个数据都乘以a,则方差变为原方差的a2倍,故选C.
考点四 折线图——师生共研
例6 (多选题)(2019·河南顶级名校模拟改编)如图是某地某月1日至15日的日平均温度变化的折线图,根据该折线图,下列结论不正确的是( BCD )
A.连续三天日平均温度的方差最大的是7日,8日,9日三天
B.这15天日平均温度的极差为15 ℃
C.由折线图能预测16日温度要低于19 ℃
D.由折线图能预测本月温度小于25 ℃的天数少于温度大于25 ℃的天数
[解析] A选项,日平均温度的方差的大小取决于日平均温度的波动的大小,7,8,9三日的日平均温度的波动最大,故日平均温度的方差最大,正确;B选项,这15天日平均温度的极差为18 ℃,B错;C选项,由折线图无法预测16日温度是否低于19 ℃,故C错误;D选项,由折线图无法预测本月温度小于25 ℃的天数是否少于温度大于25 ℃的天数,故D错误.故选B、C、D.
名师点拨 ☞
折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.
〔变式训练4〕
(多选题)甲乙两名同学在本学期的六次考试成绩统计如图,甲乙两组数据的平均值分别为甲、乙,则( BC )
A.每次考试甲的成绩都比乙的成绩高
B.甲的成绩比乙稳定
C.甲一定大于乙
D.甲的成绩的极差大于乙的成绩的极差
[解析] 第二次考试甲的成绩比乙低,A错;由图可知甲的成绩比乙的成绩波动小,B正确,D错;甲的平均成绩显然比乙的平均成绩高,C正确;故选B、C.
MING SHI JIANG TAN SU YANG TI SHENG
名师讲坛·素养提升
高考中统计图表、频率分布直方图的应用
例7 (1)(2018·全国Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
则下面结论中不正确的是( A )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
(2)(2019·湖南省衡阳市联考)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:
质量指标值分组
[75,85)
[85,95)
[95,105)
[105,115)
[115,125)
频数
6
26
38
22
8
①在答题卡上作出这些数据的频率分布直方图:
②估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
③根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?
[解析] (1)设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济收入为2a.新农村建设前后,各项收入的对比如下表:
新农村建设前
新农村建设后
新农村建设后变化情况
结论
种植收入
60%a
37%×2a=74%a
增加
A错
其他收入
4%a
5%×2a=10%a
增加了一倍以上
B对
养殖收入
30%a
30%×2a=60%a
增加了一倍
C对
养殖收入+
第三产业收入
(30%+6%)a
=36%a
(30%+28%)×2a
=116%a
超过经济收入2a的一半
D对
故选A.
(2)①
②质量指标值的样本平均数为
==100,
质量指标值的样本方差为
s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104
所以,这种产品质量指标的平均数估计值为100,方差的估计值为104.
③依题意=68%<80%,所以该企业生产的这种产品不符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.
名师点拨 ☞
(1)通过统计图可以很清楚地表示出各部分数量同总数之间的关系.
(2)准确理解频率分布直方图的数据特点是解题关键.
〔变式训练5〕
(2019·高考全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
[解析] (1)由已知得0.70=a+0.20+0.15,故a=0.35.
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05,
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
[答案] (1)a=0.35,b=0.10 (2)甲、乙离子残留百分比的平均值的估计值分别为4.05,6.00.
第二讲 用样本估计总体
ZHI SHI SHU LI SHUANG JI ZI CE
知识梳理·双基自测
知识梳理
知识点一 用样本的频率分布估计总体分布
(1)频率分布表与频率分布直方图
频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,从中可以看到整个样本数据的频率分布情况.
绘制频率分布直方图的步骤为:
①__求极差__;②__决定组距与组数__;③__将数据分组__;④__列频率分布表__;⑤__画频率分布直方图__.
(2)频率分布折线图
顺次连接频率分布直方图中__各小长方形上端的中点__,就得到频率分布折线图.
(3)总体密度曲线
总体密度曲线反映了总体在各个范围内取值的百分比,它能提供更加精细的信息.
知识点二 茎叶图
(1)茎叶图中茎是指__中间__的一列数,叶是从茎的__旁边__生长出来的数.
(2)茎叶图的优点是可以__保留__原始数据,而且可以__随时__记录,这对数据的记录和表示都能带来方便.
知识点三 样本的数字特征
(1)众数:一组数据中出现次数最多的数.
(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.
(3)平均数:=____,反映了一组数据的平均水平.
(4)标准差:
s=____,反映了样本数据的离散程度.
(5)方差:s2=__[(x1-)2+(x2-)2+…+(xn-)2]__,反映了样本数据的离散程度.
重要结论
频率分布直方图与众数、中位数与平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的,均为.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
双基自测
题组一 走出误区
1.(多选题)下列结论中正确的是( ABD )
A.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势
B.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了
C.茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次
D.在频率分布直方图中,最高的小长方形底边中点的横坐标是众数
题组二 走进教材
2.(P81A组T1改编)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( B )
A.95,94 B.92,86
C.99,86 D.95,91
[解析] 由茎叶图可知,此组数据由小到大排列依次76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B .
3.(P7T1)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有__25__人.
[解析] 100×(0.5×0.5)=25(人).
题组三 考题再现
4.(2020·安徽六校教育研究会素质测试)甲、乙两名同学在6次数学考试中,所得成绩用茎叶图表示如下,若甲、乙两人这6次考试的平均成绩分别用甲,乙,表示,则下列结论正确的是( C )
A.甲>乙,且甲成绩比乙成绩稳定
B.甲>乙,且乙成绩比甲成绩稳定
C.甲<乙,且甲成绩比乙成绩稳定
D.甲<乙,且乙成绩比甲成绩稳定
[解析] 甲=80+=82,
乙=80+=83,
所以甲<乙,
因为甲数据比较集中,所以成绩比较稳定.
5.(2019·湖南师大附中模拟)学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人,则n的值为( A )
A.100 B.1 000
C.90 D.900
[解析] 支出在[50,60)元的频率为1-(0.1+0.24+0.36)=0.3.∴样本容量n==100.
KAO DIAN TU PO HU DONG TAN JIU
考点突破·互动探究
考点一 频率分布直方图——自主练透
例1 (1)(2019·江西赣州十四县联考)中央电视台播出《中国诗词大会》火遍全国,下面是组委会在选拔赛时随机抽取的100名选手的成绩,按成绩分组,得到的频率分布表如下所示:
组号
分组
频数
频率
第1组
[160,165)
0.100
笫2组
[165,170)
①
第3组
[170,175)
20
②
第4组
[175,180)
20
0.200
第5组
[180,185)
10
0.100
合计
100
1.00
(ⅰ)请先求出频率分布表中①、②位置的相应数据,再完成频率分布直方图(用阴影表示).
(ⅱ)为了能选拔出最优秀的选手,组委会决定在笔试成绩高的第3,4,5组中用分层抽样抽取5名选手进入第二轮面试,则第3,4,5组每组各抽取多少名选手进入第二轮面试?
(ⅲ)在(ⅱ)的前提下,组委会决定在5名选手中随机抽取2名选手接受考官A面试,求第4组至少有一名选手被考官A面试的概率.
(2)(2020·福建漳州质检)2018年9月的台风“山竹”对我国多个省市的财产造成重大损害,据统计直接经济损失达52亿元.某青年志愿者组织调查了某地区的50个农户在该次台风中造成的直接经济损失,将收集的损失数据分成五组:[0,2 000],(2 000,4 000],(4 000,6 000],(6 000,8 000],(8 000,10 000](单位:元),得到如图所示的频率分布直方图.
(ⅰ)试根据频率分布直方图估计该地区每个农户的损失(同一组中的数据用该区间的中点值代表);
(ⅱ)台风后该青年志愿者与当地政府向社会发出倡议,为该地区的农户捐款帮扶,现从这50户损失超过4 000元的农户中随机抽取2户进行重点帮扶,设抽出损失超过8 000元的农户数为X,求X的分布列和数学期望.
[解析] (1)(ⅰ)第1组的频数为100×0.100=10,
所以①处应填的数为100-(10+20+20+10)=40,
从而第2组的频率为=0.400.
②处应填的数为1-(0.1+0.4+0.2+0.1)=0.200.
频率分布直方图如图所示.
(ⅱ)因为第3,4,5组共有50名选手,所以利用分层抽样在50名选手中抽取5名选手进入第二轮面试时,每组抽取的人数分别为:
第3组:×5=2,第4组:×5=2,第5组:×5=1,
所以第3,4,5组分别抽取2人,2人,1人进入第二轮面试.
(ⅲ)记“第4组至少有一名选手被考官A面试”为事件A,
则P(A)==.
(或P(A)=1-P()=1-=)
(2)(ⅰ)记每个农户的平均损失为元,
则=1 000×0.3+3 000×0.4+5 000×0.18+7 000×0.06+9 000×0.06=33 601;
(ⅱ)由频率分布直方图,可得损失超过4 000元的农户共有(0.000 09+0.000 03+0.000 03)×2 000×50=15(户),损失超过8 000元的农户共有
0.000 03×2 000×50=3(户),
随机抽取2户,则X的可能取值为0,1,2;
计算P(X=0)==,
P(X=1)==,
P(X=2)==.
所以X的分布列为:
X
0
1
2
P
数学期望为E(X)=0×+1×+2×=.
名师点拨 ☞
应用频率分布直方图时的注意事项
用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距;(2)频率分布直方图中各长方形高的比也就是其频率之比;(3)频率分布直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.
〔变式训练1〕
(2020·安徽“皖南八校”摸底)某校高三年级有400名学生,在一次数学测试中,成绩都在[80,130](单位:分)内,其频率分布直方图如图,则这次测试数学成绩不低于100分的人数为__220__.
[解析] 根据频率分布直方图知:
(2a+0.04+0.03+0.02)×10=1⇒a=0.005;
计算出数学成绩不低于100分的频率为:
(0.03+0.02+0.005)×10=0.55;
所以这次测试数学成绩不低于100分的人数为0.55×400=220人.
考点二 茎叶图——师生共研
例2 (多选题)(2020·四川省乐山市调研改编)胡萝卜中含有大量的β-胡萝卜素,摄入人体消化器官后,可以转化为维生素A,现从a,b两个品种的胡萝卜所含的β-胡萝卜素(单位mg)得到茎叶图如图所示,则下列说法正确的是( ABD )
A.a B.a的方差大于b的方差
C.b品种的众数为3.31
D.a品种的中位数为3.27
[解析] 由茎叶图得:
b品种所含β-胡萝卜素普遍高于a品种,
∴a a品种的数据波动比b品种的数据波动大,
∴a的方差大于b的方差,故B正确;
b品种的众数为3.31与3.41,故C错误;
a品种的数据的中位数为:=3.27,故D正确.
名师点拨 ☞
茎叶图的绘制及应用
(1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.
(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.
〔变式训练2〕
(2019·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x与y的值分别为( A )
A.3,5 B.5,5
C.3,7 D.5,7
[解析] 甲组数据的中位数为65,由甲、乙两组数据的中位数相等,得y=5.又甲、乙两组数据的平均值相等,
∴×(56+65+62+74+70+x)=×(59+61+67+65+78),∴x=3.故选A.
考点三 样本数字特征——多维探究
角度1 样本数字特征与频率分布直方图
例3 如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是( B )
A.12.5,12.5 B.12.5,13
C.13,12.5 D.13,13
[解析] 由频率分布直方图可知,众数为=12.5,因为0.04×5=0.2,0.1×5=0.5,在频率分布直方图中,中位数左边和右边的面积相等,所以中位数在区间[10,15)内.设中位数为x,则(x-10)×0.1=0.5-0.2,解得x=13.
角度2 样本数字特征与茎叶图
例4 将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
则7个剩余分数的方差为____.
[解析] 由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x=91×7,解得x=4,∴s2=[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=.
角度3 样本数字特征的计算
例5 (2019·山东济南模拟)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为s2,则( A )
A.=4,s2<2 B.=4,s2>2
C.>4,s2<2 D.>4,s2>2
[解析] ∵某7个数的平均数为4,∴这7个数的和为4×7=28,∵加入一个新数据4,∴==4,又∵这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s2==<2,故选A.
名师点拨 ☞
平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数,中位数,众数描述其集中趋势,方差和标准差描述其波动大小.
〔变式训练3〕
(1)(角度1)(2019·固原模拟)某小区共有1 000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为__155__,平均数为__156.8__.
(2)(角度2)(2020·陕西西安八校联考)在一次技能比赛中,共有12人参加,他们的得分(百分制)茎叶图如图,则他们得分的中位数和方差分别为( B )
A.89 54.5 B.89 53.5
C.87 53.5 D.89 54
(3)(2019·湖南衡阳模拟)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x1,x2,x3,…,x100,它们的平均数为,方差为s2:其中扫码支付使用的人数分别为3x1+2,3x2+2,3x3+2,…,3x100+2,它们的平均数为′,方差为s′2,则′,s′2分别为( C )
A.3+2,3s2+2 B.3,3s2
C.3+2,9s2 D.3+2,9s2+2
[解析] (1)中位数为:150+(170-150)×=155.该组数据的平均数为=0.005×20×120+0.015×20×140+0.020×20×160+0.005×20×180+0.003×20×200+0.002×20×220=156.8.
(2)由题可知,中位数为:=89,先求平均数:
==90,
S2=[(-12)2+(-11)2+(-6)2+(-4)2+(-3)2+(-3)2+12+42+82+82+92+92]=53.5,
故中位数为:89,方差为53.5,故选:B.
(3)显然′=3+2,而每个数据上都加上或减去相同数不影响方差,但每个数据都乘以a,则方差变为原方差的a2倍,故选C.
考点四 折线图——师生共研
例6 (多选题)(2019·河南顶级名校模拟改编)如图是某地某月1日至15日的日平均温度变化的折线图,根据该折线图,下列结论不正确的是( BCD )
A.连续三天日平均温度的方差最大的是7日,8日,9日三天
B.这15天日平均温度的极差为15 ℃
C.由折线图能预测16日温度要低于19 ℃
D.由折线图能预测本月温度小于25 ℃的天数少于温度大于25 ℃的天数
[解析] A选项,日平均温度的方差的大小取决于日平均温度的波动的大小,7,8,9三日的日平均温度的波动最大,故日平均温度的方差最大,正确;B选项,这15天日平均温度的极差为18 ℃,B错;C选项,由折线图无法预测16日温度是否低于19 ℃,故C错误;D选项,由折线图无法预测本月温度小于25 ℃的天数是否少于温度大于25 ℃的天数,故D错误.故选B、C、D.
名师点拨 ☞
折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.
〔变式训练4〕
(多选题)甲乙两名同学在本学期的六次考试成绩统计如图,甲乙两组数据的平均值分别为甲、乙,则( BC )
A.每次考试甲的成绩都比乙的成绩高
B.甲的成绩比乙稳定
C.甲一定大于乙
D.甲的成绩的极差大于乙的成绩的极差
[解析] 第二次考试甲的成绩比乙低,A错;由图可知甲的成绩比乙的成绩波动小,B正确,D错;甲的平均成绩显然比乙的平均成绩高,C正确;故选B、C.
MING SHI JIANG TAN SU YANG TI SHENG
名师讲坛·素养提升
高考中统计图表、频率分布直方图的应用
例7 (1)(2018·全国Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
则下面结论中不正确的是( A )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
(2)(2019·湖南省衡阳市联考)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:
质量指标值分组
[75,85)
[85,95)
[95,105)
[105,115)
[115,125)
频数
6
26
38
22
8
①在答题卡上作出这些数据的频率分布直方图:
②估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
③根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?
[解析] (1)设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济收入为2a.新农村建设前后,各项收入的对比如下表:
新农村建设前
新农村建设后
新农村建设后变化情况
结论
种植收入
60%a
37%×2a=74%a
增加
A错
其他收入
4%a
5%×2a=10%a
增加了一倍以上
B对
养殖收入
30%a
30%×2a=60%a
增加了一倍
C对
养殖收入+
第三产业收入
(30%+6%)a
=36%a
(30%+28%)×2a
=116%a
超过经济收入2a的一半
D对
故选A.
(2)①
②质量指标值的样本平均数为
==100,
质量指标值的样本方差为
s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104
所以,这种产品质量指标的平均数估计值为100,方差的估计值为104.
③依题意=68%<80%,所以该企业生产的这种产品不符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.
名师点拨 ☞
(1)通过统计图可以很清楚地表示出各部分数量同总数之间的关系.
(2)准确理解频率分布直方图的数据特点是解题关键.
〔变式训练5〕
(2019·高考全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
[解析] (1)由已知得0.70=a+0.20+0.15,故a=0.35.
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05,
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
[答案] (1)a=0.35,b=0.10 (2)甲、乙离子残留百分比的平均值的估计值分别为4.05,6.00.
相关资料
更多