2022届高考数学一轮复习第十章算法初步统计统计案例10.3用样本估计总体学案理含解析北师大版
展开授课提示:对应学生用书第240页
知识点一 频率分布直方图、茎叶图
1.作频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差);
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表;
(5)画频率分布直方图W.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
3.茎叶图的优点
茎叶图的优点是不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.
• 温馨提醒 •
频率分布直方图与众数、中位数与平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数的估计值.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
1.学校为了解学生在课外读物方面的支出情况,抽取了n位同学进行调查,结果显示这些同学的支出都在[10,50](单位:元)之间,其频率分布直方图如图所示,其中支出在[10,30)(单位:元)内的同学有33人,则支出在[40,50](单位:元)内的同学人数为( )
A.100 B.120
C.30 D.300
解析:支出[10,30)的同学所占的频率为(0.01+0.023)×10=0.33,所以n=eq \f(33,0.33)=100.支出在[40,50)的同学所占的频率为1-(0.01+0.023+0.037)×10=0.3,故支出在[40,50)的同学人数是100×0.3=30.
答案:C
2.在如图所示的茎叶图所示的数据中,众数和中位数分别是( )
A.23,26 B.31,26
C.24,30 D.26,30
解析:由茎叶图得到所有的数据从小到大排列依次为12,14,20,23,25,26,30,31,31,41,42,∴众数和中位数分别为31,26.
答案:B
3.(2021·衡水中学五调)某“跑团”为了解团队每月跑步的平均里程,收集并整理了2020年1月至2020年11月期间“跑团”每月跑步的平均里程(单位:千米)的数据,绘制了下面的折线图.
根据折线图,下列结论正确的是( )
A.月跑步平均里程的中位数为6月份对应的平均里程数
B.月跑步平均里程逐月增加
C.月跑步平均里程高峰期大致在8月和9月
D.1月至5月的月跑步平均里程相对于6月至11月,波动性更小,变化比较平稳
解析:由折线图知,月跑步平均里程的中位数为5月份对应的平均里程数,A错;月跑步平均里程不是逐月增加的,B错;月跑步平均里程高峰期大致在9月和10月,C错.
答案:D
知识点二 样本的数字特征
1.众数、中位数、平均数
2.标准差、方差
(1)标准差:样本数据到平均数的一种平均距离,一般用s表示,s= eq \r(\f(1,n)[(x1-\(x,\s\up6(-)))2+(x2-\(x,\s\up6(-)))2+…+(xn-\(x,\s\up6(-)))2]).
(2)方差:标准差的平方s2
s2=eq \f(1,n)[(x1-eq \(x,\s\up6(-)))2+(x2-eq \(x,\s\up6(-)))2+…+(xn-eq \(x,\s\up6(-)))2],其中xi(i=1,2,3,…,n)是样本数据,n是样本容量,eq \(x,\s\up6(-))是样本平均数.
• 温馨提醒 •
1.众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
2.平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”.
1.已知样本数据3,5,7,4,6,则该样本标准差为( )
A.1 B.eq \r(2)
C.eq \r(3) D.2
解析:数据3,5,7,4,6的平均数为eq \(x,\s\up6(-))=eq \f(1,5)×(3+5+7+4+6)=5,方差为s2=eq \f(1,5)×[(3-5)2+(5-5)2+(7-5)2+(4-5)2+(6-5)2]=2,∴标准差为eq \r(2).
答案:B
2.(易错题)10名工人某天生产同一零件,生产的零件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有( )
A.a>b>c B.b>c>a
C.c>a>b D.c>b>a
解析:依题意,这些数据由小到大依次是10,12,14,14,15,15,16,17,17,17,因此a<15,b=15,c=17,c>b>a.
答案:D
授课提示:对应学生用书第242页
题型一 统计图表的应用
1.(2021·广州四校联考)如图是2019年第一季度A、B、C、D、E五省GDP情况图,则下列叙述中不正确的是( )
A.2019年第一季度GDP增速由高到低排位第5的是A省
B.与2018年同期相比,各省2019年第一季度的GDP总量实现了增长
C.2018年同期C省的GDP总量不超过4 000亿元
D.2019年第一季度GDP总量和增速由高到低排位均居同一位的省只有1个
解析:由折线图可知A,B正确;4 067.4÷(1+6.6%)≈3 816<4 000,故C正确;2019年第一季度GDP总量和增速由高到低排位均居同一位的省有B省均第一、C省均第四,共有2个,故D错误.
答案:D
2.(2021·珠海摸底)某班级在一次数学竞赛中设置了一等奖、二等奖、三等奖以及参与奖,各个奖品的单价分别为一等奖20元、二等奖10元、三等奖5元、参与奖2
元,获奖人数的分配情况如图所示,则以下说法不正确的是( )
A.获得参与奖的人数最多
B.各个奖项中三等奖的总费用最高
C.购买奖品的平均费用为9.25元
D.购买奖品的费用的中位数为2元
解析:设全班人数为a,由扇形统计图可知,一等奖占5%,二等奖占10%,三等奖占30%,参与奖占65%.获得参与奖的人数最多,故A正确;一等奖的总费用为5%a×20=a,二等奖的总费用为10%a×10=a,三等奖的总费用为30%a×5=eq \f(3,2)a,参与奖的总费用为65%a×2=eq \f(13,10)a,所以各个奖项中三等奖的总费用最高,故B正确;购买奖品的平均费用为5%×20+10%×10+30%×5+65%×2=4.8(元),故C错误;参与奖占65%,所以购买奖品的费用的中位数为2元,故D正确.
答案:C
利用折线图、饼图分析问题的关键是结合图形,弄清图中数据,读准问题要求.
题型二 频率分布直方图
[例] (2021·四川五校联考)随着新课程改革和高考综合改革的实施,高中教学以发展学生学科核心素养为导向,学习评价更关注学科核心素养的形成和发展.为此,某市于2020年举行第一届高中数学学科素养竞赛,竞赛结束后,为了评估该市高中学生的数学学科素养,从所有参赛学生中随机抽取1 000名学生的成绩(单位:分)作为样本进行估计,将抽取的成绩整理后分成五组,依次记为[50,60),[60,70),[70,80),[80,90),[90,100],并绘制成如图所示的频率分布直方图.
(1)请补全频率分布直方图,并估计这1 000名学生成绩的平均数(同一组数据用该组区间的中点值作代表);
(2)该市决定对本次竞赛成绩排在前180名的学生给予表彰,授予“数学学科素养优秀标兵”称号,一名学生本次竞赛成绩为79分,请你判断该学生能否被授予“数学学科素养优秀标兵”称号.
[解析] (1)成绩在[60,70)的频率为1-(0.30+0.15+0.10+0.05)=0.40,补全的频率分布直方图如图:
样本的平均数eq \(x,\s\up6(-))=55×0.30+65×0.40+75×0.15+85×0.10+95×0.05=67.
(2)因为eq \f(180,1 000)=0.18,
所以由频率分布直方图可以估计获得“数学学科素养优秀标兵”称号学生的最低成绩为80-eq \f(0.18-0.05-0.10,0.015)=78(分).
因为79>78,所以该同学能被授予“数学学科素养优秀标兵”称号.
由频率分布直方图进行相关计算时,需掌握的两个关系式
(1)eq \f(频率,组距)×组距=频率.
(2)eq \f(频数,样本容量)=频率,此关系式的变形为eq \f(频数,频率)=样本容量,样本容量×频率=频数.
[对点训练]
第23届冬季奥林匹克运动会于2018年2月9日~25日在韩国平昌郡举行,简称“平昌冬奥会”.某媒体随机采访了某市20名关注“平昌冬奥会”的市民,其年龄数据可绘制成如图所示的茎叶图,由于其中部分数据缺失,故打算根据频率分布直方图中的数据估计被采访的市民的平均年龄.
(1)完成频率分布直方图;
(2)根据(1)中的频率分布直方图估计被采访的市民的平均年龄x(同一组中的数据用该组区间的中点值作代表);
(3)根据茎叶图计算出被采访的市民的平均年龄为y,并假设a∈{n∈Z|0≤n≤9},且a取得每一个可能值的机会相等,在(2)的条件下,求P(y>x).
解析:(1)频率分布直方图如图:
(2)x=25×0.1+35×0.15+45×0.3+55×0.25+65×0.2=48,
即估计被采访的市民的平均年龄为48岁.
(3)y=eq \f(20×2+30×3+40×6+50×5+60×4+98+a,20)=eq \f(958+a,20),
故P(y>x)=P(eq \f(958+a,20)>48)=P(a>2)=0.7.
题型三 样本的数字特征及应用
[例] (2019·高考全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:eq \r(74)≈8.602.
[解析] (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为eq \f(14+7,100)=0.21.
产值负增长的企业频率为eq \f(2,100)=0.02.
用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2)eq \(y,\s\up6(-))=eq \f(1,100)×(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,
s2=eq \f(1,100)eq \(∑,\s\up6(5),\s\d4(i=1))ni(yi-eq \(y,\s\up6(-)))2
=eq \f(1,100)×[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]
=0.029 6,
s=eq \r(0.029 6)=0.02×eq \r(74)≈0.17.
所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.
利用样本的数字特征解决优化决策问题
(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
[题组突破]
1.(2020·高考全国卷Ⅲ)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为( )
A.0.01 B.0.1
C.1 D.10
解析:10x1,10x2,…,10xn的方差为102×0.01=1.
答案:C
2.为比较甲、乙两名篮球运动员的近期竞技状态,选取这两名球员最近五场比赛的得分,制成如图所示的茎叶图.有下列结论:
①甲最近五场比赛得分的中位数高于乙最近五场比赛得分的中位数;
②甲最近五场比赛得分的平均数低于乙最近五场比赛得分的平均数;
③从最近五场比赛的得分看,乙比甲更稳定;
④从最近五场比赛的得分看,甲比乙更稳定.
其中所有正确结论的编号为( )
A.①③ B.①④
C.②③ D.②④
解析:对于①,甲得分的中位数为29,乙得分的中位数为30,错误;对于②,甲得分的平均数为eq \f(1,5)×(25+28+29+31+32)=29,乙得分的平均数为eq \f(1,5)×(28+29+30+31+32)=30,正确;对于③,甲得分的方差为eq \f(1,5)×[(25-29)2+(28-29)2+(29-29)2+(31-29)2+(32-29)2]=eq \f(1,5)×(16+1+0+4+9)=6,乙得分的方差为eq \f(1,5)×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=eq \f(1,5)×(4+1+0+1+4)=2,所以乙比甲更稳定,③正确,④错误.所以正确结论的编号为②③.
答案:C
用样本估计总体应用中的核心素养
直观想象、数据分析——用样本估计总体的创新问题
[例] (2021·惠州市一调)某大学生在开学季准备销售一种文具盒进行试创业,在一个开学季内,每售出1盒该产品获得的利润为30元,未售出的产品,每盒亏损10元.该大学生通过查询资料得到开学季市场需求量的频率分布直方图,如图所示.该大学生为这个开学季购进了160盒该产品,以x(单位:盒,100≤x≤200)表示这个开学季内的市场需求量,y(单位:元)表示这个开学季内经销该产品的利润.
(1)根据直方图估计这个开学季内市场需求量x的众数和平均数;
(2)将y表示为x的函数;
(3)根据直方图估计利润y不少于4 000元的概率.
[解析] (1)由题中频率分布直方图得,这个开学季内市场需求量x的众数是150盒,
需求量在[100,120)内的频率为0.005 0×20=0.1,
需求量在[120,140)内的频率为0.010 0×20=0.2,
需求量在[140,160)内的频率为0.015 0×20=0.3,
需求量在[160,180)内的频率为0.012 5×20=0.25,
需求量在[180,200]内的频率为0.007 5×20=0.15.
则平均数eq \(x,\s\up6(-))=110×0.1+130×0.2+150×0.3+170×0.25+190×0.15=153(盒).
(2)因为每售出1盒该产品获得的利润为30元,未售出的产品,每盒亏损10元,
所以当100≤x<160时,y=30x-10×(160-x)=40x-1 600;
当160≤x≤200时,y=160×30=4 800.
所以y=eq \b\lc\{(\a\vs4\al\c1(40x-1 600,100≤x<160,,4 800,160≤x≤200.))
(3)因为利润y不少于4 000元,所以当100≤x<160时,由40x-1 600≥4 000,解得140≤x<160;
当160≤x≤200时,y=4 800>4 000恒成立,所以140≤x≤200时,利润y不少于4 000元.
故由(1)知利润y不少于4 000元的概率P=1-0.1-0.2=0.7.
用样本估计总体常与函数、不等式、概率求法等交汇考查,处理时需注意读图数据的准确性及交汇点的应用.
[对点训练]
如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40),[40,45]的网民人数成递减的等差数列,则年龄在[35,40)的网民出现的频率为( )
A.0.04 B.0.06
C.0.2 D.0.3
解析:由题意得,年龄在[20,25)的网民出现的频率为0.01×5=0.05,[25,30)的网民出现的频率为0.07×5=0.35,又[30,35),[35,40),[40,45]的网民人数成递减的等差数列,则其频率也成等差数列,又[30,45]的频率为1-0.05-0.35=0.6,则年龄在[35,40)的网民出现的频率为0.6÷3=0.2.
答案:C
命题分析预测
学科核心素养
从近五年高考来看,主要考查利用频率分布直方图、茎叶图、样本的数字特征估计总体,各种题型都有,难度中档偏下.
本节主要通过用样本估计总体提升数据分析与数学运算及直观想象核心素养.
数字特征
概念
优点与缺点
众数
一组数据中重复出现次数最多的数
众数通常用于描述变量的值出现次数最多的数.但显然它对其他数据信息的忽视使它无法客观地反映总体特征
中位数
把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数)
中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点
平均数
如果有n个数据x1,x2,…,xn,那么这n个数的平均数eq \(x,\s\up6(-))=eq \f(x1+x2+…+xn,n)
平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低
y的分组
[-0.20,0)
[0,0.20)
[0.20,0.40)
[0.40,0.60)
[0.60,0.80)
企业数
2
24
53
14
7
高考数学(理数)一轮复习学案12.1《算法初步》(含详解): 这是一份高考数学(理数)一轮复习学案12.1《算法初步》(含详解),共12页。
高考数学(理数)一轮复习学案11.2《用样本估计总体》(含详解): 这是一份高考数学(理数)一轮复习学案11.2《用样本估计总体》(含详解),共13页。
新教材高考数学一轮复习第9章统计与统计案例第2节用样本估计总体学案含解析: 这是一份新教材高考数学一轮复习第9章统计与统计案例第2节用样本估计总体学案含解析,共9页。学案主要包含了教材概念·结论·性质重现,基本技能·思想·活动体验等内容,欢迎下载使用。