人教A版高考数学一轮总复习第9章第2节用样本估计总体课时学案
展开第二节 用样本估计总体
一、教材概念·结论·性质重现
1.频率分布直方图
(1)频率分布表的画法.
第一步:求极差,决定组数和组距,组距=;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
(2)频率分布直方图:反映样本频率分布的直方图(如图).
横轴表示样本数据,纵轴表示,每个小矩形的面积表示样本落在该组内的频率.
2.频率分布折线图
频率分布折线图:用线段连接频率分布直方图中各个矩形上面一边的中点,就得到频率分布折线图.
频率分布直方图中的常见结论
(1)众数的估计值为最高矩形的中点对应的横坐标.
(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标之和.
(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.
3.中位数、众数、平均数、百分位数
(1)中位数.
将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(2)众数.
一组数据中出现次数最多的数据称为这组数据的众数.
(3)平均数.
一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,…,xn的平均数=(x1+x2+…+xn).
(4)百分位数.
①第p百分位数的定义:
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
②计算一组n个数据的第p百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
4.样本的数字特征
如果有n个数据x1,x2,…,xn,那么
平均数为=(x1+x2+…+xn),
标准差为s=,
方差为s2=[(x1-)2+(x2-)2+…+(xn-)2].
(1)若数据x1,x2,…,xn的平均数为,则mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
(2)若数据x1,x2,…,xn的方差为s2,则数据ax1+b,ax2+b,…,axn+b的方差为a2s2.
二、基本技能·思想·活动体验
1.判断下列说法的正误,对的打“√”,错的打“×”.
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势. (√)
(2)一组数据的方差越大,说明这组数据越集中. (×)
(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大. (√)
2.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( )
A.4 B.8 C.12 D.16
B 解析:设频数为n,则=0.25,所以n=32×=8.
3.数据12,14,15,17,19,23,27,30的第70百分位数是( )
A.14 B.17 C.19 D.23
D 解析:因为8×70%=5.6,所以第70百分位数是第六项数据23.
4.若某校高一年级8个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是( )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
A 解析:因为这组数据为87,89,90,91,92,93,94,96,
所以中位数是=91.5,
平均数==91.5.故选A.
5.已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形.若中间一个小矩形的面积等于其余(n-1)个小矩形面积和的,则该组的频数为________.
50 解析:设除中间一个小矩形外的(n-1)个小矩形面积的和为p,则中间一个小矩形面积为p.由题意,得p+p=1,所以p=,则中间一个小矩形的面积为p=,200×=50,即该组的频数为50.
考点1 频率分布直方图——综合性
某市为了了解人们对“经济内循环”的认知程度,对不同年龄和不同职业的人举办了一次“经济内循环”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.
(1)求x.
(2)求抽取的x人的年龄的中位数(结果保留整数).
(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层随机抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组.从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.
(ⅰ)分别求5个年龄组和5个职业组成绩的平均数和方差;
(ⅱ)以上述数据为依据,评价5个年龄组和5个职业组对“经济内循环”的认知程度,并谈谈你的感想.
解:(1)根据频率分布直方图,得第一组的频率为0.01×5=0.05,所以=0.05,所以x=120.
(2)设中位数为a,则0.01×5+0.07×5+(a-30)×0.06=0.5,解得a=≈32,则中位数为32.
(3)(ⅰ)5个年龄组成绩的平均数为1=×(93+96+97+94+90)=94,
方差为s=×[(-1)2+22+32+02+(-4)2]=6.
5个职业组成绩的平均数为2=×(93+98+94+95+90)=94,
方差为s=×[(-1)2+42+02+12+(-4)2]=6.8.
(ⅱ)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可).
1.频率分布直方图的性质.
(1)小长方形的面积=组距×=频率;
(2)各小长方形的面积之和等于1;
(3)小长方形的高=,所有小长方形的高的和为.
2.要理解并记准频率分布直方图与众数、中位数、百分位数及平均数的关系.
1.(多选题)(2020·嘉祥县第一中学高三模拟)在某次高中学科知识竞赛中,对4 000名考生的参赛成绩进行统计,可得到如图所示的频率分布直方图,其中分组的区间为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100),60分以下视为不及格.若同一组中数据用该组区间中间值作代表值,则下列说法中正确的是( )
A.成绩在[70,80)的考生人数最多
B.不及格的考生人数为1 000
C.考生竞赛成绩的平均分约为70.5分
D.考生竞赛成绩的中位数为75分
ABC 解析:由频率分布直方图可得,成绩在[70,80)的频率最高,因此考生人数最多,故A正确;成绩在[40,60)的频率为0.01×10+0.015×10=0.25,因此,不及格的人数为4 000×0.25=1 000,故B正确;考生竞赛成绩的平均分约为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5,故C正确;因为成绩在[40,70)的频率为0.45,在[70,80)的频率为0.3,所以中位数为70+10×≈71.67,故D错误.
2.某车间加工零件的数量x与加工时间y的统计数据如表:
零件数x(个) | 9 | 11 | 14 | 15 | 16 |
加工时间y(分钟) | 30 | 32 | 36 | 40 | 42 |
该车间的负责人作出散点图,发现x,y是线性相关的,并求出y关于x的线性回归方程=x+(其中b是常数).据此回归模型可以预测,加工20个零件所需要的加工时间约为( )
A.45分钟 B.46分钟 C.47分钟 D.48分钟
D 解析:由题意,根据表中的数据,可得=(9+11+14+15+16)=13,
=(30+32+36+40+42)=36,即样本中心点为(13,36).
将样本中心点(13,36)代入回归方程,可得36=×13+,解得=,所以回归方程为=x+,当x=20时,=×20+=≈47.94≈48(分钟).
考点2 统计图表——综合性
(1)(多选题)(2020·德州一模)某市教体局对全市高三年级的学生身高进行抽样调查,随机抽取了100名学生,他们的身高都处在A,B,C,D,E五个层次内,根据抽样结果得到统计图表,则下面叙述正确的是( )
A.样本中女生人数多于男生人数
B.样本中B层人数最多
C.样本中E层男生人数为6
D.样本中D层男生人数多于女生人数
ABC 解析:样本中女生人数为9+24+15+9+3=60,男生人数为100-60=40,A正确.样本中A层人数为9+40×10%=13;样本中B层人数为24+40×30%=36;样本中C层人数为15+40×25%=25;样本中D层人数为9+40×20%=17;样本中E层人数为3+40×15%=9,B正确.样本中E层次男生人数为40×15%=6,C正确.样本中D层次男生人数为40×20%=8,女生人数为9,女生人数多于男生人数,D错误.
(2)(多选题)(2020·临沂一模)某同学在微信上查询到近十年全国高考报名人数、录取人数和山东夏季高考报名人数的折线图,其中2019年的录取人数被遮挡了.他又查询到近十年全国高考录取率的散点图,结合图表中的信息判定下列说法正确的是( )
A.全国高考报名人数逐年增加
B.2018年全国高考录取率最高
C.2019年高考录取人数约为820万
D.2019年山东高考报名人数在全国的占比最小
BCD 解析:2016年的人数少于2015年人数,A错误;2018年的录取率为81.1%,为最高,B正确;2019年高考录取人数为1 031×79.5%≈820,C正确;从2010~2019年山东高考报名人数在全国的占比分别为6.9%,6.3%,5.6%,5.5%,5.9%,7.4%,6.4%,6.2%,6.1%,5.4%,D正确.
统计图表问题的解决方法
(1)首先要准确地识图,即要明确统计图表中纵轴、横轴及折线、区域等所表示的意义,尤其注意数字变化的趋势等;
(2)其次要准确地用图,会根据统计图表中的数字计算样本的数字特征,会用统计图表估计总体.
1.(2020·鹤壁二模)中国铁路总公司相关负责人表示,到2018年底,全国铁路营业里程达到13.1万公里,其中高铁营业里程2.9万公里,超过世界高铁总里程的.下图是2014年到2018年铁路和高铁运营里程(单位:万公里)的折线图,以下结论不正确的是( )
A.每相邻两年相比较,2014年到2015年铁路运营里程增加最显著
B.从2014年到2018年这5年,高铁运营里程与年份正相关
C.2018年高铁运营里程比2014年高铁运营里程增长80%以上
D.从2014年到2018年这5年,高铁运营里程数依次成等差数列
D 解析:选项A,B显然正确;对于C,>0.8,选项C正确;1.6,1.9,2.2,2.5,2.9不是等差数列,故D错误.故选D.
2.甲、乙、丙三家企业产品的成本分别为10 000,12 000,15 000,其成本构成如图所示,则关于这三家企业下列说法错误的是( )
A.成本最大的企业是丙企业
B.费用支出最高的企业是丙企业
C.支付工资最少的企业是乙企业
D.材料成本最高的企业是丙企业
C 解析:甲企业的成本为10 000;乙企业的成本为12 000;丙企业的成本为15 000.故成本最大的是丙企业,故A正确.甲企业费用支出为10 000×5%=500;乙企业费用支出为12 000×17%=2 040;丙企业费用支出为15 000×15%=2 250.故费用支出最高的企业是丙企业,故B正确.甲企业支付工资为10 000×35%=3 500;乙企业支付工资为12 000×30%=3 600;丙企业支付工资为15 000×25%=3 750.故甲企业支付的工资最少,故C错误.甲企业材料成本为10 000×60%=6 000;乙企业材料成本为12 000×53%=6 360;丙企业材料成本为15 000×60%=9 000.故材料成本最高的企业是丙企业,故D正确.故选C.
考点3 样本的数字特征——综合性
(1)(2020·德州一模)某赛季甲、乙两名篮球运动员每场比赛得分用茎叶图表示,茎叶图中甲得分的部分数据丢失(如图),但甲得分的折线图完好,则下列结论正确的是( )
A.甲得分的极差是11
B.乙得分的中位数是18.5
C.甲运动员得分有一半在区间[20,30]上
D.甲运动员得分的平均值比乙运动员得分的平均值高
D 解析:甲得分的极差是28-9=19,A错误;乙得分的中位数是=16.5,B错误;甲运动员得分在区间[20,30]上有3个,C错误;甲运动员得分的平均值为=17,乙运动员得分的平均值为=16,故D正确.
(2)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:
运动员 | 第1次 | 第2次 | 第3次 | 第4次 | 第5次 |
甲 | 87 | 91 | 90 | 89 | 93 |
乙 | 89 | 90 | 91 | 88 | 92 |
则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.
2 解析:甲=(87+91+90+89+93)=90,乙=×(89+90+91+88+92)=90,
s甲=×[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,
s乙=×[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.
因为4>2,
所以乙的成绩较为稳定,其方差为2.
1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
2.用样本估计总体,就是利用样本的数字特征来描述总体的数字特征.
1.已知某7个数的平均数为4,方差为2.现加入一个新数据4,此时这8个数的平均数为,方差为s2,则( )
A.=4,s2<2 B.=4,s2>2
C.>4,s2<2 D.>4,s2>2
A 解析:因为某7个数的平均数为4,所以这7个数的和为4×7=28.因为加入一个新数据4,所以==4.又因为这7个数的方差为2,且加入一个新数据4,所以这8个数的方差s2==<2.故选A.
2.已知甲、乙两组数据:
甲组:27,28,39,40,m,50;
乙组:24,n,34,43,48,52.
若这两组数据的第30百分位数、第80百分位数分别相等,则等于( )
A. B. C. D.
A 解析:因为30%×6=1.8,80%×6=4.8,所以第30百分位数为n=28,第80百分位数为m=48,所以==.
人教A版高考数学一轮总复习第9章第1节随机抽样课时学案: 这是一份人教A版高考数学一轮总复习第9章第1节随机抽样课时学案,共7页。学案主要包含了教材概念·结论·性质重现,基本技能·思想·活动体验等内容,欢迎下载使用。
人教A版高考数学一轮总复习第8章第6节双曲线课时学案: 这是一份人教A版高考数学一轮总复习第8章第6节双曲线课时学案,共13页。学案主要包含了教材概念·结论·性质重现,基本技能·思想·活动体验等内容,欢迎下载使用。
人教A版高考数学一轮总复习第8章第5节椭圆课时学案: 这是一份人教A版高考数学一轮总复习第8章第5节椭圆课时学案,共17页。学案主要包含了教材概念·结论·性质重现,基本技能·思想·活动体验等内容,欢迎下载使用。