高考数学(理数)一轮复习学案11.2《用样本估计总体》(含详解)
展开11.2 用样本估计总体
1.用样本的频率分布估计总体分布
(1)通常我们对总体作出的估计一般分成两种:一种是用样本的__________估计总体的__________;另一种是用样本的________估计总体的__________.
(2)在频率分布直方图中,纵轴表示________,数据落在各小组内的频率用________________表示.各小长方形的面积总和等于________.
(3)连接频率分布直方图中各小长方形上端的中点,就得到频率分布________.随着样本容量的增加,作图时所分的________增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称之为______________,它能够更加精细地反映出____________________________________.
(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以____________________,而且可以______________,给数据的记录和表示都带来方便.
2.用样本的数字特征估计总体的数字特征
(1)众数、中位数、平均数
众数:在一组数据中,出现次数________的数据叫做这组数据的众数.
中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或者最中间两个数据的________)叫做这组数据的中位数.
平均数:样本数据的算术平均数,即x=______________.
在频率分布直方图中,中位数左边和右边的直方图的面积应该________.
(2)样本方差、样本标准差
标准差s=,其中xn是__________________,n是________,是________.标准差是反映总体__________的特征数,样本方差是样本标准差的__________.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.
自查自纠:
1.(1)频率分布 分布 数字特征 数字特征
(2) 各小长方形的面积 1
(3)折线图 组数 总体密度曲线
总体在各个范围内取值的百分比
(4)保留所有信息 随时记录
2.(1)最多 平均数 (x1+x2+…+xn) 相等
(2)样本数据的第n项 样本容量 平均数
波动大小 平方
()从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中视力情况进行统计,其结果的频率分布直方图如图所示(按[0.3,0.5),[0.5,0.7),…,[1.3,1.5]分组).若某高校A专业视力的要求在0.9及以上,则该班学生中能报A专业的人数为
( )
A.30 B.25 C.22 D.20
解:50×(1.00+0.75+0.25)×0.2=20.故选D.
()某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是( )
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
解:易知B,C,D对,A错.故选A.
()下图是某企业产值在2008年~2017年的年增量(即当年产值比前一年产值增加的量)统计图(单位:万元),下列说法正确的是 ( )
A.2009年产值比2008年产值少
B.从2011年到2015年,产值年增量逐年减少
C.产值年增量的增量最大的是2017年
D.2016年的产值年增长率可能比2012年的产值年增长率低
解:选项A,2009年产值比2008年产值多29 565万元,故A错误;
选项B,54 877>51 066,故B错误;
选项C,产值年增量的增量最大的是2010年,故C错误;
选项D,因为增长率等于增长量除以上一年产值,由于上一年产值不确定,所以2016年的产值年增长率可能比2012年的产值年增长率低,D对.故选D.
()已知一组数据87,x,90,89,93的平均数为90,则该组数据的方差为__________________.
解:87+x+90+89+93=90×5,所以x=91,该组数据的方差为[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4.故填4.
()如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为________.
解:根据两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,所以=,解得x=3.故填3;5.
类型一 数字特征及其应用
(1)某工厂36名工人的年龄数据如下表.
工人编号
年龄
工人编号
年龄
工人编号
年龄
工人编号
年龄
1
40
10
36
19
27
28
34
2
44
11
31
20
43
29
39
3
40
12
38
21
41
30
43
4
41
13
39
22
37
31
38
5
33
14
43
23
34
32
42
6
40
15
45
24
42
33
53
7
45
16
39
25
37
34
37
8
42
17
38
26
44
35
49
9
43
18
36
27
42
36
39
(Ⅰ)用系统抽样法从36名工人中抽取容量为9的样本,且在第一分段里用随机抽样法抽到的年龄数据为44,列出样本的年龄数据;
(Ⅱ)计算(Ⅰ)中样本的平均值和方差s2;
(Ⅲ)36名工人中年龄在-s与+s之间有多少人?所占的百分比是多少(精确到0.01%)?
解:(Ⅰ)根据系统抽样的方法,抽取容量为9的样本,因此分成9组,每组4人,由于第一组中用随机抽样抽到的年龄数据为44,且编号间隔为4,因此,依次抽到的年龄数据为:44,40,36,43,36,37,44,43,37.
(Ⅱ)=(44+40+36+43+36+37+44+43+37)=40,
s2=[(44-40)2+(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+(43-40)2+(37-40)2]=.
(Ⅲ)s===,
-s=36,+s=43,在-s与+s之间的数据是37,38,39,40,41,42,43,处在此年龄阶段的工人一共有23人,所占比例为×100%≈63.89%.
点 拨:
本题主要考查系统抽样及平均数、方差的知识,意在考查数据处理能力和计算能力.
(2)()如果一组数x1,x2,…,xn的平均数是,方差是s2,则另一组数x1+,x2+,…,xn+的平均数和方差分别是
( )
A.,s2
B.+,s2
C.+,3s2
D.+,3s2+2s+2
解:因为x1,x2,…,xn的平均数是,方差是s2,
所以x1+,x2+,…,xn+的平均数是+,方差是()2s2=3s2.故选C.
点 拨:
若数据x1,x2,…,xn的平均数为,方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为m+a,方差为m2s2.
(1)()甲、乙两个城市2017年夏季连续5天中,每天的最高气温(单位:℃)数据如下:
城市
每天的最高气温
第1天
第2天
第3天
第4天
第5天
甲
28
31
27
33
31
乙
25
26
29
34
36
则这5天中,每天最高气温较为稳定(方差较小)的城市为_____________.(填“甲”或“乙”)
解:甲、乙两个城市的最高气温平均值都是30℃,甲的方差为=4.8,乙的方差为=18.8,所以每天最高气温较为稳定(方差较小)的城市为甲.故填甲.
(2)()已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数的平均数为,方差为s2,则 ( )
A.=5,s2>3 B.=5,s2<3
C.>5,s2<3 D.>5,s2>3
解:=5,s2=(8×3+02)<3.故选B.
类型二 频率分布表、频率分布直方图及其应用
(1)()某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用
水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
[0.6,0.7)
频数
1
3
2
4
9
26
5
使用了节水龙头50天的日用水量频数分布表
日用水量
[0,0.1)
[0.1,0.2)
[0.2,0.3)
[0.3,0.4)
[0.4,0.5)
[0.5,0.6)
频数
1
5
13
10
16
5
(Ⅰ)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;
(Ⅱ)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(Ⅲ)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)
解:(Ⅰ)
(Ⅱ)根据以上数据,该家庭使用水龙头后50天日用水量小于0.35 m3的频率为
0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,
因此该家庭使用节水龙头后日用水量小于0.35 m3的概率的估计值为0.48.
(Ⅲ)该家庭未使用节水龙头50天日用水量的平均数为
=(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.
该家庭使用了节水龙头后50天日用水量的平均数为
=(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.
估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).
(2)()某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图.
(Ⅰ)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(Ⅱ)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.
解:(Ⅰ)由用水量的频率分布直方图知,
该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.
所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.
依题意,w至少定为3.
(Ⅱ)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:
组号
1
2
3
4
5
6
7
8
分组
[2,4]
(4,6]
(6,8]
(8,10]
(10,12]
(12,17]
(17,22]
(22,27]
频率
0.1
0.15
0.2
0.25
0.15
0.05
0.05
0.05
根据题意,该市居民该月的人均水费估计为:
4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).
点 拨:
在频率分布直方图中,每个小矩形的面积就是相应的频率或概率,所有小矩形的面积之和为1,这是解题的关键,也是识图的基础.
(1)如图是追踪调查200个某种电子元件寿命(单位:h)的频率分布直方图,其中300~400、400~500两组数据丢失,下面四个说法中有且只有一个与原数据相符,这个说法是 ( )
①寿命在300~400的频数是90;
②寿命在400~500的矩形的面积是0.2;
③用频率分布直方图估计电子元件的平均寿命为:150×0.1+250×0.15+350×0.45+450×0.15+550×0.15;
④寿命超过400 h的频率为0.3.
A.① B.② C.③ D.④
解:若①正确,则300~400对应频率为=0.45,此时400~500对应频率为1-0.1-0.15×2-0.45=0.15,即图中2,4,5组的矩形应等高,矛盾,故①不正确.由此判断③中的计算错误,同时④中的频率应大于0.3,错误.即①③④错误.仅②正确.故选B.
(2)()从某市的中学生中随机调查了部分男生,获得了他们的身高数据,整理得到如下频率分布直方图.
(Ⅰ)求a的值;
(Ⅱ)假设同组中的每个数据用该组区间的中点值代替,估计该市中学生中的全体男生的平均身高;
(Ⅲ)从该市的中学生中随机抽取一名男生,根据直方图中的信息,估计其身高在180 cm以上的概率.若从全市中学的男生(人数众多)中随机抽取3人,用X表示身高在180 cm以上的男生人数,求随机变量X的分布列和数学期望E(X).
解:(Ⅰ)根据题意得: (0.005×2+a+0.020×2+0.040)×10=1.解得a=0.010.
(Ⅱ)设样本中男生身高的平均值为x,则
=145×0.05+155×0.1+165×0.2+175×0.4+185×0.2+195×0.05
=(145+195)×0.05+155×0.1+(165+185)×0.2+175×0.4
=17+15.5+70+70=172.5.
所以估计该市中学生中全体男生的平均身高为172.5 cm.
(Ⅲ)从全市中学的男生中任意抽取一人,其身高在180 cm以上的概率约为.
由已知得,随机变量X的可能取值为0,1,2,3.
所以P(X=0)=C·=;
P(X=1)=C·=;
P(X=2)=C·=;
P(X=3)=C·=.
随机变量X的分布列为
X
0
1
2
3
P
因为X~ B,所以E(X)=3×=.
类型三 茎叶图及其应用
()某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式,为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式,根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
第一种生产方式
第二种生产方式
8
9 7 6 2
9 8 7 7 6 5 4 3 3 2
2 1 1 0 0
6
7
8
9
5 5 6 8 9
0 1 2 2 3 4 5 6 6 8
1 4 4 5
0
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表;
超过m
不超过m
第一种生产方式
第二种生产方式
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附:K2=,
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
解:(1)第二种生产方式的效率更高.
理由如下:
(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.
(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.
(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.
(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多.关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同.故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.
以上给出了4种理由,答出其中任意一种或其他合理理由均可得分.
(2)由茎叶图知m==80.
超过m
不超过m
第一种生产方式
15
5
第二种生产方式
5
15
(3)K2==10>6.635,
所以有99%的把握认为两种生产方式的效率有差异.
点 拨:
本题考查茎叶图和独立性检验,根据茎叶的密集程度比较平均值大小,如果密集主干部位在高位,那么平均值大;方差看它们的数字偏离程度,偏离越大则方差越大.
某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:
(1)分别估计该市的市民对甲、乙两部门评分的中位数;
(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;
(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.
解:(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为67,所以该市的市民对乙部门评分的中位数的估计值是67.
(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为=0.1,=0.16.故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.
(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.
类型四 统计图的识别
(1)()某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图.
则下面结论中不正确的是 ( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
解:农村的经济收入增加了一倍,实现翻番,则A不正确,因为37%×2>60%.易知B,C,D均正确.故选A.
(2)()某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是 ( )
A.各月的平均最低气温都在0℃以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温高于20℃的月份有5个
解:平均最高气温高于20℃的月份只有七、八两个月份,D叙述不正确.故选D.
(3)()为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如下等高条形图:
根据图中的信息,下列结论中不正确的是
( )
A.样本中的男生数量多于女生数量
B.样本中喜欢手机支付的数量多于现金支付的数量
C.样本中多数男生喜欢手机支付
D.样本中多数女生喜欢现金支付
解:由左图知A正确,由右图知B,C正确,仅D的表述错误.故选D.
(4)()设下图是2018年第一季度某五省GDP情况图,则下列陈述中不正确的是 ( )
A.2018年第一季度GDP增速由高到低排位第5的是A省
B.与去年同期相比,2018年五省第一季度的GDP总量实现了增长
C.去年同期C省的GPD总量不超过4 000亿元
D.2018年第一季度GDP总量和增速由高到低排位均居同一位的省只有1个
解:A,B显然正确;4067.4÷(1+6.6%)≈3815.6,C正确;GDP总量由高到低排名:B、D、A、C、E,增速由高到低排名:B、E、D、C、A,有2个GDP总量与增速均居同一位,D不正确.故选D.
点 拨:
统计图表中除了茎叶图、散点图、频率分布直方图、折线图外,饼图、雷达图、等高条形图、柱形图等也是近年高考热点.难度不高,多与实际生活结合紧密,考查考生阅读理解能力及数据处理能力,考查应用意识.一般只要仔细读题、分析,即可解决.
(1)已知某地区中小学学生的近视情况分布如图1和图2所示,为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,据此可以判断出 ( )
A.共抽取了400名高中生
B.样本中约有27名近视的初中生
C.样本中高中生的近视人数比初中生高
D.高中女生与男生近视率相同
解:抽取的高中生人数为2000×2%=40,A项错误;样本中近视的初中生人数为4500×2%×30%=27,B项正确;样本中近视的高中生人数为40×50%=20,C项错误;D项无法判断.故选B.
(2)()某公司新研发了两种不同型号的平板电脑,公司统计了消费者对这两种型号平板电脑的评分情况,统计如下图,则下列说法不正确的是 ( )
A.甲、乙两型号的综合得分相同
B.乙型号电脑的拍照功能比较好
C.在性能方面,乙型号电脑做的比较好
D.消费者比较喜欢乙型号电脑的屏幕
解:由雷达图的数据可知,甲型号的综合得分为90+95+85+95+85=450,乙型号的综合得分为85+90+90+95+90=450,所以甲、乙两型号的综合得分相同,所以选项A正确;两种型号电脑的对比共涉及五个方面:系统评分相同、拍照功能乙型较好、外观设计甲型较好、屏幕甲型较好、性能乙型较好.综上,可知选项B、C正确.故选D.
(3)()如图是2004年至2013年我国三类专利申请总量的统计分析柱形图,则以下说法不正确的是 ( )
A.三类专利申请总量呈上升趋势
B.三类专利申请总量与年份呈正相关
C.2013年实用新型专利的数量与上一年相比有所增长
D.2013年发明专利的数量与上一年基本持平
解:由图易知A、B、C均正确,2013年发明专利的数量明显比上一年要多,所以D错误.故选D.
(4)()如图为2017年3~11月某市接待游客人数及与上年同期相比增速图.
根据该图,给出下列结论:
①2017年11月该市共接待游客35万人次,同比下降了3.1%;
②整体看来,该市2017年3~11月接待游客数量与上年同期相比都处于下降状态;
③2017年10月该市接待游客人数与9月相比的增幅小于2017年5月接待游客人数与4月相比的增幅.
其中正确结论的个数为 ( )
A.0 B.1 C.2 D.3
解:对于①,②,由图知正确.对于③,由图知该市2017年10月接待游客人数与9月相比的增幅为=≈0.164,该市2017年5月接待游客人数与4月相比的增幅为=≈0.114,所以③错误.综上可得①,②正确.故选C.
1.用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,直方图比较直观.
2.频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.
3.茎叶图的优点是原有信息不会抹掉,能够展示数据分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.
4.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差都是测量样本数据离散程度的工具,但在解决实际问题时,一般多采用标准差.
1.()为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是
( )
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
解:评估亩产量稳定程度的是标准差(或方差).故选B.
2.()某班学生A,B在高三8次月考的化学成绩用茎叶图表示如图,其中学生A的平均成绩与学生B的成绩的众数相等,则m= ( )
学生A
学生B
9 3
3 m 5 2
3 2
7
8
9
7 5
2 4 4 4
2 1
A.4 B.5 C.6 D.7
解:由题意,得=84,解得m=5.故选B.
3.()一组样本数据的频率分布直方图如图所示,试估计此样本数据的中位数为
( )
A.13 B.12 C.11.52 D.
解:由图知,(0.02+0.08)×4=0.4,则样本数据的中位数为10+4×=.故选D.
4.()某地区农民工人均月收入增长率如图1,并将人均月收入绘制成如图2的不完整的条形统计图.根据统计图来判断以下说法错误的是 ( )
A.2013年农民工人均月收入的增长率是10%
B.2011年农民工人均月收入是2 205元
C.2009年到2013年这五年中2013年农民工人均月收入最高
D.农民工2012年的人均月收入低于2 600元
解:由统计图易知A,B正确,且2009~2013年农民工人均月收入持续增长,所以这五年中2013年农民工人均月收入最高,且2012年人均月收入约为≈2646>2600.故选D.
5.()随着人民生活水平的提高,对城市空气质量的关注度也逐步增大,下图是某城市1月至8月的空气质量检测情况,图中一、二、三、四级是空气质量等级,一级空气质量最好,一级和二级都是空气质量合格,下面四种说法正确的是 ( )
①1月至8月空气质量合格天数超过20天的月份有5个
②第二季度与第一季度相比,空气质量合格天数的比重下降了
③8月是空气质量最好的一个月
④6月的空气质量最差
A.①②③ B.①②④
C.①③④ D.②③④
解:1月至8月空气质量合格天数超过20天的月份有:1月,2月,6月,7月,8月,共5个,故①正确;第一季度合格天数的比重为≈0.736,第二季度合格天数的比重为≈0.626,所以第二季度与第一季度相比,空气质量合格天数的比重下降了,故②正确;8月空气质量合格的天数达到30天,是空气质量最好的一个月,故③正确;5月空气质量合格天数只有13天,空气质量最差,故④错误.故选A.
6.某科研所共有职工20人,其年龄统计表如下:
年龄
38
39
40
41
42
人数
5
3
2
由于电脑故障,有两个数字在表格中不能显示出来,则下列说法正确的是 ( )
A.年龄数据的中位数是40,众数是38
B.年龄数据的中位数和众数一定相等
C.年龄数据的平均数∈(39,40)
D.年龄数据的平均数一定大于中位数
解:根据表中数据,得(5×38+10×39+3×41+2×42)<<(5×38+10×40+3×41+2×42),解得39.35<<39.85,所以∈(39,40).故选C.
7.()某学校为了调查学生在学科教辅书方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出的钱数在[30,40)的同学比支出的钱数在[10,20)的同学多26人,则n的值为______________.
解:由频率分布直方图可得支出的钱数在[30,40)的同学有0.038×10n=0.38n(人),支出的钱数在[10,20)的同学有0.012×10n=0.12n(人),则有0.38n-0.12n=0.26n=26,所以n=100.故填100.
8.抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:
运动员
第1次
第2次
第3次
第4次
第5次
甲
8.7
9.1
9.0
8.9
9.3
乙
8.9
9.0
9.1
8.8
9.2
则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.
解:甲==9.0,
乙==9.0,
s=[(8.7-9.0)2+(9.1-9.0)2+(9.0-9.0)2+(8.9-9.0)2+(9.3-9.0)2]=0.04,s=[(8.9-9.0)2+(9.0-9.0)2+(9.1-9.0)2+(8.8-9.0)2+(9.2-9.0)2]=0.02,s
甲:137,121,131,120,129,119,132,123,125,133
乙:110,130,147,127,146,114,126,110,144,146
(1)画出甲、乙两人成绩的茎叶图,并根据茎叶图,写出甲、乙两位同学成绩的平均值及中位数;
(2)规定成绩超过127为“良好”,现老师分别从甲、乙两人成绩中各随机选出一个,求选出成绩“良好”的个数X的分布列和数学期望.
解:(1)茎叶图如图:
X
0
1
2
P
E(X)=0++=1.
10.()某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图.
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4,所以所求为0.4.
(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5.
所以总体中分数在区间[40,50)内的人数估计为400×=20.
(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,
所以样本中分数不小于70的男生人数为60×=30.
所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.
所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.
11.()某社区为了解辖区住户中退休老人每天的平均户外“活动时间”,从辖区住户中的退休老人中随机抽取了100位老人进行调查,获得了每人每天的平均户外“活动时间”(单位:小时),活动时间按照[0,0.5),[0.5,1),…,[4,4.5]从少到多分成9组,制成样本的频率分布直方图如图所示.
(1)求图中a的值;
(2)估计该社区住户中退休老人每天的平均户外“活动时间”的中位数;
(3)在[1,1.5),[1.5,2)这两组中采用分层抽样抽取7人,再从这7人中随机抽取2人,求抽取的两人恰好都在同一个组的概率.
解:(1)由频率分布直方图可知,平均户外“活动时间”在[0,0.5)的频率为0.08×0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.20,0.25,0.07,0.04,0.02,
由1-(0.04+0.08+0.20+0.25+0.07+0.04+0.02)=0.5×a+0.5×a.解得a=0.30.
(2)设中位数为m小时.
因为前4组的频率之和为0.04+0.08+0.15+0.20=0.47<0.5,前5组的频率之和为0.04+0.08+0.15+0.20+0.25=0.72>0.5,所以2<m<2.5.
由0.50×(m-2)=0.5-0.47,解得m=2.06.
故可估计该社区住户中退休老人每天的平均户外“活动时间”的中位数为2.06小时.
为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为 ( )
A.9 B.10 C.11 D.12
解:不妨设样本数据为x1,x2,x3,x4,x5且x1<x2<x3<x4<x5,则由样本方差为4可知:(x1-7)2+(x2-7)2+(x3-7)2+(x4-7)2+(x5-7)2=20.五个整数的平方和为20,则这五个整数的平方只能在集合{0,1,4,9,16}中选取(每个数字最多出现2次):当这五个整数的平方中最大的为16时,分析可知,总不满足和为20;当这五个整数的平方中最大的为9时,{0,1,1,9,9}这组数满足要求,此时对应的样本数据为:x1=4,x2=6,x3=7,x4=8,x5=10;当这五个整数的平方中最大的数不超过4时,总不满足要求,因此不存在满足条件的另一组数据.故选B.
高考数学(理数)一轮复习学案10.9《正态分布》(含详解): 这是一份高考数学(理数)一轮复习学案10.9《正态分布》(含详解),共10页。
高考数学(理数)一轮复习学案9.7《双曲线》(含详解): 这是一份高考数学(理数)一轮复习学案9.7《双曲线》(含详解),共9页。
高考数学(理数)一轮复习学案9.6《椭 圆》(含详解): 这是一份高考数学(理数)一轮复习学案9.6《椭 圆》(含详解),共11页。