高考数学一轮复习 第九章 第2节
展开知 识 梳 理
1.频率分布直方图
(1)频率分布表的画法:
第一步:求极差,决定组数和组距,组距=eq \f(极差,组数);
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
(2)频率分布直方图:反映样本频率分布的直方图(如图)
横轴表示样本数据,纵轴表示eq \f(频率,组距),每个小矩形的面积表示样本落在该组内的频率.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
3.样本的数字特征
(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:把eq \f(a1+a2+…+an,n)称为a1,a2,…,an这n个数的平均数.
(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为eq \(x,\s\up6(-)),则这组数据的标准差和方差分别是
s=eq \r(\f(1,n)[(x1-\(x,\s\up6(-)))2+(x2-\(x,\s\up6(-)))2+…+(xn-\(x,\s\up6(-)))2]),
s2=eq \f(1,n)[(x1-eq \(x,\s\up6(-)))2+(x2-eq \(x,\s\up6(-)))2+…+(xn-eq \(x,\s\up6(-)))2].
4.百分位数
如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数.可表示为:一组n个观测值按数值大小排列.如,处于p%位置的值称第p百分位数.
[微点提醒]
1.频率分布直方图与众数、中位数与平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
2.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为eq \(x,\s\up6(-)),那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是meq \(x,\s\up6(-))+a.
(2)数据x1,x2,…,xn的方差为s2.
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2.
3.中位数相当于第50百分位数.
基 础 自 测
1.判断下列结论正误(在括号内打“√”或“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )
(2)一组数据的方差越大,说明这组数据越集中.( )
(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大.( )
解析 (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势.
(2)错误.方差越大,这组数据越离散.
(3)正确.小矩形的面积=组距×eq \f(频率,组距)=频率.
答案 (1)√ (2)× (3)√
2.(必修3P1002(1)改编)一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( )
A.4 B.8 C.12 D.16
解析 设频数为n,则eq \f(n,32)=0.25,∴n=32×eq \f(1,4)=8.
答案 B
3.(必修3P70示例改编)若某校高一年级8个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是( )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
解析 ∵这组数据为87,89,90,91,92,93,94,96,
∴中位数是eq \f(91+92,2)=91.5,
平均数eq \(x,\s\up6(-))=eq \f(87+89+90+91+92+93+94+96,8)=91.5.
答案 A
4.(2018·全国Ⅰ卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
解析 法一 设新农村建设前经济收入为a,则新农村建设后经济收入为2a,则由饼图可得新农村建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.新农村建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.
法二 因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的.
答案 A
5.(2019·新余二模)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是( )
A.是否倾向选择生育二胎与户籍有关
B.是否倾向选择生育二胎与性别无关
C.倾向选择生育二胎的人员中,男性人数与女性人数相同
D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数
解析 由题图,可得是否倾向选择生育二胎与户籍有关、性别无关,倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中,男性人数为60×60%=36,女性人数为40×60%=24,不相同.故选C.
答案 C
6.(2019·上海黄浦区质检)已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形,若中间一个小矩形的面积等于其余(n-1)个小矩形面积和的eq \f(1,3),则该组的频数为________.
解析 设除中间一个小矩形外的(n-1)个小矩形面积的和为p,则中间一个小矩形面积为eq \f(1,3)p,p+eq \f(1,3)p=1,p=eq \f(3,4),则中间一个小矩形的面积等于eq \f(1,3)p=eq \f(1,4),200×eq \f(1,4)=50,即该组的频数为50.
答案 50
考点一 频率分布直方图
【例1】 (2019·石家庄模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.
(1)求x;
(2)求抽取的x人的年龄的中位数(结果保留整数);
(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.
(ⅰ)分别求5个年龄组和5个职业组成绩的平均数和方差;
(ⅱ)以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.
解 (1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴eq \f(6,x)=0.05,∴x=120.
(2)设中位数为a,则0.01×5+0.07×5+(a-30)×0.06=0.5,
∴a=eq \f(95,3)≈32,则中位数为32.
(3)(ⅰ)5个年龄组成绩的平均数为eq \(x,\s\up6(-))1=eq \f(1,5)×(93+96+97+94+90)=94,方差为seq \\al(2,1)=eq \f(1,5)×[(-1)2+22+32+02+(-4)2]=6.
5个职业组成绩的平均数为eq \(x,\s\up6(-))2=eq \f(1,5)×(93+98+94+95+90)=94,方差为seq \\al(2,2)=eq \f(1,5)×[(-1)2+42+02+12+(-4)2]=6.8.
(ⅱ)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可).
规律方法 1.频率分布直方图的性质.
(1)小长方形的面积=组距×eq \f(频率,组距)=频率;
(2)各小长方形的面积之和等于1;
(3)小长方形的高=eq \f(频率,组矩),所有小长方形的高的和为eq \f(1,组距).
2.要理解并记准频率分布直方图与众数、中位数及平均数的关系.
【训练1】 某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频率分布表.
A地区用户满意度评分的频率分布直方图
图①
B地区用户满意度评分的频率分布表
(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
B地区用户满意度评分的频率分布直方图
图②
(2)根据用户满意度评分,将用户和满意度分为三个等级:
估计哪个地区用户的满意度等级为不满意的概率大?说明理由.
解 (1)作出频率分布直方图如图:
通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.
(2)A地区用户的满意度等级为不满意的概率大.
记CA表示事件:“A地区用户的满意度等级为不满意”;
CB表示事件:“B地区用户的满意度等级为不满意”.
由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,
P(CB)的估计值为(0.005+0.02)×10=0.25.
所以A地区用户的满意度等级为不满意的概率大.
考点二 样本的数字特征
【例2】 (1)(2017·全国Ⅰ卷)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
(2)(2019·聊城模拟)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为eq \(x,\s\up6(-)),方差为s2,则( )
A.eq \(x,\s\up6(-))=4,s2<2 B.eq \(x,\s\up6(-))=4,s2>2
C.eq \(x,\s\up6(-))>4,s2<2 D.eq \(x,\s\up6(-))>4,s2>2
解析 (1)刻画评估这种农作物亩产量稳定程度的指标是标准差.
(2)∵某7个数的平均数为4,
∴这7个数的和为4×7=28,
∵加入一个新数据4,∴eq \(x,\s\up6(-))=eq \f(28+4,8)=4.
又∵这7个数的方差为2,且加入一个新数据4,
∴这8个数的方差s2=eq \f(7×2+(4-4)2,8)=eq \f(7,4)<2,故选A.
答案 (1)B (2)A
规律方法 1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
【训练2】 抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:
则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.
解析 eq \(x,\s\up6(-))甲=eq \f(1,5)(87+91+90+89+93)=90,
eq \(x,\s\up6(-))乙=eq \f(1,5)(89+90+91+88+92)=90,
seq \\al(2,甲)=eq \f(1,5)[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,
seq \\al(2,乙)=eq \f(1,5)[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.
答案 2
[思维升华]
1.用样本估计总体是统计的基本思想.
用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.
2.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.
(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大.
3.频率分布表和频率分布直方图都可直观描述样本数据的分布规律.
[易错防范]
直方图与条形图不要搞混
频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.
数据分析——百分位数的统计含义
1.数据分析是指针对研究对象获取数据,运用数学方法对数据进行整理、分析和推断,形成关于研究对象知识的素养.数据分析过程主要包括:收集数据,整理数据,提取信息,构建模型,进行推断,获得结论.
2.数据分析是研究随机现象的重要数学技术,是大数据时代数学应用的主要方法,也是“互联网+”相关领域的主要数学方法,数据分析已经深入到科学、技术、工程和现代社会生活的各个方面.
3.数据分析主要表现为:收集和整理数据,理解和处理数据,获得和解释结论,概括和形成知识.
4.百分位数是统计学述语,百分位数用于描述一组数据某一百分位置的水平,多个百分位数结合应用,可全面描述一组观察值的分布特征;百分位数还可用于确定非正态分布资料的医学参考值范围.但应用百分位数时,样本含量要足够大,否则不宜取太靠近两端的百分位数.
【案例】 阶梯电价的设计(此材料见2017版课程标准P130)
[情境] 为了实现绿色发展,避免浪费能源,某市政府计划对居民用电采用阶梯收费的方法.为此,相关部门在该市随机调查了200户居民六月份的用电量(单位:kW·h),以了解这个城市家庭用电量的情况.数据如下:
107 101 78 99 208 127 74 223 31 131
214 135 89 66 60 115 189 135 146 127
203 97 96 62 65 111 56 151 106 8
162 91 67 93 212 159 61 63 178 194
194 216 101 98 139 78 110 192 105 96
22 50 138 251 120 112 100 201 98 84
137 203 260 134 156 61 70 100 72 164
174 131 93 100 163 80 76 95 152 182
88 247 191 70 130 49 114 110 163 202
265 18 94 146 149 147 177 339 57 109
107 182 101 148 274 289 82 213 165 224
142 61 108 137 90 254 201 83 253 113
130 82 170 110 108 63 250 237 120 84
154 288 170 123 172 319 62 133 130 127
107 71 96 140 77 106 132 106 135 132
167 82 258 542 51 107 69 98 72 48
109 134 250 42 320 113 180 144 116 530
200 174 135 160 462 139 133 304 191 283
121 132 118 134 124 178 206 626 120 274
141 80 187 88 324 136 498 169 77 57
根据以上数据,应当如何确定阶梯电价中的电量临界值,才能使得电价更为合理?
[分析]选取六月份调查,是因为这个城市六月份的部分时间需要使用空调,因此六月份的用电量在一年12个月中处于中等偏上水平.如果阶梯电价临界值的确定依赖于居民月用电量的分布,例如计划实施3阶的阶梯电价,有人给出一个分布如下:75%用户在第一档(最低一档),20%用户在第二档,5%用户在第三档(最高一档).这样,需要通过样本数据估计第一档与第二档、第二档与第三档的两个电量临界值,即75%和95%这两个电量临界值.
通过样本估计总体百分位数的要领是对样本数据进行排序,得到有序样本(在统计学中称之为顺序统计量).利用电子表格软件,对上面的样本数据进行排序,可以得到下面的结果:
8 18 22 31 42 48 49 50 51 56
57 57 60 61 61 61 62 62 63 63
65 66 67 69 70 70 71 72 72 74
76 77 77 78 78 80 80 82 82 82
83 84 84 88 88 89 90 91 93 93
94 95 96 96 96 97 98 98 98 99
100 100 100 101 101 101 105 106 106 106
107 107 107 107 108 108 109 109 110 110
110 111 112 113 113 114 115 116 118 120
120 120 121 123 124 127 127 127 130 130
130 131 131 132 132 132 133 133 134 134
134 135 135 135 135 136 137 137 138 139
139 140 141 142 144 416 146 147 148 149
151 152 154 156 159 160 162 163 163 164
165 167 169 170 170 172 174 174 177 178
178 180 182 182 187 189 191 191 192 194
194 200 201 201 202 203 203 206 208 212
213 214 216 223 224 237 247 250 250 251
253 254 258 260 265 274 274 283 288 289
304 319 320 324 339 462 498 530 542 626
样本数据总共有200个,最小值是8,最大值是626,说明200户居民六月份的最小用电量为8 kW·h,最大用电量为626 kW·h,极差为618.初中统计内容中学过的中位数,相当于50%分位数.因为数据量是200,那么这组数据的样本中位数就是有序样本第100个数130和101个数130的平均数,即130,说明这个城市六月份居民用电量的中间水平大约在130 kW·h左右.
下面确定75%和95%这两个电量临界值.类似中位数的计算,因为200×75%=150,所以第一个临界值为有序样本中第150个数178和第151个数178的平均数,仍然是178.因为200×95%=190,所以第二个临界值为有序样本中第190个数289和第191个数304的平均数,这个平均数为296.5(因为是对百分位数的估计,估计值可以是289和304之间任何一个数,为了便于操作可以取值为297).
依据确定了的电量临界值,阶梯电价可以规定如下:用户每月用电量不超过178 kW·h(或每年用电量不超过2 136 kW·h),按第一档电价标准缴费;每月用电量(单位:kW·h)在区间(178,297]内(或每年用电量在区间(2 136,3 564]内),其中的178 kW·h按第一档电价标准缴费,超过178 kW·h的部分按第二档电价标准缴费;每月用量超过297 kW·h(或每年用电量超过3 564 kW·h),其中的178 kW·h按第一档电价标准缴费,(297-178)=119 kW·h按第二档电价标准缴费,超过297 kW·h的部分按第三档电价标准缴费.
社会上对这种制定阶梯电价的原则和方法存在不同意见,可以讨论制定合理阶梯电价的原则和方法.
评析 分位数是用于衡量数据的位置的量度,但它所衡量的,不一定是中心位置.百分位数提供了有关各数据项如何在最小值与最大值之间分布的信息.对于无大量重复的数据,第p百分位数将它分为两个部分.大约有p%的数据项的值比第p百分位数小;而大约有(100-p)%的数据项的值比第p百分位数大.对第p百分位数,严格的定义如下:
第p百分位数是这样一个值,它使得至少有p%的数据项小于或等于这个值,且至少有(100-p)%的数据项大于或等于这个值.
【案例应用1】 对于考试成绩的统计,如果您的成绩处在95的百分位数上,则意味着95%的参加考试者得到了和您一样的考分或还要低的考分,而不是您答对了95%的试题.也许您只答对了20%,即使如此,您取得的成绩也与95%的参加考试者一样好,或者比95%的参加考试者更好.
【案例应用2】 假设想为退休存够钱.可创建一个包括所有不确定变量的模型,如投资年回报率、通货膨胀、退休时的开支等,得到概率分布的结果如下图所示,如果选择平均值,钱不够的概率就会有50%.所以选第90百分位数所对应的投资数,这样钱不够的概率将只有10%.
基础巩固题组
(建议用时:40分钟)
一、选择题
1.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )
A.45 B.50 C.55 D.60
解析 由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3.
∴该班学生人数n=eq \f(15,0.3)=50.
答案 B
2.甲、乙、丙、丁四人参加某运动会射击项目的选拔赛,四人的平均成绩和方差如下表所示:
从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是( )
A.甲 B.乙 C.丙 D.丁
解析 由题表中数据可知,丙的平均环数最高,且方差最小,说明技术稳定,且成绩好.
答案 C
3.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
解析 由图可得,eq \(x,\s\up6(-))甲=eq \f(4+5+6+7+8,5)=6,
eq \(x,\s\up6(-))乙=eq \f(3×5+6+9,5)=6,A项错误;
甲的成绩的中位数为6,乙的成绩的中位数为5,B项错误;
seq \\al(2,甲)=eq \f((4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2,5)=2,
seq \\al(2,乙)=eq \f(3×(5-6)2+(6-6)2+(9-6)2,5)=2.4,C项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D项错误.
答案 C
4.(2019·茂名联考)甲组数据为:5,12,16,21,25,37,乙组数据为:1,6,14,18,38,39,则甲、乙的平均数、极差及中位数相同的是( )
A.极差 B.平均数
C.中位数 D.都不相同
解析 由题中数据的分布,可知极差不同,
甲的中位数为eq \f(16+21,2)=18.5,乙的中位数为eq \f(14+18,2)=16,
eq \(x,\s\up6(-))甲=eq \f(5+16+12+25+21+37,6)=eq \f(58,3),
eq \(x,\s\up6(-))乙=eq \f(1+6+14+18+38+39,6)=eq \f(58,3),
所以甲、乙的平均数相同.故选B.
答案 B
二、填空题
5.某校女子篮球队7名运动员身高(单位:cm)的数据分别为:171,172,17x,174,175,180,181,已知记录的平均身高为175 cm,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x,那么x的值为________.
解析 170+eq \f(1,7)×(1+2+x+4+5+10+11)=175,
eq \f(1,7)×(33+x)=5,即33+x=35,解得x=2.
答案 2
6.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)[25,30)年龄组对应小矩形的高度为________;
(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.
解析 设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.则志愿者年龄在[25,35)年龄组的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)年龄组的人数约为0.55×800=440.
答案 (1)0.04 (2)440
7.已知样本数据x1,x2,…,xn的平均数eq \(x,\s\up6(-))=5,则样本数据2x1+1,2x2+1,…,2xn+1的平均数为________.
解析 由x1,x2,…,xn的平均数eq \(x,\s\up6(-))=5,得2x1+1,2x2+1,…,2xn+1的平均数为2eq \(x,\s\up6(-))+1=2×5+1=11.
答案 11
三、解答题
8.某校2019届高三文(1)班在一次数学测验中,全班N名学生的数学成绩的频率分布直方图如下,已知分数在110~120的学生有14人.
(1)求总人数N和分数在120~125的人数n;
(2)利用频率分布直方图,估算该班学生数学成绩的众数和中位数各是多少?
解 (1)分数在110~120内的学生的频率为
p1=(0.04+0.03)×5=0.35,
所以该班总人数N=eq \f(14,0.35)=40.
分数在120~125内的学生的频率为
p2=1-(0.01+0.04+0.05+0.04+0.03+0.01)×5=0.10,
分数在120~125内的人数n=40×0.10=4.
(2)由频率分布直方图可知,众数是最高的小矩形底边中点的横坐标,即为eq \f(105+110,2)=107.5.
设中位数为a,
∵0.01×5+0.04×5+0.05×5=0.50,∴a=110.
∴众数和中位数分别是107.5,110.
9.(2017·北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,
所以样本中分数小于70的频率为1-0.6=0.4.
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.
(2)根据题意,样本中分数不小于50的频率为
(0.01+0.02+0.04+0.02)×10=0.9,
分数在区间[40,50)内的人数为100-100×0.9-5=5.
所以总体中分数在区间[40,50)内的人数估计为400×eq \f(5,100)=20.
(3)由题意可知,样本中分数不小于70的学生人数为
(0.02+0.04)×10×100=60,
所以样本中分数不小于70的男生人数为60×eq \f(1,2)=30.
所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.
所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.
能力提升题组
(建议用时:20分钟)
10.(2019·湖北部分重点中学模拟)某商场对某一商品搞活动,已知该商品每一个的进价为3元,销售价为8元,每天售出的第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如图所示,设x(个)为每天商品的销量,y(元)为该商场每天销售这种商品的利润.从日利润不少于96元的几天里任选2天,则选出的这2天日利润都是97元的概率是( )
A.eq \f(1,9) B.eq \f(1,10) C.eq \f(1,5) D.eq \f(1,8)
解析 由题意知y=eq \b\lc\{(\a\vs4\al\c1(5x,x=18,19,,95+(x-19)(4-3),x=20,21,))
即y=eq \b\lc\{(\a\vs4\al\c1(5x,x=18,19,,76+x,x=20,21.))
当日销量不少于20个时,日利润不少于96元.
当日销量为20个时,日利润为96元.
当日销量为21个时,日利润为97元.
日利润为96元的有3天,记为a,b,c,日利润为97元的有2天,记为A,B,从中任选2天有(a,A),(a,B),(a,b),(a,c),(b,A),(b,B),(b,c),(c,A),(c,B),(A,B)共10种情况,
其中选出的这2天日利润都是97元的有(A,B)1种情况,
故所求概率为eq \f(1,10).
答案 B
11.(2019·北京海淀区模拟)已知样本x1,x2,…,xn的平均数为x;样本y1,y2,…,ym的平均数为y(x≠y),若样本x1,x2,…,xn,y1,y2,…,ym的平均数z=ax+(1-a)y,其中0A.n=m B.n≥m
C.n
解析 由题意得z=eq \f(1,n+m)(nx+my)=eq \f(n,n+m)x+eq \b\lc\(\rc\)(\a\vs4\al\c1(1-\f(n,n+m)))y,∴a=eq \f(n,n+m),
∵0又n,m∈N*,∴2n
12.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为________.
解析 依题意,x1,x2,x3,…,x10的方差s2=64.则数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为eq \r(22×64)=2×8=16.
答案 16
13.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
(1)作出这些数据的频率分布直方图:
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?
解 (1)样本数据的频率分布直方图如图所示:
(2)质量指标值的样本平均数为
eq \(x,\s\up6(-))=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.
质量指标值的样本方差为
s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.
所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.
(3)质量指标值不低于95的产品所占比例的估计值为
0.38+0.22+0.08=0.68.
由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.满意度评分分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
2
8
14
10
6
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
运动员
第1次
第2次
第3次
第4次
第5次
甲
87
91
90
89
93
乙
89
90
91
88
92
甲
乙
丙
丁
平均环数eq \(x,\s\up6(-))
8.3
8.8
8.8
8.7
方差s2
3.5
3.6
2.2
5.4
质量指标值分组
[75,85)
[85,95)
[95,105)
[105,115)
[115,125]
频数
6
26
38
22
8
高考数学第一轮复习第九章 §9.7 双曲线: 这是一份高考数学第一轮复习第九章 §9.7 双曲线,共23页。试卷主要包含了又|PF2|≥c-a=2,等内容,欢迎下载使用。
高考数学大一轮复习第九章 平面解析几何: 这是一份高考数学大一轮复习第九章 平面解析几何,文件包含高考数学第一轮复习解析几何热点问题doc、高考数学第一轮复习第8节微课4探索性及证明问题doc、高考数学第一轮复习第8节微课2定值问题doc、高考数学第一轮复习第8节微课3最值范围问题doc、高考数学第一轮复习第8节微课1定点问题doc、高考数学第一轮复习第5节第1课时椭圆及简单几何性质doc、高考数学第一轮复习第5节第2课时直线与椭圆doc、高考数学第一轮复习第7节抛物线doc、高考数学第一轮复习第6节双曲线doc、高考数学第一轮复习第2节两直线的位置关系doc、高考数学第一轮复习第1节直线的方程doc、高考数学第一轮复习第3节圆的方程doc、高考数学第一轮复习第4节直线与圆圆与圆的位置关系doc等13份试卷配套教学资源,其中试卷共155页, 欢迎下载使用。
高考数学一轮复习 第九章 第3节: 这是一份高考数学一轮复习 第九章 第3节,共22页。试卷主要包含了线性回归方程,回归分析,独立性检验,9% B,5×9=256等内容,欢迎下载使用。