2023高考数学艺体生一轮复习 专题27 统计的应用(解析版)
展开
这是一份2023高考数学艺体生一轮复习 专题27 统计的应用(解析版),共30页。
专题27 统计的应用
【考点预测】
一、抽样方法
三种抽样方式的对比
类型
共同点
各自特点
相互关系
使用范围
简单随机抽样
抽样过程都是不放回抽样,每个个体被抽到的机会均等,总体容量N,样本容量n,每个个体被抽到的概率
从总体中随机逐个抽取
总体容量较小
系统抽样
总体均分几段,每段T个,
第一段取a1,
第二段取a1+T,
第三段取a1+2T,
……
第一段简单随机抽样
总体中的个体个数较多
分层抽样
将总体分成n层,每层按比例抽取
每层按简单随机抽样或系统抽样
总体由差异明显的几部分组成
二、样本分析
(1)样本平均值:。
(2)样本众数:样本数据中出现次数最多的那个数据。
(3)样本中位数:将数据按大小排列,位于最中间的数据或中间两个数据的平均数。
(4)样本方差:。
众数、中位数、平均数都是描述一组数据集中趋势的量,方差是用来描述一组数据波动情况的特征数。
三、频率分布直方图的解读
(1)频率分布直方图的绘制
①由频率分布表求出每组频数ni;
②求出每组频率(n为样本容量);
③列出样本频率分布表;
④画出样本频率分布直方图,直方图横坐标表示各组分组情况,纵坐标为每组频率与组距比值,各小长方形的面积即为各组频率,各小长方形的面积总和为1。
(2)样本估计总体
步骤:总体→抽取样本→频率分布表→频率分布直方图→估计总体频率分布。
样本容量越大,估计越精细,样本容量无限增大,频率分布直方图无限无限趋近概率分布密度曲线。
(3)用样本平均数估计总体平均数,用样本标准差估计总体标准差。
公式:,s2(aX+b)=a2s2(X)。
【典型例题】
例1.(2023春·浙江绍兴·高三统考开学考试)某中学为了解高三男生的体能情况,通过随机抽样,获得了200名男生的100米体能测试成绩(单位:秒),将数据按照分成9组,制成了如图所示的频率分布直方图.
由直方图可估计本校高三男生100米体能测试成绩小于13.5秒的人数为( )
A.47 B.54 C.67 D.94
【答案】D
【解析】由题意,则,解得,
由图,则本校高三男生100米体能测试成绩小于13.5秒的频率为,
估计本校高三男生100米体能测试成绩小于13.5秒的人数为.
故选:D.
例2.(2023·陕西榆林·统考一模)为了解市民的生活幸福指数,某组织随机选取了部分市民参与问卷调查,将他们的生活幸福指数(满分100分)按照分成5组,制成如图所示的频率分布直方图,根据此频率分布直方图,估计市民生活幸福指数的中位数为( )
A.70 B. C. D.60
【答案】C
【解析】由题意可得,解得.
因为成绩在的频率为,
成绩在的频率为,
故市民生活幸福指数的中位数在内.
设市民生活幸福指数的中位数为,则,
解得.
故选:C
例3.(2023·全国·高三专题练习)要考察某公司生产的500克袋装牛奶的质量是否达标,现从500袋牛奶中抽取50袋进行检验,将它们编号为000,001,002,…499,利用随机数表抽取样本,从第8行第5列的数开始,按3位数依次向右读取,到行末后接着从下一行第一个数继续.则第四袋牛奶的标号是( )
(下面摘取了某随机数表的第7行至第9行)
A.358 B.301 C.071 D.206
【答案】C
【解析】由题意可知,读取的第一个数据是583,不符合条件,第二个数据是921,不符合条件,第三个数据是206,符合条件;
即随机选取的第一袋牛奶标号是206;
以下数据依次是766,301,647,859,169,555,671,998,301,其中符合题意的数据只有301,169,301三个数据,但是301属于重复数据,继续往后计数;
下一个数是071,符合条件,即前四袋牛奶的标号依次为206,301,169,071;
所以,第四袋牛奶的标号为071.
故选:C.
例4.(2023秋·四川成都·高三成都七中校考阶段练习)年春节影市火爆依旧,《无名》、《满江红》、《交换人生》票房不断刷新,为了解我校高三名学生的观影情况,随机调查了名在校学生,其中看过《无名》或《满江红》的学生共有位,看过《满江红》的学生共有位,看过《满江红》且看过《无名》的学生共有位,则该校高三年级看过《无名》的学生人数的估计值为( )
A. B. C. D.
【答案】C
【解析】以集合表示调查的名在校学生看过《无名》的学生构成的集合,
集合表示调查的名在校学生看过《满江红》的学生构成的集合,如下图所示:
所以,调查的名在校学生看过《无名》的学生人数为,
所以,该校高三年级看过《无名》的学生人数的估计值为,
故选:C.
例5.(多选题)(2023秋·浙江湖州·高三安吉县高级中学校考期末)为响应自己城市倡导的低碳出行,小李上班可以选择公交车、自行车两种交通工具,他分别记录了100次坐公交车和骑车所用时间(单位:分钟),得到下列两个频率分布直方图:基于以上统计信息,则( )
A.骑车时间的中位数的估计值是22分钟
B.坐公交车时间的40%分位数的估计值是19分钟
C.坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值
D.坐公交车时间的方差的估计值小于骑车时间的方差的估计值
【答案】BC
【解析】对A:设骑车时间的中位数为,则,解得,
故骑车时间的中位数的估计值是分钟,A错误;
对B:设坐公交车时间的40%分位数为,则,解得,
故坐公交车时间的40%分位数的估计值是19分钟,B正确;
对C:坐公交车时间的平均数,
骑车时间的平均数,
∵,故坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值,C正确;
对D:
坐公交车时间的方差
骑车时间的方差,
∵,故坐公交车时间的方差的估计值大于骑车时间的方差的估计值,D错误.
故选:BC.
例6.(多选题)(2023·全国·高三专题练习)下列说法正确的是( )
A.用简单随机抽样的方法从含有50个个体的总体中抽取一个容量为5的样本,则个体m被抽到的概率是
B.已知一组数据1,2,m,6,7的平均数为4,则这组数据的方差是
C.数据13,27,24,12,14,30,15,17,19,23的第70百分位数是23
D.若样本数据的标准差为8,则数据的标准差为32
【答案】AB
【解析】用简单随机抽样的方法从含有50个个体的总体中抽取一个容量为5的样本,则个体m被抽到的概率为,A正确;
已知一组数据1,2,m,6,7的平均数为4,
所以,解得:,
所以,
则这组数据的方差是,B正确;
数据13,27,24,12,14,30,15,17,19,23共10个数,从小到大排列为12,13,14,15,17,19,23,24,27,30,
由于,故选择第7和第8个数的平均数作为第70百分位数,
即,所以第70百分位数是,C错误;
若样本数据的标准差为8,所以的方差为64,
则数据的方差为,
所以数据的标准差为,D错误.
故选:AB
例7.(2023秋·北京·高三校考期末)在测试中,客观题难度的计算公式为,其中为第题的难度,为答对该题的人数,为参加测试的总人数.现对某校高三年级240名学生进行一次测试,共5道客观题.测试前根据对学生的了解,预估了每道题的难度,如下表所示:
题号
1
2
3
4
5
考前预估难度
0.9
0.8
0.7
0.6
0.4
测试后,随机抽取了20名学生的答题数据进行统计,结果如下:
题号
1
2
3
4
5
实测答对人数
16
16
14
14
4
(1)根据题中数据,估计这240名学生中第5题的实测答对人数;
(2)从抽样的20名学生中随机抽取2名学生,记这2名学生中第5题答对的人数为X,求X的分布列和数学期望;
(3)定义统计量,其中为第题的实测难度,为第题的预估难度.规定:若,则称该次测试的难度预估合理,否则为不合理.判断本次测试的难度预估是否合理.
【解析】(1)因为20人中答对第5题的人数为4人,因此第5题的实测难度为,
所以估计240人中有人实测答对第5题.
(2)的可能取值是0,1,2.
;;.
的分布列为:
0
1
2
.
(3)第1题的实测难度为,同理可得:第2题的实测难度为,
第3题的实测难度为,第4题的实测难度为,第5题的实测难度为0.2,
故.
因为 ,
所以,该次测试的难度预估是合理的.
例8.(2023秋·河南三门峡·高三统考期末)某果园新采摘了一批苹果,从中随机抽取50个作为样本,称出它们的重量(单位:克),将重量按照进行分组,得到频率分布直方图如图所示(同一组中的数据以该组区间的中点值为代表).
(1)估计这批苹果的重量的平均数;
(2)该果园准备把这批苹果销售给一家超市,据市场行情,有两种销售方案;
方案一:所有苹果混在一起,价格为2.5元/千克;
方案二:将不同重量的苹果分开,重量不小于160克的苹果的价格为3元/千克,重量小于160克的苹果的价格为2元/千克,但果园需支付每1000个苹果5元的分拣费.
分别估计并比较两种方案下果园销售10000个苹果的收入.
【解析】(1)由题意,得,解得,
50个苹果重量的平均数为,
故估计这批苹果的重量的平均数约为159.6克;
(2)若采用方案一,估计销售收入约为(元)
若采用方案二,重量小于160克的苹果的总重量约为
(千克),
重量不小于160克的苹果的总重量约为
(千克),
估计销售收入约为(元),
因为,因此,方案二的销售收入更高.
例9.(2023·高三课时练习)为倡导节能减排,某市计划制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,并绘制成如图所示的频率分布直方图.
(1)求直方图中的a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)估计居民月均用水量的中位数.
【解析】(1)由频率分布直方图可知,月用水量在[0,0.5)的频率为0.08×0.5=0.04.
同理,在[0.5,1),(1.5,2],[2,2.5),[3,3.5),[3.5,4),[4,4.5)的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.
由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.
(2)由(1)知,100位居民月均水量不低于3吨的频率为0.06+0.04+0.02=0.12.
由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.
(3)设中位数为x吨.
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,
而前4组的频率之和为0.04+0.08+0.15+0.21=0.48
相关试卷
这是一份备战2024高考数学艺体生一轮复习40天突破90分讲义专题27 统计的应用(原卷版+解析版),共47页。
这是一份备战2024高考数学艺体生一轮复习40天突破90分讲义word版专题27 统计的应用(解析版),共30页。
这是一份备战2024高考数学艺体生一轮复习40天突破90分讲义word版专题27 统计的应用(原卷版),共18页。