2021届二轮复习 能力升级练十二统计与统计案例理 作业(全国通用)
展开能力升级练(十二) 统计与统计案例
一、选择题
1.某班对八校联考成绩进行分析,利用随机数法抽取样本时,先将60个同学按01,02,03,…,60进行编号,然后从随机数表第9行第5列的数开始向右读,则选出的第6个个体的编号是( )
(注:下表为随机数表的第8行和第9行)
6301 6378 5916 9555 6719 9810 5071 7512 8673 5807 4439 5238 79
3321 1234 2978 6456 0782 5242 0744 3815 5100 1342 9966 0279 54
A.07 B.25 C.42 D.52
解析依题意得,依次选出的个体分别是12,34,29,56,07,52,因此选出的第6个个体的编号是52.
答案D
2.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 ( )
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
解析刻画评估这种农作物亩产量稳定程度的指标是这组数据的标准差.
答案B
3.
(2020云南昆明模拟)AQI(空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,从一级优(0~50);二级良(51~100);三级轻度污染(101~150);四级中度污染(151~200);直至五级重度污染(201~300);六级严重污染(大于300).如图是昆明市2017年4月份随机抽取10天的AQI茎叶图,利用该样本估计昆明市2020年4月份空气质量优的天数为( )
A.3 B.4 C.12 D.21
解析从茎叶图知10天中有4天空气质量为优,所以空气质量为优的频率为,所以估计昆明市2020年4月份空气质量为优的天数为30×=12,故选C.
答案C
4.对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( )
A.5 B.7 C.10 D.50
解析根据题中的频率分布直方图可知,三等品的频率为1-(0.0500+0.0625+0.0375)×5=0.25,因此该样本中三等品的件数为200×0.25=50.
答案D
5.(2020广西桂林、百色、梧州、崇左、北海五市联考)如图是2017年第一季度A,B,C,D,E五省GDP情况图,则下列陈述正确的是( )
①2017年第一季度GDP总量和增速均居同一位的省只有1个;②与去年同期相比,2017年第一季度五个省的GDP总量均实现了增长;③去年同期的GDP总量前三位是D省、B省、A省;④2016年同期A省的GDP总量也是第三位.
A.①② B.②③④
C.②④ D.①③④
解析①2017年第一季度GDP总量和增速均居同一位的省有2个,B省和C省的GDP总量和增速分别居第一位和第四位,故①错误;由图知②正确;由图计算2016年同期五省的GDP总量,可知前三位为D省、B省、A省,故③正确;由③知2016年同期A省的GDP总量是第三位,故④正确.故选B.
答案B
6.某企业开展职工技能比赛,并从参赛职工中选1人参加该行业东营模拟技能大赛.经过6轮选拔,甲、乙两人成绩突出,得分情况如茎叶图所示.
若甲、乙两人的平均成绩分别是,则下列说法正确的是( )
A.,乙比甲成绩稳定,应该选乙参加比赛
B.,甲比乙成绩稳定,应该选甲参加比赛
C.,甲比乙成绩稳定,应该选甲参加比赛
D.,乙比甲成绩稳定,应该选乙参加比赛
解析=82,≈87,所以(100+16+9+9+16+100)≈41.67,(81+1+1+1+16+36)≈22.67,因为,所以乙成绩比甲成绩稳定,应该选乙参加比赛.
答案D
7.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为( )
A.7 B.9 C.10 D.15
解析抽取号码的间隔为=30,从而区间[451,750]包含的段数为=10,则编号落入区间[451,750]的人数为10人,即做问卷B的人数为10.
答案C
8.(2020北京燕博园质检)某超市从2020年甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,并按(0,10],(10,20],(20,30],(30,40],(40,50]分组,得到频率分布直方图如下:
记甲种酸奶与乙种酸奶的日销售量(单位:箱)的方差分别为,则频率分布直方图中的a的值及的大小关系分别是( )
A.a=0.015, B.a=0.15,
C.a=0.015, D.a=0.15,
解析由(0.020+0.010+0.030+a+0.025)×10=1,得a=0.015.根据频率分布直方图,图2中的数据较稳定,则.
答案C
9.某省二线城市地铁正式开工建设,地铁时代的到来能否缓解该市的交通拥堵状况呢?某社团进行社会调查,得到的数据如下表:
| 男性市民 | 女性市民 | 总计 |
认为能缓解交通拥堵 | 48 | 30 | 78 |
认为不能缓解交通拥堵 | 12 | 20 | 32 |
总计 | 60 | 50 | 110 |
则下列结论正确的是( )
附:K2=
P(K2≥k0) | 0.05 | 0.010 | 0.005 | 0.001 |
k0 | 3.841 | 6.635 | 7.879 | 10.828 |
A.在犯错误的概率不超过0.05的前提下认为“对能否缓解交通拥堵的认识与性别有关”
B.在犯错误的概率不超过0.05的前提下认为“对能否缓解交通拥堵的认识与性别无关”
C.在犯错误的概率不超过0.01的前提下认为“对能否缓解交通拥堵的认识与性别有关”
D.在犯错误的概率不超过0.01的前提下认为“对能否缓解交通拥堵的认识与性别无关”
解析由2×2列联表,可求K2的观测值
k=≈5.288>3.841.
由统计表P(K2≥3.841)=0.05,
∴在犯错误的概率不超过0.05的前提下认为“对能否缓解交通拥堵的认识与性别有关”.
答案A
二、填空题
10.(2020福建泉州模拟)某厂在生产甲产品的过程中,产量x(吨)与生产能耗y(吨)的对应数据如表:
x | 30 | 40 | 50 | 60 |
y | 25 | 35 | 40 | 45 |
根据最小二乘法求得回归方程为=0.65x+,当产量为80吨时,预计需要生产能耗为 吨.
解析由题意,=45,=36.25,代入=0.65x+,可得=7,∴当产量为80吨时,预计需要生产能耗为0.65×80+7=59(吨).
答案59
11.某同学在高三学年的五次阶段性考试中,数学成绩依次为110,114,121,119,126,则这组数据的方差是 .
解析因为对一组数据同时加上或减去同一个常数,方差不变,所以本题中可先对这5个数据同时减去110,得到新的数据分别为0,4,11,9,16,其平均数为8,根据方差公式可得s2=[(0-8)2+(4-8)2+(11-8)2+(9-8)2+(16-8)2]=30.8.
答案30.8
12.从编号为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量是5的样本,若编号为28的产品在样本中,则该样本中产品的最大编号为 .
解析根据系统抽样的特点,共有80个产品,抽取5个样品,则可得组距为=16,又其中有1个为28,则与之相邻的为12和44,故所取5个依次为12,28,44,60,76,即最大的为76.
答案76
13.给出下列四个命题:
①某班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中另一位同学的编号为23;
②一组数据1,2,3,3,4,5的平均数、众数、中位数都相同;
③若一组数据a,0,1,2,3的平均数为1,则其标准差为2;
④根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为x,其中=2,=1,=3,则=1.
其中真命题有 (填序号).
解析在①中,由系统抽样知抽样的分段间隔为52÷4=13,故抽取的样本的编号分别为7号、20号、33号、46号,故①是假命题;在②中,数据1,2,3,3,4,5的平均数为(1+2+3+3+4+5)=3,中位数为3,众数为3,都相同,故②是真命题;在③中,因为样本的平均数为1,所以a+0+1+2+3=5,解得a=-1,故样本的方差为[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,标准差为,故③是假命题;在④中,回归直线方程为x+2,又回归直线过点(),把(1,3)代入回归直线方程+2,得=1,故④是真命题.
答案②④
三、解答题
14.某校为了解高三学生周末的“阅读时间”,从高三年级中随机抽取了100名学生进行调查,获得了每人的周末“阅读时间”(单位:小时),按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成样本的频率分布直方图如图所示:
(1)求图中a的值;
(2)估计该校高三学生周末“阅读时间”的中位数;
(3)用样本频率代替概率.现从全校高三年级随机抽取20名学生,其中有k名学生“阅读时间”在[1,2.5)内的概率为P(X=k),其中k=0,1,2,…,20.当P(X=k)最大时,求k的值.
解(1)由频率分布直方图可知,周末“阅读时间”在[0,0.5)内的频率为0.08×0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]内的频率分别为0.08,0.20,0.25,0.07,0.04,0.02,所以1-(0.04+0.08+0.20+0.25+0.07+0.04+0.02)=0.5a+0.5a,解得a=0.30.
(2)设该校高三学生周末“阅读时间”的中位数为m小时.因为前5组的频率之和为0.04+0.08+0.15+0.20+0.25=0.72>0.5,
而前4组的频率之和为0.04+0.08+0.15+0.20=0.47<0.5,所以2≤m<2.5.
由0.5×(m-2)=0.5-0.47,解得m=2.06.
故可估计该校高三学生周末“阅读时间”的中位数为2.06小时.
(3)设在取出的20名学生中,周末“阅读时间”在[1,2.5)内的有X人,则X服从二项分布,即X~B(20,0.6),所以恰好有k名学生周末“阅读时间”在[1,2.5)内的概率为P(X=k)=(0.6)k(0.4)20-k,
其中k=0,1,2,…,20.
设t=,k=1,2,…,20.
若t>1,则k<12.6,P(X=k-1)<P(X=k);若t<1,则k>12.6,P(X=k-1)>P(X=k).
又<1,
所以当k=12时,P(X=k)最大.所以k的值为12.
15.(2020沈阳质检西安八校联考)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产件数是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100],分别加以统计,得到如图所示的频率分布直方图.
25周岁以上(含25周岁)组
25周岁以下组
(1)根据“25周岁以上(含25周岁)组”的频率分布直方图,求25岁以上(含25周岁)组工人日平均生产件数的中位数的估计值(四舍五入保留整数);
(2)规定日平均生产件数不少于80的工人为生产能手,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”.
| 生产能手 | 非生产能手 | 合计 |
25周岁以上(含25周岁)组 |
|
|
|
25周岁以下组 |
|
|
|
合计 |
|
|
|
附:K2=.
P(K2≥k0) | 0.100 | 0.050 | 0.010 | 0.001 |
k0 | 2.706 | 3.841 | 6.635 | 10.828 |
解采用分层抽样,“25周岁以上(含25周岁)组”应抽取工人100×=60(名),“25周岁以下组”应抽取工人100×=40(名).
(1)由“25周岁以上(含25周岁)组”的频率分布直方图可知,其中位数为70+10×=70+≈73(件).
综上,25周岁以上(含25周岁)组工人日平均生产件数的中位数的估计值为73件.
(2)由频率分布直方图可知,25周岁以上(含25周岁)的生产能手共有60×[(0.0200+0.0050)×10]=15(名),25周岁以下的生产能手共有40×[(0.0325+0.0050)×10]=15(名),则2×2列联表如下:
| 生产能手 | 非生产能手 | 合计 |
25周岁以上(含25周岁)组 | 15 | 45 | 60 |
25周岁以下组 | 15 | 25 | 40 |
合计 | 30 | 70 | 100 |
K2的观测值k=≈1.786<2.706,所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.