2019届二轮复习小题专练 统计与统计案例作业(全国通用)
展开小题专练·作业(十) 统计与统计案例
1.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9。抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C。则抽到的人中,做问卷B的人数为( )
A.7 B.9
C.10 D.15
解析 抽取号码的间隔为=30,从而区间[451,750]包含的段数为-=10,则编号落入区间[451,750]的人数为10人,即做问卷B的人数为10。故选C。
答案 C
2.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30]。根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
A.56 B.60
C.120 D.140
解析 设所求的人数为n,由频率分布直方图可知,自习时间不少于22.5小时的频率为(0.04+0.08+0.16)×2.5=0.7,所以n=0.7×200=140。故选D。
答案 D
3.(2018·承德模拟)某城市收集并整理了该市2017年1月份至10月份各月最低气温与最高气温(单位:℃)的数据,绘制了下面的折线图。已知该城市各月的最低气温与最高气温具有较好的线性关系,则根据折线图,下列结论错误的是( )
A.最低气温与最高气温为正相关
B.10月的最高气温不低于5月的最高气温
C.月温差(最高气温减最低气温)的最大值出现在1月
D.最低气温低于0 ℃的月份有4个
解析 在A中,最低气温与最高气温为正相关,故A正确;在B中,10月的最高气温不低于5月的最高气温,故B正确;在C中,月温差(最高气温减最低气温)的最大值出现在1月,故C正确;在D中,最低气温低于0 ℃的月份有3个,故D错误。故选D。
答案 D
4.(2018·济南一模)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为s2,则( )
A.=4,s2<2 B.=4,s2>2
C.>4,s2<2 D.>4,s2>2
解析 因为某7个数的平均数为4,所以这7个数的和为4×7=28,因为加入一个新数据4,所以==4,又因为这7个数的方差为2,且加入一个新数据4,所以这8个数的方差s2==<2。故选A。
答案 A
5.已知两个随机变量x,y之间的相关关系如表所示:
x | -4 | -2 | 1 | 2 | 4 |
y | -5 | -3 | -1 | -0.5 | 1 |
根据上述数据得到的回归方程为=x+,则大致可以判断( )
A.>0,>0 B.>0,<0
C.<0,>0 D.<0,<0
解析 作出散点图,画出回归直线直观判定>0,<0。故选C。
答案 C
6.某市地铁正式开工建设,地铁时代的到来能否缓解该市的交通拥堵状况呢?某社团进行社会调查,得到的数据如下表:
| 男性市民 | 女性市民 |
认为能缓解交通拥堵 | 48 | 30 |
认为不能缓解交通拥堵 | 12 | 20 |
则下列结论正确的是( )
附:K2=
P(K2≥k) | 0.05 | 0.010 | 0.005 | 0.001 |
k | 3.841 | 6.635 | 7.879 | 10.828 |
A.有95%的把握认为“对能否缓解交通拥堵的认识与性别有关”
B.有95%的把握认为“对能否缓解交通拥堵的认识与性别无关”
C.有99%的把握认为“对能否缓解交通拥堵的认识与性别有关”
D.有99%的把握认为“对能否缓解交通拥堵的认识与性别无关”
解析 由2×2列联表,可求K2的观测值,k=≈5.288>3.841。由统计表P(K2≥3.841)=0.05,所以有95%的把握认为“能否缓解交通拥堵的认识与性别有关”。故选A。
答案 A
7.(2018·湖南张家界三模)已知变量x,y之间的线性回归方程为=-0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法错误的是( )
x | 6 | 8 | 10 | 12 |
y | 6 | m | 3 | 2 |
A.变量x,y之间呈负相关关系
B.可以预测,当x=20时,=-3.7
C.m=4
D.该回归直线必过点(9,4)
解析 由-0.7<0,得变量x,y之间呈负相关关系,故A正确;当x=20时,=-0.7×20+10.3=-3.7,故B正确;由表格数据可知=×(6+8+10+12)=9,=(6+m+3+2)=,则=-0.7×9+10.3,解得m=5,故C错;由m=5,得==4,所以该回归直线必过点(9,4),故D正确。故选C。
答案 C
8.(2018·全国卷Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异。为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________。
解析 由题意,不同年龄段客户对其服务的评价有较大差异,故采取分层抽样法。
答案 分层抽样
9.(2018·马鞍山质检)已知样本容量为200,在样本的频率分布直方图中,共有n个小矩形,若中间一个小矩形的面积等于其余(n-1)个小矩形面积和的,则该组的频数为________。
解析 设除中间一个小矩形外的(n-1)个小矩形面积的和为P,则中间一个小矩形面积为P,P+P=1,P=,则中间一个小矩形的面积等于P=,200×=50,即该组的频数为50。
答案 50
10.空气质量指数(Air Quality Index,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染。从某地一环保人士某年的AQI记录数据中,随机抽取10个,用茎叶图记录如图所示。根据该统计数据,估计此地该年AQI大于100的天数约为________。(该年为365天)
解析 该样本中AQI大于100的频数是4,频率为,由此估计该地全年AQI大于100的频率为,估计此地该年AQI大于100的天数约为365×=146。
答案 146
11.某厂在生产甲产品的过程中,产量x(吨)与生产能耗y(吨)的对应数据如表:
x | 30 | 40 | 50 | 60 |
y | 25 | 35 | 40 | 45 |
根据最小二乘法求得回归方程为=0.65x+,当产量为80吨时,预计需要生产能耗为________吨。
解析 由题意得,=45,=36.25,代入=0.65x+,可得=7,所以当产量为80吨时,预计需要生产能耗为0.65×80+7=59(吨)。
答案 59
12.甲、乙两名同学6次考试的成绩统计如图,甲、乙两组数据的平均数分别为甲,乙,标准差分别为σ甲,σ乙,则( )
A.甲<乙,σ甲<σ乙 B.甲<乙,σ甲>σ乙
C.甲>乙,σ甲<σ乙 D.甲>乙,σ甲>σ乙
解析 由图可知,甲同学除第二次考试成绩略低于乙同学,其他次考试都远高于乙同学,可知甲>乙,图中数据显示甲同学的成绩比乙同学稳定,故σ甲<σ乙。故选C。
答案 C
13.(2018·南昌一模)已知具有线性相关的五个样本点A1(0,0),A2(2,2),A3(3,2),A4(4,2),A5(6,4),用最小二乘法得到回归直线方程l1:=x+,过点A1,A2的直线方程l2:y=mx+n,那么下列四个命题中,
①m>,>n;②直线l1过点A3;③(yi-xi-)2≥(yi-mxi-n)2;④yi-xi-|≥yi-mxi-n|。
A.1个 B.2个
C.3个 D.4个
解析 由所给的数据计算可得=3,=2,回归方程为=0.6x+0.2,过点A1,A2的直线方程为y=x。所以①m>,>n,正确;②直线l1过点A3,正确;③(yi-xi-)2=0.8,(yi-mxi-n)2=9,错误;④yi-xi-|=1.6,yi-mxi-n|=5,错误。综上可得,正确的命题有2个。故选B。
答案 B
14.为了研究雾霾天气的治理情况,某课题组对部分城市进行空气质量调查,按地域特点把这些城市分成甲、乙、丙三组,已知三组城市的个数分别为4,y,z,依次构成等差数列,且4,y,z+4成等比数列,若用分层抽样抽取6个城市,则乙组中应抽取的城市个数为________。
解析 由题意可得即解得z=12或z=-4(舍去),故y=8。所以甲、乙、丙三组城市的个数分别为4,8,12。因为一共要抽取6个城市,所以抽样比为=。故乙组城市应抽取的个数为8×=2。
答案 2
15.某新闻媒体为了了解观众对央视《开门大吉》节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:
| 女 | 男 | 总计 |
喜爱 | 40 | 20 | 60 |
不喜爱 | 20 | 30 | 50 |
总计 | 60 | 50 | 110 |
试根据样本估计总体的思想,估计在犯错误的概率不超过________的前提下(约有________的把握)认为“喜爱该节目与否和性别有关”。
参考附表:
P(K2≥k0) | 0.050 | 0.010 | 0.001 |
k0 | 3.841 | 6.635 | 10.828 |
(参考公式:K2=,其中n=a+b+c+d)
解析 假设喜爱该节目和性别无关,分析列联表中数据,可得K2的观测值k=≈7.822>6.635,所以在犯错误的概率不超过0.01的前提下(约有99%的把握)认为“喜爱该节目与否和性别有关”。
答案 0.01 99%