![2020数学(文)二轮教师用书:第2部分专题3第2讲 统计与统计案例第1页](http://m.enxinlong.com/img-preview/3/3/5712887/0/0.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![2020数学(文)二轮教师用书:第2部分专题3第2讲 统计与统计案例第2页](http://m.enxinlong.com/img-preview/3/3/5712887/0/1.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![2020数学(文)二轮教师用书:第2部分专题3第2讲 统计与统计案例第3页](http://m.enxinlong.com/img-preview/3/3/5712887/0/2.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
所属成套资源:2020数学(文)二轮专题精品教案
2020数学(文)二轮教师用书:第2部分专题3第2讲 统计与统计案例
展开
第2讲 统计与统计案例
[做小题——激活思维]s
1.采用系统抽样的方法从800人中抽取40人参加某种测试,为此将800人随机编号为1,2,…,800,分组后在第一组采用简单随机抽样的方法抽到的号码为18,在抽到的40人中,编号落入区间[1,200]的人做试卷A,编号落入区间[201,560]的人做试卷B,其余的人做试卷C,则做试卷C的人数为( )
A.10 B.12 C.18 D.28
[答案] B
2.某校有高级教师26人,中级教师104人,其他教师若干人,现按分层抽样的方法从该校的所有教师中抽取56人进行某项调查,已知从其他教师中共抽取了16人,则该校共有教师人数为 ( )
A.81 B.152 C.182 D.202
[答案] C
3.为了参加端午节龙舟赛,某龙舟队进行了6次测试,测得最大速度(单位:m/s)的茎叶图如图所示,则6次测试的最大速度的平均数为________m/s,方差为________.
[答案] 33
4.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据,第i次试验零件个数xi(单位:个)与加工零件所花费时间yi(单位:小时)的数据资料,算得xi=80,yi=20,xiyi=184,x=720,那么加工零件所花费时间y对零件个数x的线性回归方程为________.
=0.3x-0.4 [由题意知
n=10,=xi==8,=yi==2,
又x-n =720-10×82=80,
xiyi-n =184-10×8×2=24,
由此得==0.3,=- =2-0.3×8=-0.4,
故所求回归方程为=0.3x-0.4.]
5.在西非“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:
感染
未感染
总计
服用
10
40
50
未服用
20
30
50
总计
30
70
100
附表:
P(K2≥k0)
0.10
0.05
0.025
k0
2.706
3.841
5.024
参照附表,在犯错误的概率不超过________的前提下,认为“小动物是否被感染与服用疫苗有关”.
0.05 [由题意算得,
K2=≈4.762>3.841,
参照附表,可得:
在犯错误的概率不超过0.05的前提下,认为“小动物是否被感染与服用疫苗有关”.]
[扣要点——查缺补漏]
1.随机抽样
简单随机抽样的特点是逐个抽取,适用于总体个数较少的情况;系统抽样也称等距抽样,适用总体个数较多的情况,如T1;分层抽样一定要注意按比例抽取,总体由差异明显的几部分组成,如T2.
2.统计图表和样本数字特征
(1)由频率分布直方图进行相关计算时,需掌握关系式:=频率,此关系式的变形为=样本容量,样本容量×频率=频数.
(2)总体估计的方法:用样本的数字特征估计总体的数字特征.
(3)图表判断法:若根据统计图表比较样本数据的大小,可根据数据的分布情况直观分析,大致判断平均数的范围,并利用数据的波动性大小比较方差(标准差)的大小.如T3.
3.统计案例
(1)线性回归方程问题的两个要点:样本点的中心在回归直线上;由线性回归方程求出的数值是估计值.如T4.
(2)独立性检验的关键在于准确求出K2值,然后对比临界值表中的数据,最后下结论.如T5.
抽样方法(5年2考)
1.(2018·全国卷Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.
切入点:不同年龄段客户对其服务的评价有较大差异.
关键点:正确掌握三种抽样方法的特点及适用条件.
分层抽样 [因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样,才能了解到不同年龄段的客户对公司服务的客观评价.]
2.(2019·全国卷Ⅰ)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是( )
A.8号学生 B.200号学生
C.616号学生 D.815号学生
切入点:①系统抽样;②46号学生被抽到.
关键点:正确掌握系统抽样的概念.
C [根据题意,系统抽样是等距抽样,
所以抽样间隔为=10.
因为46除以10余6,所以抽到的号码都是除以10余6的数,结合选项知应为616.
故选C.]
系统抽样和分层抽样中的计算
(1)系统抽样
①总体容量为N,样本容量为n,则要将总体均分成n组,每组个(有零头时要先去掉).
②若第一组抽到编号为k的个体,则以后各组中抽取的个体编号依次为.
(2)分层抽样
按比例抽样,计算的主要依据是:各层抽取的数量之比=总体中各层的数量之比.
1.(系统抽样)某班共有52人,现根据学生的学号,用系统抽样的方法抽取一个容量为4的样本,已知3号、29号、42号学生在样本中,那么样本中还有一名学生的学号是( )
A.10 B.11 C.12 D.16
D [从被抽中的3名学生的学号可以看出学号间距为13,所以样本中还有一名学生的学号是16,故选D.]
2.(分层抽样)某商场有四类食品,食品类别和种数见下表:
类别
粮食类
植物油类
动物性食品类
果蔬类
种数
40
10
30
20
现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样方法抽取样本,则抽取的植物油类与果蔬类食品种数之和为________.
6 [因为粮食类种数∶植物油类种数∶动物性食品类种数∶果蔬类种数=40∶10∶30∶20=4∶1∶3∶2,所以根据分层抽样的定义可知,抽取的植物油类食品种数为×20=2,抽取的果蔬类食品种数为×20=4,所以抽取的植物油类与果蔬类食品种数之和为2+4=6.]
3.(简单随机抽样)“双色球”彩票中红色球的号码由编号为01,02,…,33的33个个体组成,一位彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第6个红色球的编号为________.
49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
02 [从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出的6个红色球的编号依次为21,32,09,16,17,02,故选出的第6个红色球的编号为02.]
4.(分层抽样与统计图表的综合)某企业三月中旬生产A、B、C三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:
产品类别
A
B
C
产品数量(件)
1 300
样本容量(件)
130
由于不小心,表格中A、C产品的有关数据已被损坏,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是________.
800 [设样本的总容量为x,则×1 300=130,∴x=300.∴A产品和C产品在样本中共有300-130=170(件),设C产品的样本容量为y,则y+y+10=170,∴y=80,∴C产品的数量为×80=800.]
用样本估计总体(5年10考)
[高考解读] 高考对该部分内容的考查常涉及频率分布表、茎叶图、频率分布直方图等,是高考的重点和热点.涉及的样本数字特征主要有平均数、众数、中位数和方差,难度不大,多为基础题.
1.(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
切入点:①建设前经济收入构成比例;
②建设后经济收入构成比例.
关键点:从图表中正确提取有用信息.
A [设新农村建设前经济收入的总量为x,则新农村建设后经济收入的总量为2x.
建设前种植收入为0.6x,建设后种植收入为0.74x,故A不正确;
建设前其他收入为0.04x,建设后其他收入为0.1x,故B正确;
建设前养殖收入为0.3x,建设后养殖收入为0.6x,故C正确;
建设后养殖收入与第三产业收入的总和占建设后经济收入总量的58%,故D正确.]
2.(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.
根据该折线图,下列结论错误的是( )
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
切入点:2014年1月至2016年12月期间月接待游客量的数据.
关键点:从折线图中准确提取信息.
A [对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;
对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;
对于选项C,D,由图可知显然正确.
故选A.]
3.(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y的分组
[-0.20,0)
[0,0.20)
[0.20,0.40)
[0.40,0.60)
[0.60,0.80)
企业数
2
24
53
14
7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:≈8.602.
切入点:频数分布表.
关键点:正确应用平均数与标准差的计算方法.
[解] (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.
产值负增长的企业频率为=0.02.
用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2)=×(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,
s2=ni(yi-)2
=×[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]
=0.029 6,
s==0.02×≈0.17.
所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.
1.方差的计算与含义
(1)计算:计算方差首先要计算平均数,然后再按照方差的计算公式进行计算.
(2)含义:方差是描述一个样本和总体的波动大小的特征数,方差大说明波动大.
2.从频率分布直方图中得出有关数据的方法
频率
频率分布直方图中横轴表示组数,纵轴表示,频率=组距×
频率比
频率分布直方图中各小长方形的面积之和为1,各小长方形高的比也就是频率比
众数
最高小长方形底边中点的横坐标
中位数
平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标
平均数
频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和
1.(频率分布折线图、众数)某同学将全班某次数学考试成绩整理成频率分布直方图后,并将每个小矩形上方线段的中点连接起来得到频率分布折线图(如图所示).据此估计此次考试成绩的众数是( )
A.100 B.110 C.115 D.120
C [众数是一组数据出现次数最多的数,结合题中频率分布折线图可以看出,数据“115”对应的纵坐标最大,所以相应的频率最大,频数最大,据此估计此次考试成绩的众数是115.]
2.(频率分布直方图)某校为了解学生平均每周的上网时间(单位;h),从高一年级1 000名学生中随机抽取100名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1∶3∶5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为( )
A.200 B.240 C.400 D.480
C [设频率分布直方图中从左到右前3个小矩形的面积分别为P,3P,5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)×2=0.1.因为频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即P=0.1.所以平均每周上网时间少于4 h的学生所占比例为P+3P=0.4,人数为0.4×1 000=400.]
3.(茎叶图、平均数、方差)甲、乙两名学生在5次数学考试中的成绩统计如图所示,若甲,乙分别表示甲、乙两人的平均成绩,则下列结论正确的是( )
A.甲>乙,乙比甲稳定
B.甲>乙,甲比乙稳定
C.甲<乙,乙比甲稳定
D.甲<乙,甲比乙稳定
A [因为甲=×(74+82+88+91+95)=86,
乙=×(77+77+78+86+92)=82,所以甲>乙.
因为s=×[(-12)2+(-4)2+22+52+92]=54,
s=×[(-5)2+(-5)2+(-4)2+42+102]=36.4,所以s>s,故乙比甲稳定.故选A.]
4.(频率分布直方图、均值的应用)为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单位:小时)如下:
248 256 232 243 188 268 278 266 289 312
274 296 288 302 295 228 287 217 329 283
(1)完成下面的频率分布表,并作出频率分布直方图;
(2)估计8万台电风扇中有多少台无故障连续使用时限不低于280小时;
(3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.
分组
频数
频率
频率/组距
[180,200)
[200,220)
[220,240)
[240,260)
[260,280)
[280,300)
[300,320)
[320,340]
合计
0.05
[解] (1)频率分布表及频率分布直方图如下所示:
分组
频数
频率
频率/组距
[180,200)
1
0.05
0.002 5
[200,220)
1
0.05
0.002 5
[220,240)
2
0.10
0.005 0
[240,260)
3
0.15
0.007 5
[260,280)
4
0.20
0.010 0
[280,300)
6
0.30
0.015 0
[300,320)
2
0.10
0.005 0
[320,340)
1
0.05
0.002 5
合计
20
1.00
0.05
(2)由题意可得8×(0.30+0.10+0.05)=3.6,所以估计8万台电风扇中有3.6万台无故障持续使用时限不低于280小时.
(3)由频率分布直方图可知
=190×0.05+210×0.05+230×0.10+250×0.15+270×0.20+290×0.30+310×0.10+330×0.05=269(小时),所以样本的平均无故障连续使用时限为269小时.
统计案例(5年6考)
[高考解读] 应用回归分析与独立性检验思想方法解决简单实际问题的能力是高考考查的重点,试题强调应用性,以实际问题为背景,构建数学模型,突出考查考生的数据处理能力和应用意识.
角度一:回归分析的应用
1.(2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序
1
2
3
4
5
6
7
8
零件尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次序
9
10
11
12
13
14
15
16
零件尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得=xi=9.97,s==≈0.212,≈18.439, (xi-)(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|
![文档详情页底部广告位](http://m.enxinlong.com/img/images/257d7bc79dd514896def3dc0b2e3f598.jpg)