数学必修 第二册第14章 统计14.4 用样本估计总体学案
展开1.一组数据的极差、样本方差、样本标准差
(1)一组数据的极差
我们把一组数据的最大值与最小值的差称为极差.
(2)样本方差和样本标准差
设一组样本数据x1,x2,…,xn,其平均数为 eq \x\t(x) ,则称s2=为这个样本的方差.其算术平方根s=为样本的标准差,分别简称样本方差、样本标准差.
(3)一个方差的计算公式
一般地,若取值为x1,x2,…,xn的频率分别为p1,p2,…,pn,则其方差为p1(x1― eq \x\t(x) )2+p2(x2- eq \x\t(x) )2+…+pn(xn- eq \x\t(x) )2.
2.分层抽样数据的方差
一般地,如果总体分为k层,第j层抽取的样本为xj1,xj2,…,,第j层的样本量为nj,样本平均数为 eq \x\t(x) j,样本方差为s eq \\al(\s\up1(2),\s\d1(j)) ,j=1,2,…,k.记=n,那么,所有数据的样本方差为==.
1.某校为了丰富校园文化,举行初中生书法大赛,决赛设置了6个获奖名额,共有11名选手进入决赛,选手决赛得分均不相同.若知道某位选手的决赛的得分,要判断他是否获奖,只需知道这11名学生决赛得分的( )
A.中位数 B.平均数
C.众数 D.方差
【解析】选A.由中位数的概念,即最中间一个或两个数据的平均数;可知11人成绩的中位数是第6名的得分.根据题意可得:参赛选手要想知道自己是否能进入前6名,只需要了解自己的得分以及全部得分的中位数,比较即可.
2.在某项体育比赛中,七位裁判为一选手打出的分数如下:90 89 90 95 93 94 93
去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )
A.92,2 B.92,2.8
C.93,2 D.93,2.8
【解析】选B.去掉一个最高分95与一个最低分89后,所得的5个数分别为90,90,93,94,93,
所以 eq \x\t(x) = eq \f(90+90+93+94+93,5) =92,
s2= eq \f(2×(90-92)2+2×(93-92)2+(94-92)2,5) = eq \f(14,5) =2.8.
3.(教材练习改编)已知数据x1,x2,x3,…,xn是上海普通职工n(n≥3,n∈N*)个人的年收入,设这n个数据的中位数为x,平均数为y,方差为z,如果再加上世界首富的年收入xn+1,则这n+1个数据中,下列说法正确的是( )
A.年收入平均数大大增大,中位数一定变大,方差可能不变
B.年收入平均数大大增大,中位数可能不变,方差变大
C.年收入平均数大大增大,中位数可能不变,方差也不变
D.年收入平均数可能不变,中位数可能不变,方差可能不变
【解析】选B.插入大的极端值,平均数增加,中位数可能不变,方差也因为数据更加分散而变大.
4.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为________.
【解析】因为这100人成绩的平均数
eq \x\t(x) = eq \f(20×5+10×4+30×3+30×2+10×1,100) = eq \f(100+40+90+60+10,100) =3,
所以这100人成绩的方差s2= eq \f(1,100) ×[20×22+10×12+30×02+30×12+10×22]= eq \f(160,100) = eq \f(8,5) ,
所以标准差s= eq \f(2\r(10),5) .
答案: eq \f(2\r(10),5)
5.甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
【解析】(1)甲的平均数 eq \x\t(x) 甲= eq \f(1,6) (99+100+98+100+100+103)=100,
乙的平均数 eq \x\t(x) 乙= eq \f(1,6) (99+100+102+99+100+100)=100.
s eq \\al(\s\up1(2),\s\d1(甲)) = eq \f(1,6) [(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]= eq \f(7,3) ,
s eq \\al(\s\up1(2),\s\d1(乙)) = eq \f(1,6) [(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)两台机床所加工零件的直径的平均值相同,
又s eq \\al(\s\up1(2),\s\d1(甲)) >s eq \\al(\s\up1(2),\s\d1(乙)) ,所以乙机床加工零件的质量更稳定.
一、单选题
1.下列说法正确的是( )
A.在两组数据中,平均数较大的一组极差较大
B.平均数反映数据的集中趋势,方差反映数据波动的大小
C.方差的求法是求出各个数据与平均值的差的平方后再求和
D.在记录两个人射击环数的两组数据中,方差大说明射击水平稳定
【解析】选B.平均数表示一组数据的集中趋势,平均数的大小并不能说明该组数据极差的大小,所以A错误;方差公式s2=,所以C错误;方差大说明射击水平不稳定,所以D错误.
2.已知数据x1,x2,…,xn的平均数为 eq \x\t(x) ,方差为s2,则2x1+3,2x2+3,…,2xn+3的平均数和方差分别为( )
A. eq \x\t(x) 和s2 B.2 eq \x\t(x) +3和4s2
C.2 eq \x\t(x) +3和s2 D.2 eq \x\t(x) +3和4s2+12s+9
【解析】选B.因为数据x1,x2,…,xn的平均数为 eq \x\t(x) ,方差为s2,所以2x1+3,2x2+3,…,2xn+3的平均数和方差分别为2 eq \x\t(x) +3和4s2.
3.现有10个数,其平均数为3,且这10个数的平方和是100,那么这组数据的标准差是( )
A.1 B.2 C.3 D.4
【解析】选A.由s2= eq \f(1,n) eq \b\lc\(\rc\)(\a\vs4\al\c1(x eq \\al(\s\up1(2),\s\d1(1)) +x eq \\al(\s\up1(2),\s\d1(2)) +…+x eq \\al(\s\up1(2),\s\d1(n)) )) - eq \x\t(x) 2,得s2= eq \f(1,10) ×100-32=1,即标准差s=1.
4.下列各组数中方差最小的是( )
A.1,2,3,4,5 B.2,2,2,4,5
C.3,3,3,3,3 D.2,3,2,3,2
【解析】选C.对于选项A:平均数为 eq \f(1,5) (1+2+3+4+5)=3,方差为s2= eq \f(1,5) [(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2;对于选项B:平均数为 eq \f(1,5) (2+2+2+4+5)=3,方差为s2= eq \f(1,5) [(2-3)2+(2-3)2+(2-3)2+(4-3)2+(5-3)2]=1.6;
对于选项C:平均数为 eq \f(1,5) (3+3+3+3+3)=3,方差为s2= eq \f(1,5) [(3-3)2+(3-3)2+(3-3)2+(3-3)2+(3-3)2]=0;
对于选项D:平均数为 eq \f(1,5) (2+3+2+3+2)=2.4;
方差为s2= eq \f(1,5) [(2-2.4)2+(3-2.4)2+(2-2.4)2+(3-2.4)2+(2-2.4)2]=0.24.
因为0<0.24<1.6<2,所以选项C中的数据方差最小.
5.甲、乙两名同学6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为 eq \x\t(x) 甲, eq \x\t(x) 乙,标准差分别为s甲,s乙,则( )
A. eq \x\t(x) 甲< eq \x\t(x) 乙,s甲
C. eq \x\t(x) 甲> eq \x\t(x) 乙,s甲
【解析】选C.由题图知,甲同学除第二次考试成绩略低于乙同学外,其他考试成绩都远高于乙同学,可知 eq \x\t(x) 甲> eq \x\t(x) 乙.题图中数据显示甲同学的成绩比乙同学稳定,所以s甲
6.一组数据的平均数是 eq \x\t(x) ,标准差是s,将这组数据中的每个数据都乘以2,所得到的一组新数据的平均值和标准差分别是( )
A. eq \x\t(x) B.2 eq \x\t(x) C.s D.2s
【解析】选BD.设该组数据为x1,x2,…,xn,都乘以2后的新数据为2x1,2x2,…,2xn.
由题意知 eq \x\t(x) = eq \f(x1+x2+…+xn,n) ,则 eq \f(2x1+2x2+…+2xn,n) =2 eq \x\t(x) .
又s= eq \r(\f((x1-\x\t(x))2+(x2-\x\t(x))2+…+(xn-\x\t(x))2,n)) ,
所以 eq \r(\f((2x1-2\x\t(x))2+(2x2-2\x\t(x))2+…+(2xn-2\x\t(x))2,n)) =2s.
7.如图为某市2020年国庆节7天假期的楼房认购量与成交量的折线图,小明同学根据折线图对这7天的认购量(单位:套)与成交量(单位:套)作出如下判断,则判断错误的为( )
A.日成交量的中位数是16
B.日成交量超过日平均成交量的有2天
C.10月7日认购量的增幅大于10月7日成交量的增幅
D.日认购量的方差大于日成交量的方差
【解析】选ABC.7天假期的楼房认购量为:91,100,105,107,112,223,276;
成交量为:8,13,16,26,32,38,166.
对于A,日成交量的中位数是26,故A错误;
对于B,因为日平均成交量为 eq \f(8+13+16+26+32+38+166,7) = eq \f(299,7) ,
日成交量超过日平均成交量的只有10月7日1天,故B错误;
对于C,10月7日认购量的增幅为 eq \f(276-112,112) ≈146%,10月7日成交量的增幅为 eq \f(166-38,38) ≈337%,即10月7日认购量的增幅小于10月7日成交量的增幅,故C错误;
对于D,因为日认购量的数据分布较分散些,方差大些,故D正确.
三、填空题
8.一组数据按从小到大的顺序排列为1,2,2,x,5,10,其中x≠5,已知该组数据的中位数是众数的 eq \f(3,2) 倍,则该组数据的标准差为________.
【解析】由题意,可得该组数据的众数为2,所以 eq \f(2+x,2) = eq \f(3,2) ×2=3,解得x=4,
故该组数据的平均数为 eq \f(1+2+2+4+5+10,6) =4.
所以该组数据的方差为 eq \f(1,6) ×[(1-4)2+(2-4)2+(2-4)2+(4-4)2+(5-4)2+(10-4)2]=9,即标准差为3.
答案:3
9.对一个做直线运动的质点的运动过程观测了8次,得到如表所示的数据.
上述统计数据的平均数是______,方差是______.
【解析】上述统计数据的平均数= eq \f(1,8) ×(40+41+43+43+44+46+47+48)=44,
方差= eq \f(1,8) ×[(40-44)2+(41-44)2+(43-44)2+(43-44)2+(44-44)2+(46-44)2+(47-44)2+(48-44)2]=7.
答案:44 7
四、解答题
10.某学校有高中学生500人,其中男生320人,女生180人.有人为了获得该校全体高中学生的身高信息,采用分层抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的平均数为173.5 cm,方差为17 cm2,女生样本的平均数为163.83 cm,方差为30.03 cm2.
(1)根据以上信息,能够计算出总样本的平均数和方差吗?为什么?
(2)如果已知男、女样本量按比例分配,你能计算出总样本的平均数和方差各为多少吗?
(3)如果已知男、女的样本量都是25,你能计算出总样本的平均数和方差各为多少吗?它们分别作为总体平均数和方差的估计合适吗?为什么?
【解析】(1)不能,因为本题没有给出男、女生的样本量,或者男、女生样本量的比例,故无法计算出总样本的平均数和方差.
(2)总样本的平均数为 eq \f(320,500) ×173.5+ eq \f(180,500) ×163.83≈170.02(cm).
总样本的方差为 eq \f(320,500) ×[17+(173.5-170.02)2]+ eq \f(180,500) ×[30.03+(163.83-170.02)2]≈43.24(cm2).
(3)总样本的平均数为 eq \f(25,50) ×173.5+ eq \f(25,50) ×163.83≈168.67(cm).
总样本的方差为 eq \f(25,50) ×[17+(173.5-168.67)2]+ eq \f(25,50) ×
[30.03+(163.83-168.67)2]≈46.89(cm2).
不能作为总体平均数和方差的估计,因为此分层抽样中,每个个体被抽到的可能性不完全相同,因而样本的代表性差.
11.某校高二年级在一次数学选拔赛中,由于甲、乙两人的竞赛成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:
求两人比赛成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数学竞赛.
【解析】设甲、乙两人成绩的平均数分别为 eq \x\t(x) 甲, eq \x\t(x) 乙,则 eq \x\t(x) 甲=130+ eq \f(1,6) (-3+8+0+7+5+1)=133, eq \x\t(x) 乙=130+ eq \f(1,6) (3-1+8+4-2+6)=133,s eq \\al(\s\up1(2),\s\d1(甲)) = eq \f(1,6) [(-6)2+52+(-3)2+42+22+(-2)2]= eq \f(47,3) ,s eq \\al(\s\up1(2),\s\d1(乙)) = eq \f(1,6) [02+(-4)2+52+12+(-5)2+32]= eq \f(38,3) .因此,甲与乙的平均数相同,由于乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加竞赛比较合适.
一、选择题
1.已知一组数据x1,x2,x3的平均数是5,方差是4,则由2x1+1,2x2+1,2x3+1,11这4个数据组成的新的一组数据的方差是( )
A.16 B.14 C.12 D.8
【解析】选C.由已知得x1+x2+x3=15, eq \b\lc\(\rc\)(\a\vs4\al\c1(x1-5)) 2+ eq \b\lc\(\rc\)(\a\vs4\al\c1(x2-5)) 2+ eq \b\lc\(\rc\)(\a\vs4\al\c1(x3-5)) 2=12,
则新数据的平均数为 eq \f(1,4) (2x1+1+2x2+1+2x3+1+11) eq \f(2(x1+x2+x3)+3+11,4) =11,
所以方差为 eq \f(1,4) [(2x1+1-11)2+(2x2+1-11)2+(2x3+1-11)2+(11-11)2]= eq \f(1,4) [4(x1-5)2+4(x2-5)2+4(x3-5)2]=(x1-5)2+(x2-5)2+(x3-5)2=12.
2.已知样本数据为x1,x2,x3,x4,x5,该样本平均数为5,方差为2,现加入一个数5,得到新样本的平均数为 eq \x\t(x) ,方差为s2,则( )
A. eq \x\t(x) >5,s2>2 B. eq \x\t(x) =5,s2<2
C. eq \x\t(x) <5,s2<2 D. eq \x\t(x) =5,s2>2
【解析】选B.因为x1,x2,x3,x4,x5的平均数为5,方差为2,
则加入5后平均数为: eq \x\t(x) = eq \f(1,6) ×(5×5+5)=5,
方差为:s2= eq \f(1,6) eq \b\lc\[\rc\](\a\vs4\al\c1(5×2+(5-5)2)) = eq \f(5,3) <2.
3.若某同学连续3次考试的名次(3次考试均没有出现并列名次的情况)不超过3,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续3次考试名次的数据,推断一定是尖子生的是( )
A.甲同学:平均数为2,众数为1
B.乙同学:平均数为2,方差小于1
C.丙同学:中位数为2,众数为2
D.丁同学:众数为2,方差大于1
【解析】选B.甲同学:若平均数为2,众数为1,则有一次名次应为4,故排除A;乙同学:平均数为2,设乙同学3次考试的名次分别为x1,x2,x3,则方差s2= eq \f(1,3) [(x1-2)2+(x2-2)2+(x3-2)2]<1,则(x1-2)2+(x2-2)2+(x3-2)2<3,所以x1,x2,x3均不大于3,符合题意;丙同学:中位数为2,众数为2,有可能是2,2,4,不符合题意;丁同学:有可能是2,2,6,不符合题意.
4.(多选)如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为 eq \x\t(x) A和 eq \x\t(x) B,样本标准差分别为sA和sB,则( )
A. eq \x\t(x) A> eq \x\t(x) B B. eq \x\t(x) A< eq \x\t(x) B
C.sA>sB D.sA
eq \x\t(x) B= eq \f(1,6) (15+10+12.5+10+12.5+10)= eq \f(35,3) ≈11.67.
s eq \\al(\s\up1(2),\s\d1(A)) = eq \f(1,6) [(2.5-6.25)2+(10-6.25)2+(5-6.25)2+(7.5-6.25)2+(2.5-6.25)2+(10-6.25)2]≈9.90,
s eq \\al(\s\up1(2),\s\d1(B)) = eq \f(1,6) [(15-11.67)2+(10-11.67)2+(12.5-11.67)2+(10-11.67)2+(12.5-11.67)2+(10-11.67)2]≈3.47.
故 eq \x\t(x) A< eq \x\t(x) B,sA>sB.
二、填空题
5.有一笔统计资料,共有11个数据如下(不完全以大小排列):2,4,4,5,5,6,7,8,9,11,a,已知这组数据的平均数为6,则这组数据的方差为________.
【解析】因为这组数据的平均数为 eq \f(1,11) (2+4+4+5+5+6+7+8+9+11+a)= eq \f(1,11) (61+a)=6,
所以a=5.方差s2= eq \f(42+22+22+12+12+02+12+22+32+52+12,11) =6.
答案:6
6.已知一组数据x1,x2,x3,x4,x5的平均数 eq \x\t(x) =2,方差s2= eq \f(1,3) ,那么另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数为________,方差为________.
【解析】平均数为 eq \x\t(x) ′=3 eq \x\t(x) -2=3×2-2=4,方差为s′2=9s2=9× eq \f(1,3) =3.
答案:4 3
7.已知k1,k2,…,kn的方差为5,则3(k1-4),3(k2-4),…,3(kn-4)的方差为________.
【解析】设k1,k2,…,kn的平均数为 eq \x\t(k) ,则3(k1-4),3(k2-4),…,3(kn-4)的平均数为3( eq \x\t(k) -4),
所以s2===9×=9×5=45.
答案:45
8.某医院急救中心随机抽取20位病人等待急诊的时间记录如表:
用上述分组资料计算出病人平均等待时间的估计值 eq \x\t(x) =________,病人等待时间方差的估计值s2=________.
【解析】 eq \x\t(x) = eq \f(1,20) ×(2.5×4+7.5×8+12.5×5+17.5×2+22.5×1)=9.5(分钟),s2= eq \f(1,20) ×[(2.5-9.5)2×4+(7.5-9.5)2×8+(12.5-9.5)2×5+(17.5-9.5)2×2+(22.5-9.5)2×1]=28.5(分钟2).
答案:9.5分钟 28.5分钟2
三、解答题
9.某班40人随机分成两组,第1组15人,第2组25人,两组学生一次数学考试的成绩(单位:分)情况如表:
求全班学生这次数学考试的平均成绩和方差.
【解析】由题意,知第1组这次数学考试的平均分 eq \x\t(x) 1=84(分),方差s eq \\al(\s\up1(2),\s\d1(1)) =62=36(分2),
第2组这次数学考试的平均分 eq \x\t(x) 2=80(分),方差s eq \\al(\s\up1(2),\s\d1(2)) =42=16(分2),
故全班学生这次数学考试的平均成绩 eq \x\t(x) = eq \f(15,40) ×84+ eq \f(25,40) ×80=81.5(分),
方差s2= eq \f(15,40) ×[36+(84-81.5)2]+ eq \f(25,40) ×[16+(80-81.5)2]=27.25(分2).
10.甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:
(1)填写下表:
(2)请从四个不同的角度对这次测试进行分析:
①结合平均数和方差分析偏离程度;
②结合平均数和中位数分析谁的成绩好些;
③结合平均数和命中9环以上的次数分析谁的成绩好些;
④从折线图上两人射击命中环数及走势分析谁更有潜力.
【解析】(1)乙的打靶环数依次为2,4,6,8,7,7,8,9,9,10,所以 eq \x\t(x) 乙= eq \f(1,10) ×(2+4+6+8+7+7+8+9+9+10)=7;乙的打靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数为 eq \f(7+8,2) =7.5;甲的打靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7. 于是填充后的表格如表所示:
(2)①甲、乙的平均数相同,均为7,但s eq \\al(\s\up1(2),\s\d1(甲)) <s eq \\al(\s\up1(2),\s\d1(乙)) ,说明甲偏离平均数的程度小,而乙偏离平均数的程度大.
②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙的打靶成绩比甲好.
③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的打靶成绩比甲好.
④从题干折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.
11.为选派一名学生参加全市实践活动技能竞赛,A,B两位同学在学校的学习基地现场进行加工直径为20 mm的零件测试,他俩各加工的10个零件直径的相关数据如图所示(单位:mm):
A,B两位同学各加工的10个零件直径的平均数与方差如表:
根据测试得到的有关数据,试解答下列问题:
(1)计算s eq \\al(\s\up1(2),\s\d1(B)) ,结合平均数与方差,说明谁的成绩好些;
(2)结合图中折线走势情况,你认为派谁去参赛较合适?请说明你的理由.
【解析】(1)s eq \\al(\s\up1(2),\s\d1(B)) = eq \f(1,10) ×[5×(20-20)2+3×(19.9-20)2+(20.1-20)2+(20.2-20)2]=0.008,
所以s eq \\al(\s\up1(2),\s\d1(A)) >s eq \\al(\s\up1(2),\s\d1(B)) ,所以在平均数相同的情况下,B的波动较小,所以B的成绩好些.
(2)从题干图中折线趋势可知:
尽管A的成绩前面起伏大,但后来逐渐稳定,误差小,预测A的潜力大,所以派A去参赛较合适.分数
5
4
3
2
1
人数
20
10
30
30
10
观测序号i
1
2
3
4
5
6
7
8
观测数据ai
40
41
43
43
44
46
47
48
甲
127
138
130
137
135
131
乙
133
129
138
134
128
136
等待时间/分钟
[0,5)
[5,10)
[10,15)
[15,20)
[20,25]
频数
4
8
5
2
1
组别
平均分
标准差
第1组
84
6
第2组
80
4
平均数
方差
中位数
命中9环及以上
甲
7
1.2
1
乙
5.4
3
平均数
方差
中位数
命中9环及以上
甲
7
1.2
7
1
乙
7
5.4
7.5
3
平均数
方差
A
20
0.016
B
20
s eq \\al(\s\up1(2),\s\d1(B))
高中数学湘教版(2019)必修 第一册6.4 用样本估计总体导学案: 这是一份高中数学湘教版(2019)必修 第一册6.4 用样本估计总体导学案,共11页。
高中数学苏教版 (2019)必修 第二册14.4 用样本估计总体导学案: 这是一份高中数学苏教版 (2019)必修 第二册14.4 用样本估计总体导学案,共8页。
高中数学人教A版 (2019)必修 第二册第九章 统计9.2 用样本估计总体导学案及答案: 这是一份高中数学人教A版 (2019)必修 第二册第九章 统计9.2 用样本估计总体导学案及答案,共6页。