高中数学人教B版 (2019)必修 第二册5.1.2 数据的数字特征第2课时导学案
展开导语
平均数、中位数和众数为我们提供了一组数据的集中趋势的信息,这是概括一组数据的特征的有效方法.但仅知道集中趋势的信息,很多时候还不能使我们做出有效决策.
这节课我们共同来研究总体离散趋势的有关知识.
一、极值、方差与标准差的计算
有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6 7 7
如果你是教练,你应当如何对这次射击作出评价?
问题1 甲、乙两人本次射击的平均成绩分别为多少环?
提示 经计算得:eq \x\t(x)甲=eq \f(1,10)×(7+8+7+9+5+4+9+10+7+4)=7,同理可得eq \x\t(x)乙=7.
问题2 观察下图中两人成绩的频率分布条形图,你能说明其水平差异在哪里吗?
提示 直观上看,还是有差异的.如:甲成绩比较分散,乙成绩相对集中.
问题3 对于甲、乙两人的射击成绩除了画出频率分布条形图比较外,还有没有其他方法来说明两组数据的分散程度?
提示 还经常用甲、乙命中环数的极差与平均数一起比较说明数据的分散程度.甲的环数极差=10-4=6,乙的环数极差=9-5=4.它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.
知识梳理
1.极差
一组数的极差指的是这组数的最大值减去最小值所得的差.
2.方差
如果x1,x2,…,xn的平均数为eq \x\t(x),则方差可用求和符号表示为s2=eq \f(1,n)eq \i\su(i=1,n, )(xi-eq \x\t(x))2.
3.标准差
方差的算术平方根称为标准差.标准差描述了数据相对于平均数的离散程度,一般用s表示.
s=eq \r(\f(1,n)[x1-\x\t(x)2+x2-\x\t(x)2+…+xn-\x\t(x)2]).
注意点:
(1)数据的离散程度可以通过极差、方差或标准差来描述,极差反映了一组数据变化的最大幅度,它对一组数据中的极端值极为敏感,一般情况下,极差大,则数据波动性大;极差小,则数据波动性小.极差只需考虑两个极端值,便于计算,但没有考虑中间的数据,可靠性较差.
(2)标准差和方差则反映了一组数据围绕平均数波动的大小,方差、标准差的运算量较大.因为方差与原始数据单位不同,且平方后可能夸大了偏差程度,所以虽然标准差与方差在体现数据离散程度上是一样的,但解决问题时一般用标准差.
例1 甲、乙两机床同时加工直径为100 mm的零件,为检验质量,各从中抽取6件测量,数据为
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
(1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
解 (1)eq \x\t(x)甲=eq \f(1,6)×(99+100+98+100+100+103)=100,
eq \x\t(x)乙=eq \f(1,6)×(99+100+102+99+100+100)=100.
seq \\al(2,甲)=eq \f(1,6)×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=eq \f(7,3),
seq \\al(2,乙)=eq \f(1,6)×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
(2)两台机床所加工零件的直径的平均值相同,
又seq \\al(2,甲)>seq \\al(2,乙),
所以乙机床加工零件的质量更稳定.
延伸探究
在本例中,若甲机床加工的6个零件的数据全都加10,那么所得新数据的平均数及方差分别是多少?
解 新数据为99+10,100+10,98+10,100+10,100+10,103+10,平均数为100+10=110,
方差为eq \f(1,6)×[(109-110)2+(110-110)2+(108-110)2+(110-110)2+(110-110)2+(113-110)2]=eq \f(7,3).
反思感悟 在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度.在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中,稳定性越好.
跟踪训练1 某班20位女同学平均分为甲、乙两组,她们的劳动技术课考试成绩如下(单位:分):
甲组:60,90,85,75,65,70,80,90,95,80;
乙组:85,95,75,70,85,80,85,65,90,85.
(1)试分别计算两组数据的极差、方差和标准差;
(2)哪一组的成绩较稳定?
解 (1)甲组:最高分为95分,最低分为60分,极差为95-60=35(分),
平均分为eq \x\t(x)甲=eq \f(1,10)×(60+90+85+75+65+70+80+90+95+80)=79(分),
方差为seq \\al(2,甲)=eq \f(1,10)×[(60-79)2+(90-79)2+(85-79)2+(75-79)2+(65-79)2+(70-79)2+(80-79)2+(90-79)2+(95-79)2+(80-79)2]=119,
标准差为s甲=eq \r(s\\al(2,甲))=eq \r(119)≈10.91(分).
乙组:最高分为95分,最低分为65分,极差为95-65=30(分),
平均分为eq \x\t(x)乙=eq \f(1,10)×(85+95+75+70+85+80+85+65+90+85)=81.5(分),
方差为seq \\al(2,乙)=eq \f(1,10)×[(85-81.5)2+(95-81.5)2+(75-81.5)2+(70-81.5)2+(85-81.5)2+(80-81.5)2+(85-81.5)2+(65-81.5)2+(90-81.5)2+(85-81.5)2]=75.25,
标准差为s乙=eq \r(s\\al(2,乙))=eq \r(75.25)≈8.67(分).
(2)由于乙组的方差(标准差)小于甲组的方差(标准差),因此乙组的成绩较稳定.
从(1)中得到的极差也可得到乙组的成绩比较稳定.
二、方差的性质
知识梳理
方差的性质:如果a,b为常数,则ax1+b,ax2+b,…,axn+b的方差为a2s2.
例2 设样本数据x1,x2,…,x10的平均数和方差分别为1和4,若yi=xi+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的平均数和方差分别为( )
A.1+a,4 B.1+a,4+a
C.1,4 D.1,4+a
答案 A
解析 ∵x1,x2,…,x10的平均数eq \x\t(x)=1,方差seq \\al(2,1)=4,
且yi=xi+a(i=1,2,…,10),
∴y1,y2,…,y10的平均数eq \x\t(y)=eq \f(1,10)×(y1+y2+…+y10)=eq \f(1,10)×(x1+x2+…+x10+10a)=eq \f(1,10)×(x1+x2+…+x10)+a=eq \x\t(x)+a=1+a,
其方差seq \\al(2,2)=eq \f(1,10)×[(y1-eq \x\t(y))2+(y2-eq \x\t(y))2+…+(y10-eq \x\t(y))2]=eq \f(1,10)[(x1-1)2+(x2-1)2+…+(x10-1)2]=seq \\al(2,1)=4.
反思感悟 若样本数据x1,x2,…,xn的平均数为eq \x\t(x),方差为s2,则yi=axi+b,i=1,2,…,n的平均数为aeq \x\t(x)+b,方差为a2s2,标准差为|a|s.
跟踪训练2 若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( )
A.8 B.15 C.16 D.32
答案 C
解析 样本数据x1,x2,…,x10的标准差s=8,则样本数据2x1-1,2x2-1,…,2x10-1的标准差s′=2×8=16.
三、数字特征的应用
例3 在一次科技知识竞赛中,两组学生的成绩如下表:
已经计算得到两个组成绩的平均数都是80.请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.
解 (1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组的成绩好一些.
(2)seq \\al(2,甲)=eq \f(1,2+5+10+13+14+6)×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172,
seq \\al(2,乙)=eq \f(1,4+4+16+2+12+12)×[4×(50-80)2+4×(60-80)2+16×(70-80)2+2×(80-80)2+12×(90-80)2+12×(100-80)2]=256.
因为seq \\al(2,甲)
(3)甲、乙两组成绩的中位数、平均数都是80分.其中,甲组成绩在80分以上(包括80分)的有33人,乙组成绩在80分以上(包括80分)的有26人,从这一角度来看,甲组的成绩总体较好.
(4)从成绩统计表来看,甲组的成绩大于等于90分的有20人,乙组的成绩大于等于90分的有24人,所以乙组成绩集中在高分段的人数比甲组多.同时乙组得满分的比甲组得满分的多6人.从这一角度来看,乙组的成绩较好.
反思感悟 用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似值,实际应用中,需先分析平均水平,再计算标准差(方差)分析稳定情况.
跟踪训练3 为了考察甲、乙两种小麦的长势,分别从甲、乙两种麦苗中各抽10株,测得它们的株高分别为(单位:cm):
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
(1)哪种小麦的苗长得高?
(2)哪种小麦的苗长得齐?
解 (1)eq \x\t(x)甲=eq \f(1,10)×(25+41+40+37+22+14+19+39+21+42)=eq \f(1,10)×300=30(cm).
eq \x\t(x)乙=eq \f(1,10)×(27+16+44+27+44+16+40+40+16+40)=eq \f(1,10)×310=31(cm).
显然eq \x\t(x)甲
seq \\al(2,乙)=eq \f(1,10)×[(27-31)2+(16-31)2+(44-31)2+(27-31)2+(44-31)2+(16-31)2+(40-31)2+(40-31)2+(16-31)2+(40-31)2]=eq \f(1,10)×(16+225+169+16+169+225+81+81+225+81)=eq \f(1,10)×1 288=128.8.
显然seq \\al(2,甲)
(1)极差、标准差、方差的计算方法.
(2)方差的性质.
(3)数据的数字特征的应用.
2.方法归纳:数据分析.
3.常见误区:
(1)数据同时增加或减少相同的数,平均数变化,方差不变.
(2)方差、标准差的计算.
(3)在计算方差或标准差时,当数据的重复数据较多时,要先把数据整理为频数表再用公式或性质计算.
1.下列说法中正确的是( )
A.在两组数据中,平均数较大的一组方差较大
B.平均数反映数据的集中趋势,方差则反映数据离平均数的波动大小
C.求出各个数据与平均数的差的平方后再相加,所得的和就是方差
D.众数能反映一组数据的离散程度
答案 B
解析 由平均数、众数、方差的定义及意义可知选B.
2.设甲、乙两名射击运动员,在一次连续10次的射击中,他们所射中环数的平均数一样,但方差不同,正确评价他们的水平是( )
A.因为他们所射中环数的平均数一样,所以他们水平相同
B.虽然射中环数的平均数一样,但方差较大的,潜力较大,更有发展前途
C.虽然射中环数的平均数一样,但方差较小的,发挥较稳定,更有发展前途
D.虽然射中环数的平均数一样,但方差较小的,发挥较不稳定,忽高忽低
答案 C
解析 主要考查了方差的实际意义.
3. 为庆祝中国共产党成立100周年,A,B,C,D四个兴趣小组举行党史知识竞赛,每个小组各派10名同学参赛,记录每名同学失分(均为整数)情况,若该组每名同学失分都不超过7分,则该组为“优秀小组”,已知A,B,C,D四个小组成员失分数据信息如下,则一定为“优秀小组”的是( )
A.A组中位数为2,极差为8
B.B组平均数为2,众数为2
C.C组平均数为1,方差大于0
D.D组平均数为2,方差为3
答案 D
解析 对于A,因为中位数为2,极差为8,故最大值大于7,故A错误;
对于B,如失分数据分别为0,0,0,2,2,2,2,2,2,8,则满足平均数为2,众数为2,但不满足每名同学失分都不超过7分,故B错误;
对于C,如失分数据分别为0,0,0,0,0,0,0,0,1,9,则满足平均数为1,方差大于0,但不满足每名同学失分都不超过7分,故C错误;
对于D,利用反证法,假设有一同学失分超过7分,则方差大于eq \f(1,10)×(8-2)2=3.6>3,与题设矛盾,故每名同学失分都不超过7分.故D正确.
4.国家射击队要从甲、乙、丙、丁四名队员中选出一名选手去参加射击比赛,四人的平均成绩和方差如下表:
则应派________参赛最为合适.
答案 丙
解析 由表可知,丙的平均成绩较高,且发挥比较稳定,应派丙去参赛最合适.
5.样本中共有5个个体,其值分别为a,0,1,2,3,若该样本的平均数为1,则样本方差为________.
答案 2
解析 由题意知eq \f(1,5)(a+0+1+2+3)=1,解得a=-1.
所以样本方差为s2=eq \f(1,5)[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.
1.(多选)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,可能发生变化的数字特征是( )
A.中位数 B.平均数
C.方差 D.极差
答案 BCD
解析 由于去掉一个最高分与最低分后,评委所评的9个分数从小到大排序后,中间一个数字不会改变,故中位数不变.由于最高分和最低分是极端分数,因此会影响平均数、方差和极差.
2.下列命题中是真命题的是( )
A.A,B,C三种个体按3∶1∶2的比例分层抽样调查,如果抽取的A个体数为9,则样本容量为30
B.一组数据1,3,3,4,5的平均数、众数、中位数相同
C.若甲组数据的方差为5,乙组数据为5,6,9,10,5,则这两组数据中较稳定的是甲
D.一组数6,5,4,3,3,3,2,2,2,1的85%分位数为5
答案 D
解析 对于A项,B,C抽取的个体数分别为3,6,则样本容量为3+6+9=18,故A错误;
对于B项,平均数为eq \f(1+3+3+4+5,5)=3.2,中位数为3,众数为3,故B错误;
对于C项,乙的平均数为eq \f(5+6+9+10+5,5)=7,方差为s2=eq \f(1,5)(22+12+22+32+22)=eq \f(22,5)<5,则这两组数据中较稳定的是乙,故C错误;
对于D项,将该组数据从小到大排列后为1,2,2,2,3,3,3,4,5,6,由10×85%=8.5,则该组数据的85%分位数为5,故D正确.
3.某创业公司共有36名职工,为了了解该公司职工的年龄构成情况,随机采访了9位代表,得到的数据分别为36,36,37,37,40,43,43,44,44,若用样本估计总体,年龄在(eq \x\t(x)-s,eq \x\t(x)+s)内的人数占公司人数的百分比是(其中eq \x\t(x)是平均数,s为标准差,结果精确到1%)( )
A.14% B.25% C.56% D.67%
答案 C
解析 因为eq \x\t(x)=eq \f(36+36+37+37+40+43+43+44+44,9)
=40,s2=eq \f(1,9)×(16+16+9+9+0+9+9+16+16)=eq \f(100,9),即s=eq \f(10,3).年龄在(eq \x\t(x)-s,eq \x\t(x)+s)内,即eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(110,3),\f(130,3)))内的人数有5人,所以百分比为eq \f(5,9)≈56%.
4.若一组数据a,3,5,7的平均数是b,且a,b是方程x2-5x+4=0的两根,则这组数据的方差是( )
A.3 B.4 C.5 D.6
答案 C
解析 x2-5x+4=0的两根是1,4.当a=1时,a,3,5,7的平均数是4;当a=4时,a,3,5,7的平均数不是1.所以a=1,b=4,则方差为s2=eq \f(1,4)×[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5.
5.有两位射击运动员在一次射击测试中各射靶7次,每次命中的环数如下:
甲:7 8 10 9 8 8 6
乙:9 10 7 8 7 7 8
则下列判断正确的是( )
A.甲射击的平均成绩比乙好
B.甲射击的成绩的众数小于乙射击的成绩的众数
C.乙射击的平均成绩比甲好
D.甲射击的成绩的极差大于乙射击的成绩的极差
答案 D
解析 甲命中的环数的平均数为
eq \x\t(x)甲=eq \f(1,7)×(7+8+10+9+8+8+6)=8,
乙命中的环数的平均数为
eq \x\t(x)乙=eq \f(1,7)×(9+10+7+8+7+7+8)=8,
所以甲、乙射击的平均成绩相等,故A,C均错误;甲射击的成绩的众数是8,乙射击的成绩的众数是7,所以甲射击的成绩的众数大于乙射击的成绩的众数,故B错误;甲射击的成绩的极差为10-6=4,乙射击的成绩的极差为10-7=3,所以甲射击的成绩的极差大于乙射击的成绩的极差,故D正确.
6.若五个数1,2,3,4,a的平均数是3,则a=________,这五个数的标准差是________.
答案 5 eq \r(2)
解析 由eq \f(1+2+3+4+a,5)=3,得a=5,
由s2=eq \f(1,5)×[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2,得标准差s=eq \r(2).
7.某班有48名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名同学的成绩有误,甲实得80分却记为50分,乙实得70分却记为100分,则更正后平均分和方差分别是________,________.
答案 70 50
解析 甲少记30分,乙多记30分,则总分不变,由此平均分不发生变化;原方差s2=eq \f(1,48)(xeq \\al(2,1)+xeq \\al(2,2)+…+xeq \\al(2,46)+502+1002-48×702)=75,更正后方差s′2=eq \f(1,48)(xeq \\al(2,1)+xeq \\al(2,2)+…+xeq \\al(2,46)+802+702-48×702)=eq \f(1,48)(xeq \\al(2,1)+xeq \\al(2,2)+…+xeq \\al(2,46)+502+1002-48×702-1 200)=s2-eq \f(1,48)×1 200=50.
8.某校高一年级开设了丰富多彩的校本课程,现从甲、乙两个班随机抽取了5名学生校本课程的学分,统计如下表:
用seq \\al(2,1),seq \\al(2,2)分别表示甲、乙两班抽取的5名学生学分的方差,则seq \\al(2,1)=__________,seq \\al(2,2)=________,并由此可判断成绩更稳定的班级是________班.
答案 22 62 甲
解析 根据表中数据,计算甲班的平均数为
eq \x\t(x)1=eq \f(1,5)×(8+11+14+15+22)=14,
乙班的平均数为eq \x\t(x)2=eq \f(1,5)×(6+7+10+23+24)=14,
甲班的方差为seq \\al(2,1)=eq \f(1,5)×[(8-14)2+(11-14)2+(14-14)2+(15-14)2+(22-14)2]=22,
乙班的方差为seq \\al(2,2)=eq \f(1,5)×[(6-14)2+(7-14)2+(10-14)2+(23-14)2+(24-14)2]=62,
所以seq \\al(2,1)
甲:68,69,71,72,74,78,83,85;
乙:65,70,70,73,75,80,82,85.
(1)求甲、乙两人成绩的平均数和中位数;
(2)现要从甲、乙两人中选派一人参加比赛,从统计学的角度你认为派哪位学生参加比较合适?
解 (1)甲的平均数为eq \x\t(x)= (68+69+71+72+74+78+83+85)÷8=75,中位数为(72+74)÷2=73,
乙的平均数为eq \x\t(y)=(65+70+70+73+75+80+82+85)÷8=75,中位数为(73+75)÷2=74.
(2)甲的方差为seq \\al(2,1)=[(68-75)2+(69-75)2+(71-75)2+ (72-75)2+(74-75)2+(78-75)2+(83-75)2+(85-75)2]÷8=35.5,
乙的方差为seq \\al(2,2)=[(65-75)2+(70-75)2+(70-75)2+(73-75)2+(75-75)2+(80-75)2+(82-75)2+(85-75)2] ÷8=41,
∵seq \\al(2,1)
10.有两位射击运动员在一次射击测试中各射靶7次,每次命中的环数如下:
甲 6 9 7 8 8 5 6
乙 a 3 9 8 9 6 4
经计算可得甲、乙两名射击运动员的平均成绩是一样的.
(1)求实数a的值;
(2)请通过计算,判断甲、乙两名射击运动员哪一位的成绩更稳定?
解 (1)由题意知,甲的平均成绩为eq \x\t(x)1=eq \f(1,7)×(6+9+7+8+8+5+6)=7,
乙的平均成绩为eq \x\t(x)2=eq \f(1,7)×(a+3+9+8+9+6+4)=eq \f(1,7)(a+39),
又甲、乙两名射击运动员的平均成绩是一样的,所以有eq \f(1,7)(a+39)=7,解得a=10,
故实数a为10.
(2)甲的方差seq \\al(2,1)=eq \f(1,7)×[(6-7)2+(9-7)2+(7-7)2+(8-7)2+(8-7)2+(5-7)2+(6-7)2]=eq \f(12,7),
乙的方差seq \\al(2,2)=eq \f(1,7)×[(10-7)2+(3-7)2+(9-7)2+(8-7)2+(9-7)2+(6-7)2+(4-7)2]=eq \f(44,7),
由seq \\al(2,1)
下列结论中,正确的是( )
A.甲、乙两班学生成绩的平均水平相同
B.乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀)
C.甲班的成绩比乙班的成绩波动大
D.甲班成绩的众数小于乙班成绩的众数
答案 ABC
解析 甲、乙两班成绩的平均数都是135,故两班成绩的平均水平相同,所以A正确;seq \\al(2,甲)=191>110=seq \\al(2,乙),所以甲班成绩不如乙班稳定,即甲班成绩波动较大,所以C正确;甲、乙两班人数相同,但甲班成绩的中位数为149,乙班成绩的中位数为151,从而易知乙班每分钟输入汉字数≥150个的人数要多于甲班,所以B正确;由题表看不出两班学生成绩的众数,D错误.
12.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9,(x,y∈N),已知这组数据的平均数为10,方差为2,则|x-y|的值为( )
A.4 B.3 C.2 D.1
答案 A
解析 由这组数据的平均数为10,方差为2可得x+y=20,(x-10)2+(y-10)2=8,设x=10+t,y=10-t,由(x-10)2+(y-10)2=8得t2=4,所以|x-y|=2|t|=4.
13.一组数据的平均数是4.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( )
A.55.2,3.6 B.55.2,56.4
C.64.8,63.6 D.64.8,3.6
答案 D
解析 设这组数据分别为x1,x2,…,xn,
由其平均数为4.8,方差是3.6,则有
eq \x\t(x)1=eq \f(1,n)(x1+x2+…+xn)=4.8,
方差seq \\al(2,1)=eq \f(1,n)[(x1-eq \x\t(x))2+(x2-eq \x\t(x))2+…+(xn-eq \x\t(x))2]=3.6,
若将这组数据中每一个数据都加上60,则数据为x1+60,x2+60,…,xn+60,
则其平均数为eq \x\t(x)2=eq \f(1,n)[(x1+60)+(x2+60)+…+(xn+60)]=64.8,
方差为seq \\al(2,2)=eq \f(1,n)[(x1+60-64.8)2+(x2+60-64.8)2+…+(xn+60-64.8)2]=3.6.
14.已知某样本的容量为100,平均数为80,方差为95.现发现在收集这些数据时,其中的两个数据记录有误,一个错将90记录为70,另一个错将80记录为100.在对错误的数据进行更正后,重新求得样本的平均数为eq \x\t(x),方差为s2,则( )
A.eq \x\t(x)=80,s2<95 B.eq \x\t(x)=80,s2>95
C.eq \x\t(x)>80,s2<95 D.eq \x\t(x)<80,s2<95
答案 A
解析 由题意,可得
eq \x\t(x)=eq \f(80×100+90-70+80-100,100)=80,
设收集的98个准确数据分别记为x1,x2,…,x98,
则95=eq \f(1,100)[(x1-80)2+(x2-80)2+…+(x98-80)2+(70-80)2+(100-80)2]
=eq \f(1,100)[(x1-80)2+(x2-80)2+…+(x98-80)2+500],
s2=eq \f(1,100)[(x1-80)2+(x2-80)2+…+(x98-80)2+(90-80)2+(80-80)2]
=eq \f(1,100)[(x1-80)2+(x2-80)2+…+(x98-80)2+100]<95,所以s2<95.
15.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:总体平均数为3,中位数为4
B.乙地:总体平均数为1,总体方差大于0
C.丙地:中位数为2,众数为3
D.丁地:总体平均数为2,总体方差为3
答案 D
解析 根据信息可知,连续10天内,每天的新增疑似病例数不能有超过7的数,选项A中,中位数为4,可能存在大于7的数;同理,在选项C中也有可能;选项B中的总体方差大于0,叙述不明确,也有可能存在大于7的数;选项D中,根据方差公式,如果有大于7的数存在,那么方差大于3,故选D.
16.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:
经计算得eq \x\t(x)=eq \f(1,16)eq \i\su(i=1,16,x)i=9.97,s=eq \r(\f(1,16)\i\su(i=1,16, )xi-\x\t(x)2)=eq \r(\f(1,16)\i\su(i=1,16,x)\\al(2,i)-16\x\t(x)2)≈0.212,eq \r(\i\su(i=1,16, )i-8.52)≈18.439,eq \i\su(i=1,16, )(xi-eq \x\t(x))(i-8.5)=-2.78,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
一天内抽检零件中,如果出现了尺寸在(eq \x\t(x)-3s,eq \x\t(x)+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(1)从这一天抽检的结果看,是否需要对当天的生产过程进行检查?
(2)在(eq \x\t(x)-3s,eq \x\t(x)+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的平均数与标准差.(精确到0.01)
附:eq \r(0.008)≈0.09.
解 (1)由于eq \x\t(x)=9.97,s≈0.212,eq \x\t(x)-3s=9.334,eq \x\t(x)+3s=10.606,由样本数据可以看出抽取的第13个零件的尺寸在(eq \x\t(x)-3s,eq \x\t(x)+3s)以外,因此需对当天的生产过程进行检查.
(2)剔除离群值,即第13个数据,剩下数据的平均数为eq \f(1,15)×(16×9.97-9.22)=10.02,
这条生产线当天生产的零件尺寸的平均数为10.02,
因为方差s2=eq \f(1,16)(eq \i\su(i=1,16,x)eq \\al(2,i)-16eq \x\t(x)2),
所以eq \i\su(i=1,16,x)eq \\al(2,i)=16×0.2122+16×9.972≈1 591.134,
剔除第13个数据,剩下数据的样本方差为
eq \f(1,15)×(1 591.134-9.222-15×10.022)≈0.008,
这条生产线当天生产的零件尺寸的标准差的估计值为eq \r(0.008)≈0.09.分数(分)
50
60
70
80
90
100
人数(人)
甲组
2
5
10
13
14
6
乙组
4
4
16
2
12
12
甲
乙
丙
丁
平均成绩eq \x\t(x)
8.5
8.8
8.8
8
方差s2
3.5
3.5
2.1
8.7
甲
8
11
14
15
22
乙
6
7
10
23
24
班级
参加人数
中位数
方差
平均数
甲
55
149
191
135
乙
55
151
110
135
抽取次序
1
2
3
4
5
6
7
8
零件尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次序
9
10
11
12
13
14
15
16
零件尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
新教材人教B版步步高学习笔记【同步学案】模块综合试卷(二): 这是一份新教材人教B版步步高学习笔记【同步学案】模块综合试卷(二)
高中数学人教B版 (2019)必修 第一册2.1.1 等式的性质与方程的解集第2课时学案: 这是一份高中数学人教B版 (2019)必修 第一册2.1.1 等式的性质与方程的解集第2课时学案,共12页。学案主要包含了全集与补集,与补集有关的参数的范围问题等内容,欢迎下载使用。
高中数学人教B版 (2019)必修 第二册第五章 统计与概率5.1 统计5.1.3 数据的直观表示第2课时导学案: 这是一份高中数学人教B版 (2019)必修 第二册第五章 统计与概率5.1 统计5.1.3 数据的直观表示第2课时导学案,共17页。学案主要包含了频率分布直方图的绘制,频率分布直方图的应用等内容,欢迎下载使用。