2021学年2.4正态分布教案

展开

这是一份2021学年2.4正态分布教案，共33页。

第七章假设检验：二项分布与正态分布

有了概率和概率分布的知识，接下来我们要逐步掌握统计检验的一般步骤。既然按照数学规则得到的概率都不能用经验方法准确求得，于是，理论概率和经验得到的频率之间肯定存在某种差别，这就引出了实践检验理论的问题。随机变量的取值状态不同，其概率分布的形式也就不同。本章我们不仅要引出二项分布和正态分布这两个著名的概率分布，并且要将它们与抽样调查联系起来，以领会统计检验，并逐步拓宽其应用面。

第一节二项分布

[来源:www.shulihua.net]
二项分布是从著名的贝努里试验中推导而来。所谓贝努里试验，是指只有两种可能结果的随机试验。在实际问题中，有许多随机现象只包含两个结果，如男与女，是与非，生与死，同意与不同意，赞成与反对等等。通常，我们把其中比较关注那个结果称为“成功”，另一个结果则称为“失败”。每当情况如同贝努里试验，是在相同的条件下重复n次，考虑的是“成功”的概率，且各次试验相互独立，就可利用与二项分布有关的统计检验。虽然许多分布较之二项分布更实用，但二项分布简单明了，况且其他概率分布的使用和计算逻辑与之相同。所以要理解统计检验以及它所涉及的许多新概念，人们几乎都乐意从二项分布的讨论入手。
1.二项分布的数学形式
我们仍从掷硬币的试验人手。假定二
项试验由重复抛掷n次硬币组成，已知硬币面朝上(成功)的概率是p，面朝下(失败)的概率是q (显然有 q＝1―p)。这样，对试验结果而言，成功的次数（即硬币面朝上的次数）X是一个离散型随机变量，它的可能取值是0，1，2，3，…，n。而对X的一个具体取值x而言，根据乘法规则，我们立刻可以就试验结果计算出一种特定排列(先x次面朝上，而后n―x次面朝下)实现的概率，即
ppp…pqqq…q＝pxqn-x (7．1)
由于正确解决概率问题，光考虑乘法规则是不够的，还要考虑加法规则，于是我们根据 (6．27)式，又可以得到就x次成功和（n―x）次失败这个宏观结果而言所包含的所有排列的方式数，用符号表示
＝ (7．２)
这样，我们就得到了二项试验中随机变量X的概率分布，即
P(X=x)＝pxqn-x (7．3)
譬如，二项试验是将一枚硬币重复做8次抛掷，假设这枚硬币是无偏的，即p＝q＝0．5，那么根据(7．3)式，恰好得到5次面朝上的概率是
P(5)＝p5q8-5＝＝0．219
同理，我们也可以求出这个二项试验中硬币刚好为0，1，2，…，8次面朝上的各种宏观结果的概率，全部写出来就是表7．1。注意：当x为0时，0！＝1。此外＝，掌握这种对称性，将有助于简化运算。表7．1
硬币面朝上数x[来源:www.shulihua.net]
概率P(X=x)
0
1
2
3
4
5
6
7
8
1/256= ．004
8/256=．031
28/256=．109
56/256=．219
70/256=．274
56/256=．219
28/256=．109
8/256=．031
1/256=．004
合计
1．000

表7．1清楚地显示，做8次抛掷一枚硬币的重复试验，我们将得到9个可能结果中的一个。与经验认识不同的是，通过运用概率论，实现的每个可能结果都与一定的概率相联系。据此，我们可以对各种结果实现的可能性作出估计。其中，试验结果为4次成功(即4次面朝上)的可能性最大，而试验结果为全部面朝上(即8次面朝上)或全部面朝下(即0次面朝上)的可能性最小，每做256次同样的重复试验才可望看到一次。
在这个简单例子中，每回试验硬币仅被重复抛掷了8次，也仅能有为数不多的可想象到的结果。当然，还可以设想做硬币重复抛掷更多次的试验．比如硬币被重复抛掷100次，那么可能实现的结果就会有101种。同样运用概率论的知识，我们可以把这些可能结果编组，并把概率和整个一组结果相联系。每当我们把概率与重复试验的每一种可能结果或几组结果联系起来时，就会得到如表7．1所示的概率分布，我们称之为二项分布。
2．二项分布的讨论
(1) 二项分布为离散型随机变量的分布。每当试验做的是在相同的条件下n次重复的贝努里试验时，
随机变量X共有n+1个取值。二项分布可以用分布律(表7．2)和折线图(图7．1)来表示。

表7．2
X
0 1 2 … n
合计
P
p0qn p1qn-1 p2qn-2 … pnq0
＝1

(2)二项分布的图形当p＝0．5时是对称的，当p≠ 0．5时是非对称的，而当n愈大时非对称性愈不明显(参见图7．1)。
(3)二项分布的数学期望E(X)＝μ＝np，变异数D(X)＝σ2＝npq。
(4)二项分布受成功事件概率p和试验次数n两个参数变化的影响，只要确定了p和n，成功次数x的概率分布也随之确定。因而，二项分布还可简写作B(x；n，p)。
(5)二项分布的概率值除了根据公式直接进行计算外，还可查表求得。二项分布表的编制方法有两种：一种依据概率分布律P(x)编制(见附表2)；另一种依据分布函数F(x)编制(见附表3)。
F(x)＝P(X≥x)＝ (7．4)
[例7．1．1] 某特定社区人口的10％是少数民族，现随机抽取6人，问其中恰好2人是少数民族的概率是多少？
[解] 解法一：根据(7．3)式直接计算
P(X=2)＝p2q4＝＝0．0984＝9．84％
解法二：根据附表2中纵列n＝6和横行p＝0．1所对应x值，可直接查得B(x；6，0．1)的概率值
B (2；6，0．1)＝0．0984

解法三：根据附表3求得
B (2；6，0．1)＝F(2)- F(3 )＝0．1143―0．0159＝0．0984
[例7．1．2]求B (x；8，0．7)的中位数。
[解] 根据附表3中纵列n＝8和横行p＝0．7所对应的x值，可查出大于等于x的概率值。由于附表列示的是二项分布的累计概率，因此求中位数很方便。
Md＝5.5 +＝5．6747

第二节统计检验的基本步骤

二项分布是用数学或演绎推理的方法求得的一种理论分布。认识到概率分布是先验的理论分布这一点很重要，因为我们不禁要问，既然试验或抽样调查的结果仅与随机变量可能取值中的一个相联系，那么实际试验或样本调查对结果的概率分布及前提假设有没有一个检验的问题？具体来讲，对于一枚硬币被重复抛掷8次的二项试验，经验告诉我们，一共有9种可能的结果，而且实现这些结果的机会是大不相同的。研究者实际上从来不用经验的方法求得概率分布，因为通常我们只对一项试验进行一次或几次，抽取样本也是一个或至多不过几个。既然二项分布是按照数学规则得到的，那么对这9种结果的可能性我们应该作出何种评价呢?如果实际抽样得到的结果偏巧就是先验概率预示的最不可能出现的结果，那么我们是认定纯属巧合，还是开始对用数学或演绎推理方法求得的概率以及理想试验的种种前提假设产生怀疑?更准确地说，在一枚硬币被重复抛掷8次的这个二项试验中，究竟出现什么结果时，我们应该对二项分布及其前提假设产生怀疑呢?是不是只要不是得到4次成功4次失败这个最大可能性结果就开始怀疑，还是仅当出现8次成功或一次也不成功这两个极端情况时才产生怀疑呢?这就是统计检验的核心问题。
概率分布不是一种研究者从资料中看到的分布，我们讨论它，不是出于对数学的爱好，而是因为统计推论的有关工作需要它。现在，我们要进入系统讨论统计假设检验的实际步骤的阶段。所有的统计检验都包含某些特定的步骤，这里先列示如下：
(1)建立假设；
(2)求抽样分布；
(3)选择显著性水平和否定域
(4)计算检验统计量；
(5)判定。
应当注意，在统计检验中，概率分布都是与样本的可能结果相联系的，所以已超越了纯数学范畴。本书至此，开始将概率分布化为抽样分布来具体讨论。所谓抽样分布，就是把具体概率数值赋予样本每个或每组结果的概率分布。
1．建立假设
统计检验是将抽样结果和抽样分布相对照而作出判断的工作。取得抽样结果，依据描述性统计的方法就足够了。抽样分布则不然，它无法从资料中得到，非利用概率论不可。而不对待概括的总体和使用的抽样程序做某种必要的假设，这项工作将无法进行。比如通过掷硬币的实验得到二项分布，必须假设：①样本是随机的，各次抛掷相互独立；②硬币是无偏的(或称是诚实的)，即p＝q＝0．5。概括地说，必须首先就研究总体和抽样方案都做出假设，再加上概率论，我们就可以对各种可能结果做具体的概率陈述了。
2．求抽样分布
在做了必要的假设之后，我们就能用数学推理过程来求抽样分布了。比如在这一章开头，在硬币抛掷n次的理想实验中，我们计算了成功次数为x的宏观结果所具有的概率，得到二项分布。如果前提假设变动了，还可以求出其他形式的概率分布，如正态分布、泊松分布、卡方分布等等，它们都有特定的方程式。由于数学上已经取得的成果，实际上统计工作者要做的这项工作往往并不是真的去求抽样分布的数学形式，而是根据具体需要，确定特定问题的统计检验应该采用哪种分布的数学用表。
3．选择显著性水平和否定域
有了与问题相关的抽样分布，我们便可以把所有可能的结果分成两类：一类是不大可能的结果，比如硬币被抛掷8次，结果8次都面朝上。另一类则相反，我们预料这些结果很可能发生。既然如此，如果我们在一次实际抽样中得到的结果恰好属于第一类，我们就有理由对概率分布的前提假设产生怀疑。在统计检验中，这些不大可能的结果称为否定域。如果这类结果真的发生了，我们将否定假设；反之就不否定假设。
概率分布的具体形式是由假设决定的，假设肯定不止一个。从统计检验的角度来看，所有假设在逻辑推理中都有相同的地位。如果作为检验用的样本结果真的落在否定域内，那么可以讲，至少假设中的一个(也可能是全部)是错的。就像在掷硬币的试验中，如果实际结果落在否定域中，那么我们可以说前提假设有问题。不过，究竟是硬币不诚实还是抽样在程序上违反了随机原则，我们却无从得知。所以要使检验具有意义，必须把怀疑集中在其中一个假设上。在统计检验中，通常把被检验的那个假设称为零假设(或称原假设，用符号H0表示)，并用它和其他备择假设(用符号H1表示)相对比。至于我们究竟情愿认为假设中哪一个可能是错误的，因而应该作为被检验的对象，除了检验本身所提供的知识外，还必须从以往的经验或其他方面了解更多的东西。在掷硬币的试验中，如果可以确定抽样程序遵循了随机原则，那么我们就可以认为硬币有偏，并把硬币无偏定为零假设。一旦实际结果是落在否定域，我们就说p＝0．5的假设错了。反之，实际结果落在否定域之外，就不允许我们否定零假设。
值得注意的是，假设只能被检验，从来不能加以证明。统计检验可以帮助我们否定一个假设，却不能帮助我们肯定一个假设。比如硬币抛掷试验的结果没有落在否定域中，我们不能据此就判定p＝0．5的假设是对的。因为假若硬币真正面朝上的概率是0．49而不是0．50，则正确的抽样分布和我们所计算的几乎完全相同。如果我们因为不能否定零假设就冒然地肯定它，就很可能因为用语太绝对而犯错误。所以在统计检验中，一个零假设如果我们不能否定它，也不能将它作为完全正确的假设而无保留地予以接受，而宁愿采用“不能否定它”的陈述。
为了使检验更严格、更科学，还需要更多的东西。首先，我们必须确定甘冒犯第一类和第二类错误的风险的程度；其次，要确定否定域是否要包含抽样分布的两端。
第一类错误是，零假设H0实际上是正确的，却被否定了。第二类错误则是，H0实际上是错的，却没有被否定。例如，若抛硬币试验的否定域由0次或8次面朝上两种情况组成，每当实际试验出现这两个结果之一时，假设就被否定了。与此同时，我们就有了犯第一类错误的危险。因为，既使p＝0．5的假设是正确的，正如表7．1表明的那样，这样的实验每做256次，毕竟还有出现全部面朝上和全部面朝下各一次的机会。假如抽样我们得到的偏巧就是这样一种极端结果，并据此否定了p＝0．5，那么我们就犯了第一类错误。相反，假如检验中我们得到的结果是3次面朝上5次面朝下，由于这个结果不在否定域内，我们不否定p＝0．5，则有了犯第二类错误的危险。因为如果p＝0．49，而不是0．5，我们也很可能得到相同的结果。换句话说，由于p＝0．5的假设实际上是错误的，却没有被否定，我们犯了第二类错误。
遗憾的是，不管我们如何选择否定域，都不可能完全避免第一类错误和第二类错误，也不可能同时把犯两类错误的危险压缩到最小。对任何一个给定的检验而言，第一类错误的危险越小，第二类错误的概率就越大；反之亦然。一般来讲，不可能具体估计出第二类错误的概率值。第一类错误则不然，犯第一类错误的概率是否定域内各种结果的概率之和。对上述掷硬币的试验，假如决定当得到试验结果是0次、1次、7次或8次面朝上就否定零假设(H0)，那么犯第一类错误的概率将是(1+1+8+8)／256＝7%。
由于犯第一类错误的危险和犯第二类错误的危险呈相背趋向，所以统计检验时，我们必须事先在甘冒多大第一类错误的风险和多大第二类错误的风险之间作出权衡。被我们事先选定的可以犯第一类错误的概率，叫做检验的显著性水平(用α表示)，它决定了否定域的大小。如果抽样分布是连续的，否定域可以建立在想要建立的任何水平上，否定域的大小可以和显著性水平的要求一致起来（后面的正态检验就如此）。如果抽样分布是非连续的，就要用累计概率的方法找出一组构成否定域的结果。即在已知概率分布表上，从两端可能性最小的概率开始向中心累计，直至概率之和略小于选定的显著性水平为止。例如对硬币重复抛掷8次的试验，我们选用0．20的显著性水平，从表7．1开列的概率分布，可以确定否定域由0，l，7或8次面朝上这四种结果组成。每当检验的结果出现这四种情况之一，我们就否定零假设。
在掷硬币的试验中，我们可能怀疑这枚硬币是不诚实的，但却不知道它究竟偏于面朝上还是面朝下。在这种情况下，为了稳妥起见，就要考虑抽样分布的两端。但在许多场合，我们能预测偏差的方向，或只对一个方向的偏差感兴趣。每当方向能被预测的时候，在同样显著性水平的条件下，单侧检验比双侧检验更合适。因为否定域被集中到抽样分布更合适的一侧，可以得到一个比较大的尾端。这样做，可以在犯第一类错误的危险不变的情况下，减少了犯第二类错误的危险。譬如，我们预测方向p＞0．5，即怀疑这枚硬币有面朝上的偏向，那么在同样0．20的显著性水平的情况下，单侧检验的否定域将变为由6，7，8次面朝上这三种结果组成。原来双侧检验，出现6次面朝上这种结果将不否定零假设。现在改用单侧检验，出现这种结果就得否定零假设了。这样，犯第一类错误的概率不变(因显著性水平仍是0．20)，但犯第二类错误的概率则显然降低了不少。
4．计算检验统计量
完成了上述工作之后，接下来就是做一次与理想试验尽量相同的实际抽样(比如实际做一次重复抛掷硬币的试验)，并从获取的样本资料算出检验统计量。检验统计量是关于样本的一个综合指标，但与我们后面参数估计中将要讨论的统计量有所不同，它不用作估测，而只用作检验。在二项检验中，检验统计量就是n次抛掷后成功次数x。x如果是构成否定域的那些结果之一，我们就要否定零假设；反之，就不否定零假设。
计算检验统计量总是必要的。不过在二项检验中，得到x是如此简单，以至于谈不上要去计算，只要从样本资料中点算“成功”的次数就可以了。不过，在后面的正态检验中，通过计算Z分数，我们便会真正体会到计算检验统计量的必要性了。
5．判定
假设检验系指拒绝或保留零假设的判断，又称显著性检定。在选择否定域并计算检验统计量之后，我们完成最后一道手续，即根据试验或样本结果决定假设的取与舍。如果结果落在否定域内，我们将在已知犯第一类错误概率的条件下，否定零假设。反之，如果结果落在否定域外，则不否定零假设，与此同时，我们就有了犯第二类错误的危险。
[例7．2．1] 若想通过抛掷10次硬币的实验来检验这个硬币无偏的零假设，选用双侧检验及0．10显著性水平，请指出否定域。如单侧检验(p＜0．5)又将如何?
[解] P(0) + P(1) + P(9) + P(10)
＝2×(+)＝0．022＜0．10
P(0) + P(1) + P(2) + P(8) + P(9) + P(10)
＝2×(++)＝0．110＞0．10
所以双侧检验时，否定域为0，1，9，10次面朝上。
P(0) + P(1) + P(2)
＝++＝0．055＜0．10
P(0) + P(1) + P(2) + P(3)
＝+++＝0．172＞0．10
所以单侧检验时，否定域为0，1，2次面朝上。

[例7．2．2] 某选区有选民10000人，其中属于文教系统的有4000人，要产生代表6名。假定各系统选民都有同等机会当选代表，求：①代表是文教系统人员的概率分布；②在6名代表中最可能是文教系统人员占几名；③如果6名代表中实际有4名是文教育系统的人员，可以否定随机性的零假设吗?(选用0．05显著性水平，单侧检验，预测方向p＞0．4)
[解] ①既然各系统选民都有相同的当选机会，那么p＝＝0．4。按(7．3)式求代表中有x名是文教系统人员的抽样分布，如表7．3所示。

表7．3
x
P
0
1
2
3
4
5
6
1·729/15625= 0．047
6·486/15625=0．187
15·324/15625=0．311
20·216/15625=0．276
15·144/15625=0．138
6·96/15625=0．037
1·64/15625=0．004

合计
1．000

②由表7．3可见，在满足随机性假设条件下，在6名代表中最可能有文教系统的人员2名。
③由表7．3可见
P(5) + P(6)＝0．041＜0．05
P (4) + P(5) + P(6)＝0．179＞0．05
所以，否定域由x等于5或6组成。而在6名代表中实际有文教系统人员4名，故不能否定随机性的零假设。
此例是成功的概率p已知的情况，这样在随机性的零假设下，就可以用二项分布做非随机性检验了。
[例7．2．3] 在一项研究中，研究人员试图证明如下假设：一个有犯罪倾向的少年如果能经常得到一个成人热忱友好的忠告，他就可能避免犯罪。为此，研究人员在孩子们中取14组，进行控制组和实验组的对照研究。试问，怎样用二项分布做“试验无效”的检验。
[解] 先将14个组两两匹配，得到七配对组（要使每个配对组在除实验变量之外的其他方面尽量相似）。然后在每个配对组中任取一组安排于实验组，另一组安排于控制组。接着，在4—8年的时间内，让分到实验组的七组孩子接受成人一对一的忠告，而控制组的七组孩子没有这样做。而后对每个配对组分别进行后侧度量，并用“+”号表示实验组比控制组好的那些配对组，用“―”号表示实验组比控制组差的那些配对组。除非度量方法很粗糙，每配对组应该都能判断出差异。这样便可以用二项分布做“试验无效”的检验了(参见本章第一节)。
零假设H0：p＝0．5（即“试验无效”）
备择假设H1：p＞0．5
选用0．10的显著性水平，根据附表3中纵列n＝7和横行p＝0．5所对应的x值，可查得
P(6) + P(7)＝0．0625＜0．10
P(5) + P(6) + P (7)＝0．2266＞0．10
所以否定域由6个“+”和7个“+”组成。即对每配对组进行后测度量，如出现6个“+”或7个“+”时，在0．10的显著性水平上，我们将否定零假设，说明试验有效。否则就不能否定零假设，也就是说关于成年人忠告有助于减少少年犯罪的观点不能得到实验结果的支持。

第三节正态分布

如果说二项分布是离散型随机变量最具典型意义的概率分布，那么连续型随机变量最具典型意义的概率分布就是正态分布了。实践中常见的一类连续型随机变量，多数服从或近似服从正态分布。例如测量误差、智商以及人体的身高体重、运动员的成绩等等，都可以用正态分布进行描述。一般地讲，若影响某一变量的随机因素很多，而每个因素所起的作用不太大且相互独立，则这个变量服从正态分布。更为重要的是，正态分布还是抽样理论和统计推断的基础。例如，不论总体是否服从正态分布，只要样本容量n足够大，样本平均数的抽样分布就趋于正态分布。
正态分布的研究始于18世纪，是最重要的概率分布，这是因为：①许多自然现象与社会现象，都可用正态分布加以叙述；②不少离散型随机变量与连续型随机变量的概率分布都以正态分布为其极限（即当样本相当大时，可用正态近似法解决这些概率分布的问题）；③许多统计量的抽样分布呈正态分布，故在参数估计与假设检验上经常以正态分布为理论基础。
1．正态分布的数学形式
自本书第三章引出变量数列，我们便可以列举出不少总体的分布很接近于正态分布，例如男性的身高。如果我们拥有的数据非常多，在编制变量数列时我们就可以把组分得很细，并得到组距很小的直方图。现在想象，如果组越分越细，并且纵轴采用频率密度（＝），直方图最终就转化为的概率密度曲线(X＝x) (参见图7．2)。很显然，从图7．2可以看出，这样的平滑曲线如“钟型”，它具有单峰、对称这两个特点，并且曲线向左、向右延伸，以横轴为渐近线。
上述实例，对于我们领会正态分布是很有启发性的。根据经验总结和理论分析可知，正态分布的概率密度表达为如下形式
(X＝x)＝（7．5）
式中π和e都是常数，分别近似等于3．14和2．72。

从正态分布的数学表达式可以看出，当总体均值μ和方差σ2确定后，正态分布曲线的精确形式也就确定了。换句话说，有许多不同的正态曲线，每一个对应于μ和σ的一个组合。
分析正态分布的概率密度(X＝x)，很容易理解正态曲线具有下列性质：
(1)正态曲线以X＝μ呈钟形对称，其均值、中位数和众数三者必定相等。
(2) (X＝x)在X＝μ处取极大值。X离μ越远，(X＝x)值越小。这表明对于同样长度的区间，当区间离μ越远，X落在这个区间的概率越小。正态曲线以X铀为渐近线，即(X＝x)在| X |无限增大时趋于零，即(x)＝0或( x)＝0。
(3)对于固定的σ值，不同均值μ的正态曲线的外形完全相同，差别只在于曲线在横轴方向上整体平移了一个位置(参见图7．3)。
(4)对于固定的μ值，改变σ值，σ值越小，正态曲线越陡峭；σ值越大，正态曲线越低平(参见图7．4)。
(5)正态分布的数学期望E(X)＝μ，变异数D(X)＝σ2，因为
E(X)＝＝μ
D(X)＝＝σ2

正态曲线的性质可供阐明标准差。由于曲线的形状完全取决于标准差σ，所以σ可供作为衡量总体分布状况的一个统一的尺度，称为标准差。从直观上去理解，σ实际上是一个很好的离势的量度: σ值越小，离中趋势越小，总体中各变量值也就越接近;；σ值越大，离中趋势越大，总体中各变量值也就越分散。

2．标准正态分布
我们在统计分析时，经常性的重要工作是要确定给定区间所含总体单位数的比重，也就是变量X的取值在这个给定区间内出现的频率。因此在对有限总体的数据进行分组时，得到相对频数分布是很重要的。对于连续变量，过去由于分组有限，只能加以近似地讨论。现在，由于正态曲线的一些异乎寻常的数学性质，使得这项工作非但不困难，反而变得简单易行。一般作法是引入新的随机变量Z[参见(5．12)式]
Z＝ (7．6)
上式表明，Z代表以标准差σ为单位表示的变量值离开均值μ的偏差，即代表经σ标准化之后的X对μ的离差。故Z经常被称为变量X的标准分，或称Z分数；Z亦被称为标准正态变量。
如果把Z代入(7．5)式，我们便得到了用Z分数表达的标准正态分布，其概率密度为
(Z)＝ (7．7)
比较(7．5)和(7．7)式，很容易得知标准正态变量的数学期望E(Z)＝0，变异数(即方差)D(Z)＝1。实际上，标准正态分布(Z)只是正态分布的一个特例，即μ＝0，σ2＝1的正态分布，简记作N(0，1)。对于一般正态分布则简记为N(μ，σ2)。
3．正态曲线下的面积
我们在第三章学习过频数(或频率)分布图，从中我们体会到，用几何图形表示统计资料的好处在于，直观地从图形的升降起伏就可以看出总体的分布特征和规律性。具体来说，矩形的高度（更确切地说是矩形的面积）是和相应区间里所含的总体单位数成正比的。如果取各矩形的总面积为1，一定区间图形所含的面积就等于变量的取值在该区间出现的频率。现在组距不断变小，直方图过渡到了平滑曲线，但基本原理并没有变。
和频率分布的直方图一样，正态曲线下的总面积也为1。从直方图中选取任一个矩形，如图7．5所示，平滑曲线多包含的那一部分面积等于被曲线切去一角的那一部分矩形的面积，增减相当。而作为频率分布的极限，正态曲线下的面积可设想是组距趋于0而矩形无限增多时所有矩形面积的总和。在频数分布直方图中，所有矩形的总面积为1，所以正态曲线下的面积当然也是l。

正态分布是最具典型意义的连续型随机变量的概率分布。上一章已经说明，对于连续型随机变量，由于X＝x的取值充满一个区间，不能一一列出，因此只能关心X的取值落在一个区间的概率。现在既然有了正态分布的概率密度(7．5)式，随机变量X的取值在某区间{x1≤X≤x2}上的概率便可用下式求得
P(x1≤X≤x2 )＝
但积分毕竟太麻烦了，更何况许多人对积分运算不熟悉，为此须计算出现成的数值表供使用者查找。由于正态曲线的优良性质，这项工作可以卓有成效地完成：①经过X的标准分Z＝，可以将任何正态分布N(μ，σ2)转换成标准正态分布N(0，1)；②运用分布函数的定义，并利用正态曲线的对称性，通过下式（分布函数）可以计算编制出正态分布表(见附表4)。
F(Zα)＝P（0≤Z≤Zα）＝ (7．8)
采用标准正态变量表达正态分布，使标准差得到了进一步阐明。我们看到，标准差是计算总体单位分布及其标志值变异范围的主要依据，图7．6说明了这一点。

如果从总体均值向右一个标准差定出一区间，则在这个区间正态曲线下方所包含的面积为0．3413。因此这个面积的两倍，X的取值有68．26％包含在均值两侧各一个标准差的范围之内。换言之，略多于2／3的总体单位出现在总体均值两边的一个标准差的范围之内。同样，在均值与距它两个标准差的区间内，正态曲线下方所含面积是0．4773。因此略多于95％的总体单位包含在均值两边的两个标准差的范围之内。虽然理论上正态曲线向两边可扩展至无限远，但几乎所有总体单位(99．73％)都位于均值两边的三个标准差的范围之内。
总之，决定任意两点间的面积都完全是可能的。比如向均值两侧移1．96个标准差，曲线下方便包含了大约95％的面积，如移动2．58个标准差，则面积几乎是99％。附录4已编制了关于Z和标准正态曲线所含面积之间关系的精确数值表，即Z从0到+∞变化，相应区间所含的面积从0变至0．5。这种处理具有重要的实用价值，以后只要知道分布是正态的，有关计算只要查表就成了。
[例7．3．1] 设随机变量X服从正态分布N(50．102)，试求P(50 ≤X≤65)。
[解] 已知μ＝50，σ＝10，Z1＝0
Z2＝＝＝1．5
查表得正态曲线在此区间的面积是0．4332(参见图7，7)。所以，P(50 ≤X≤65)＝43．32%。

[来源:数理化网]

[例7．3．2] 设随机变量X服从正态分布N(168，122)，试求P(X≤143)。
[解] 已知μ＝168，σ＝12，
Zα＝＝＝―2．08
Z是负值，表示X的取值处于均值左边。由于曲线完全对称，所以使用正态分布表时可以忽略Zα的正负号。查表可知，正态曲线在均值与Zα＝2．08之间所含的面积是0．4812。由于总面积的一半是0．5，因此P(X≤143)可以由下面计算求得
P(X≤143)＝0．5―P(0≤Z≤2．08)
＝0．5―0．4812
＝1．88％
这说明，X的取值小于或等于143的概率大约是2％。由于即将讨论的正态检验几乎都要涉及概率分布的尾端，所以此例说明的是一个非常普遍的问题(参见图7．8)。

[例7．3．3] 设随机变量X服从正态分布N(60，82)，试求：①第一四分位数的标志值；②第一四分位数和标志值为50的取值之间正态曲线所含的面积(参见图7．9)。
[解] 先根据四分位数的定义，通过正态曲线左边尾端面积为0．25，查表求出四分位数Q1对应的Z分数
Zα＝0．67＝
Q1＝μ―Zασ＝60―0．67×8＝54．64
由此可见，第一四分位数的标志值是54．64。
再求标志值为50的Z分数
Zα＝＝1．25
查表得Zα＝1．25和均值之间正态曲线所含的面积是0．3944。所以
P(50 ≤X≤Q1)＝0．3944―0．25＝0．1444
这说明，X的取值在第一四分位数Q1和50之间的概率是14．44％。

[来源:www.shulihua.net]

4．二项分布的正态近似法
二项分布是在所谓的重复独立试验之中产生的。通过本章第一节的讨论，我们已经知道二项分布受成功事件概率p和试验次数n两个参数的影响，只要确定了p和n，二项分布也随之确定了。
但是，二项分布的应用价值实际上受到了n的很大限制。也就是说，只有当n较小时，我们才能比较方便地利用(7．3)式计算二项分布。所幸的是，二项分布是以正态分布为极限的。所以当n很大时，只要p或q不近于零，我们就可以用正态近似来解决二项分布的计算问题，即
＝P(Z1≤Z≤Z2)＝d z （7．9）
又 Zα＝（7．10）
式中：Z为标准正态随机变量，n为重复试验的次数，p为成功的概率，q＝1―p为失败的概率，x为二项随机变量。
[例7．3．4] 在抛掷一枚硬币10次的二项试验中，试以二项分布与二项分布的正态近似法，求成功3到6次的概率。
[解1] 已知p＝0．5，n＝10，查附表3得
P(3≤x≤6)＝(x；10，0.5)＝0．9453―0．1719＝0．7734
[解2] 用二项分布的正态近似法
μ＝np＝10×0．5＝5
σ＝＝＝1．58
Z2＝＝＝- 1．58
Z2＝＝＝0．95

查表得 P（Z1≤Z≤Z2）＝P（―1．58≤Z≤0．95）
＝0．4430十0．3289
＝0．77l 9
由正态近似法求得的概率为0．7719，这一数值十分接近由二项分布算得的0．7734。
简言之，二项分布的正态近似法，即以n p＝μ、n p q＝σ2，将B(x；n，p)视为N(n p，n p q)进行计算。在社会统计中，当样本量n ≥30，n p、n q均不小于5时，对二项分布作正态近似是可靠的。
[例11．3．5] 铁路部门预计对号车票的旅客中有5％赶不上该列车，该列车有座位600个，但却售出了620张票，试求每位旅客都有座位之概率。
[解] 设“赶不上火车”为成功事件，则随机变量“赶不上火车的人数”可看成服从二项分布。因n＝620大于30，n p＝620×0．05＝31，n q＝620×0．95＝589，所以可对二项分布作正态近似。现μ＝n p＝31，σ2＝n p q＝620×0．05×0．95＝29．45。列车有600座位却售出了620张车票，故每位旅客都有座位的概率是P(x＞20)，于是有
Zα＝＝＝―2．03
查表得 P(x＞20)＝P(Z＞―2．03)
＝0．4788十0．5
＝97．88％
所以，每位旅客都有座位的概率为97．88%。
[例11．3．6] 共有5000个同龄人参加人寿保险，设年死亡率为0．1％。参加保险的人在年初应交纳保险费10元，死亡时家属可领2000元。求保险公司一年从这些保险的人中，获利不少于30000元的概率。
[解] 据题意，保险公司一年内若获利不少于30000元，最多理赔人数为
x＝＝10(人)
现因n＝5000大于30，n p＝5000×0．001＝5，所以二项分布可用正态分布近似法处理。于是有
Zα＝＝＝2．237
查表得
P(x≤10)＝P(Z≤2．237)
＝0．4875十0．5
＝98．75％
所以保险公司一年内从这些保险的人中获利不少于30000元的概率为98．75％。

第四节中心极限定理

在各种分布中，正态分布居于首要地位。这不仅因为许多总体分布具有正态分布的特征，更为重要的是，无论总体服从什么分布，其样本均值的概率分布都随着样本量的增加而呈正态分布。这一节我们将着重讨论抽样分布与中心极限定理，后者是全部统计推断理论中最重要的定理。在推论统计中，作为研究对象的总体，其分布总是未知的。中心极限定理对大样本均值正态分布性质的揭示，为未知总体的研究奠定了理论基础。
1．抽样分布
在本章第二节，我们已经引入了抽样分布的概念。为什么要讨论抽样分布?这是因为一旦统计的学习进入到推论统计，我们就必须同时与三种不同的分布概念打交道，即总体分布、样本分布、抽样分布。为了不产生混淆，视分布不同，将统计指标的符号加以区别是完全必要的。对那些反映标志值集中趋势和离中趋势的综合指标，尤其对均值和标准差(或方差)，现在我们应该注意鉴别它们在具体场合哪些是概括总体特征的，哪些是概括样本特征的，哪些是概括抽样分布特征的。为此列表如下：

表7．4

均值
标准差
总体分布
样本分布
抽样分布
μ

μ
σ
S

已知一总体分布，可求得它的特征值。根据总体分布计算的特征值，即根据总体各个单位标志值计算的统计指标，在推论统计中称为总体参数。总体均值和总体标准差(或方差)是反映总体分布特征最重要的两个总体参数，习惯上分别记作μ和σ(或σ2)。
同理，已知一样本分布．可求得它的特征值。根据样本分布计算特征值，即根据样本各个单位标志值计算的统计指标，在推论统计中称为统计量。样本均值和样本标准差(或方差)是反映样本分布特征最重要的两个统计量，习惯上分别记作和S(或S 2)。
将总体均值、总体标准差与样本均值、样本标准差加以区别是很必要的。因为总体参数和统计量之间存在着重要差别。参数是有关总体的固定值，一般都是未知的。例如，在任何给定的时间，某学校学生平均年龄这样的参数一般是未知的，因为如果参数已知就用不着抽取样本了。但参数如果能得知，那么对所有观察者来讲都必定相同。因此μ和σ都应该是唯一确定的值。而统计量则不然。任何统计总体，由于样本容量n小于总体容量N，可能被重复抽取的样本就不止一个(也可以说可以抽取许许多多乃至无数个样本)。在一总体中，当从一个样本换为另一个样本，统计量很可能不同。例如从学生总体中随机地抽取10个学生组成样本，我们就不能期望样本不同也可以得到精确相同的年龄均值。所以，统计量必定是随机变量。另一方面，与参数不同，对于一个特定的样本而言，统计量是可以计算出来的，这便是抽样调查的价值所在。不过，一个特定的样本对总体的实际代表程度如何，则是另一回事。
由于统计量是随机变量，并且在一个统计总体中可以重复抽取的样本在理论上是无数的，所以可以用概率分布来进行描述。
在推论统计中，理论和实际的一个重要结合就是通过抽样分布和抽样调查这两者的联系来实现的。首先，抽样调查是从总体中随机地抽取样本，然后借助样本指标数值来推算总体指标数值。只有遵从随机原则，样本分布才接近于总体分布，进而表现样本分布的特征值才对反映总体分布的特征有较大的代表性。与此同时，只有遵从随机原则，尽可能减少非抽样误差，样本调查的结果才能在假设检验中作为有效的检验统计量。
其次，抽样调查只涉及总体的部分单位，因此哪怕随机样本是有保障的，样本的统计量与总体参数之间也存在一定的差别。对于用样本指标代表总体指标而不可避免存在着的误差，除了运用数理统计的方法得到抽样分布，样本本身不能告诉些什么。这样，本书在引出总体分布、样本分布的概念之后，又引出了抽样分布的概念。需要再次提醒大家，抽样分布是运用数理统计的方法，把具体概率赋予样本的所有可能结果的一种理论分布。但有了抽样分布对概率分布的具体化，研究者便找到了一种理论与实际相联系的有效途径。
2．中心极限定理
我们知道，概率论中用来阐明大量随机现象平均结果的稳定性的定理，是著名的大数定理。其具体内容是：频率稳定于概率，平均值稳定于期望值。但是，大量随机现象的稳定性不仅表现在平均结果上，同时也表现在分布上，这就是中心极限定理所要阐明的内容。仔细考虑统计量和与之相对应的未知参数的接近程度，引出了研究和应用抽样分布的课题。显然，推论统计需要有一座能够架通抽样调查和抽样分布的桥梁。中心极限定理告诉我们：如果从任何一个具有均值μ和方差σ2的总体(可以具有任何形式)中重复抽取容量为n的随机样本，那么当n变得很大时，样本均值的抽样分布接近正态，并具有均值μ和方差。
通过上一节，我们已对正态分布留下了深刻印象。不过，在现实世界里，像身高、体重、婚龄、智商等等近似服从于正态分布的总体其实是相当有限的。幸运的是，中心极限定理大大放宽了对正态总体的前提要求。它指出，无论总体的分布多么异常，只要n足够大，我们可以相信得到的样本均值的抽样分布近似于正态分布。正如二项检验那样，因为在显著性检验中使用的是抽样分布，而不是总体分布。这就意味着，只要n足够大，我们就完全不必顾忌总体是不是正态，尽可以在检验中使用正态曲线。而正态曲线具有特别的数学性质，使用它是很方便的。
无疑，中心极限定理大大拓展了正态分布的适用面，同时我们得到了以下重要信息：
(1)虽然样本的均值可能和总体均值有差别，但我们可期望这些将聚集在μ的周围。因此均值抽样分布的算术平均数能和总体的均值很好地重合，这就是为什么在表7．4中总体均值和抽样分布的均值用同一个μ表示的缘故。
(2) 由于抽样分布的标准差要比总体标准差小，并且＝，所以如图7．10所示，样本容量越
大，抽样分布的峰态愈陡峭，由样本结果来推断总体参数的可靠性也随之提高。

这是与我们的常识相一致的。在无偏的前提下，在估计总体均值时，较之用小样本，我们更相信大样本。而定理比常识高明之处在于，它指出，如果n增加了一定的数量，那么可靠性将随之提高到什么程度。例如，为了把抽样分布的标准差缩小一半，就要把n扩大4倍。
在后面学习的统计推论中，我们一般是用样本均值作为总体均值的估计量的。早在本书第二章我们就已经知道，在遵守随机原则的条件下，用样本指标值代表总体指标值不可避免地存在着抽样误差。统计推论不能从样本资料算出统计量就完事了，还必须进行误差分析。从直观的意义上去理解，抽样误差应该是指某一次抽样结果所得的样本统计量与总体参数之间的差别。但事实上，这一差别无从得知。因为，如果知道了总体参数，也就不需要抽样了。具体某一次抽样结果的误差，仅仅是反复抽样下一系列抽样结果可能出现的误差中的一个，它亦是随机变量，显然不能用来概括一系列抽样可能产生的抽样误差。而抽样分布的标准差可以综合地反映了样本均值在总体均值附近的变异程度，因此我们用它来概括一系列抽样可能产生的误差，并把它称为抽样平均误差。后面我们将看到，利用抽样分布计算，在统计推断与估计的误差分析中也具有重要意义(抽样平均误差将在第九章较系统地加以讨论)。
为了理解中心极限定理的正确性，最好的方法是从一个已知均值和标准差的总体中抽取一些样本，计算样本均值，并把这些均值一一在图上标出，看抽样分布是不是正态，同时找出这些均值的标准差，再把它与做比较。但是，为什么在总体分布不是正态的时候，其抽样分布却很可能会是正态呢?下面我们来看在一个男女人数相等的性别总体中，当抽取的样本越来越大时将会发生些什么?
描述这个该总体只要分两组、用两个标志值就可以了，因此其分布显然不可能是正态的。为了简单起见，用X＝1表示男性，X＝0表示女性。并且，因为男女人数相等，所以相对频数都是1/2，计算后知总体均值μ也等于1/2，图7．11表示了这种十分简单的分布。当然，严格来讲分布是离散的，而不是图中画的那样是连续的。

现在我们从这个总体抽取随机样本，看样本均值的分布怎样随其容量n起变化。先抽2人，井计算样本均值的抽样分布。很显然，如果对抽到的人加以区分，能得到四种结果：两人都是男性，标志值和最大(为2)；两人都是女性，标志值和最小(为0)；男性女性各一人则会有两种情况。四种结果的标志值可分别显示为(1，1)，(0，0)，(1，0)，(0，1)。求样本均值的方法很简单，只要按(4．1)式把标志值加起来除以2。样本均值的抽样分布可按古典法直接算出，也可以由(7．3)式算出。样本均值的概率分布分别见表7．5和图7．12。
表7．5

（均值）
P（概率）
0
1
2
0
1/2
1
1/4
1/2
1/4

然后抽取容量为4人的随机样本，样本均值的分布如表7．6所示。除均值和其概率的计算稍许复杂一点外，计算方法和n＝2的样本完全一样，绘成图7．13。

表7．6

（均值）
P（概率）
0
1
2
3
4
0
1/4
1/2
3/4
1
1/16
4/16
6/16
4/16
1/16

再取样本容量为8人，样本均值抽样分布如表7．7所示，绘成图便是图7．14。

表7．7

（均值）
P（概率）
0
1
2
3
4
5
6
7
8
0
1/8
2/8
3/8
1/2
5/8
6/8
7/8
1
1/256
8/256
28/256
56/256
70/256
56/256
28/256
8/256
1/256

至图7．14，样本均值的抽样分布已经开始接近正态曲线了，尽管这时样本容量还不过是8。这就从直观上说明了为什么当容量n越来越大时，样本均值的抽样分布会逼近正态曲线，而总体分布怎样是无关紧要的。
那么究竟n多大时，才可以放宽总体是正态的限制而放心使用中心极限定理呢?这个问题尚无简单的答案，因为它还与下列问题有关： ①估计第一类错误所要求的精度；②总体接近正态的程度（虽然总体分布是与抽样分布含义不同的分布，但正态总体的抽样分布要比非正态总体的抽样分布更容易接近正态）。一般我们采用经验定则：如果n＞100，正态总体的限制总是可以放宽；如果n＞50，同时经验表明总体分布与正态分布的差异不大时，可以放心使用中心极限定理；如果n≤30，就应该避免使用该定理。
统计检验应用正态分布和二项分布有两点区别：①抽样分布在这里是连续的而非离散的，否定域的大小可以和显著性水平的要求精确地一致起来。②计算检验统计量不再像在应用二项分布时那样，可以不劳而获了。很显然，为了能使用现成的正态分布表，关键是要从样本资料中计算出在N(0，1)形式下的统计量Z，再根据Z是否落在否定城内而对被检验假设的取舍作出决定。
在上一节（7.6）式，我们曾引出Z＝。Z的这种形式适用于N(μ，σ2)的总体，但并不适用于取正态的抽样分布。正如我们反复强调的那样，统计检验单纯依靠样本自身是得不出结果的，必须首先在一系列假设的基础上求出抽样分布。如果这些假设实际上正确，那么抽样分布将告诉我们得到一个给定的的可能性是多少。在抽样分布中，随机变量的取值是每个，均值是μ，标准差是＝。因此Z如果作为检验统计量，应该用替换X，用替换σ，μ不动，因而有
Z＝ (7．11)

第五节总体均值和成数的单样本检验

现在我们来看中心极限定理在统计检验中的应用。虽然不必每一次都明写出来，但本章第二节论述的检验程序的每一步都不能缺少。把从样本调查中得到的检验统计量与假设的总体均值作比较，我们很快发现了正态分布的重要的实用价值。
1．σ已知，对总体均值的检验
例如，一位研究者试图检验某一社会调查(如家庭收入调查)所运用的抽样程序，该项调查是由一些缺乏经验的采访员进行的，研究者怀疑属于干部和知识分子的家庭抽得过多。过去的统计资料表明，这一街区的家庭的平均年收入是24500元，标准差是3000元。这次调查共随机抽选了l00个家庭，样本的家庭平均年收入是25300元。该研究人员是否有理由怀疑该样本有偏估(选用α＝0．05)。
研究者主要由于采访者缺乏经验而对随机样本这一点不放心，因此随机抽样就是待检验的零假设。因为样本容量为100，可以运用中心极限定理。于是求抽样分布，在这里变为去查正态分布表。在统计检验中，我们多半使用一些现成的数值表。应该明白，这些数值表是用概率论计算出来的，使用它们实际上就是在使用抽样分布。
根据题意，显著性水平为0．05，并由于研究者怀疑抽样调查对中上收入家庭做了较多的抽取，所以用单侧检验。查正态分布表得知，离均值1．65标准差以外的正态曲线的面积是全部面积的5％，这就是否定域(图7．15中的阴影部分)。所以，只要样本均值大于μ的量超过1．65个标准差时，便否定零假设。

题目实际已给出下列量：＝24500元，μ＝25300元，σ＝3000元，n＝I00，根据(7．11)式计算检验统计量有
Z＝＝＝2．67 ＞1．65
检验统计量Z的计算表明，样本均值比总体均值大2．67个标准差（），超过了显著性水平规定的临界值，调查者应该否定“随机抽样”的零假设。也就是说，由于抽样在程序上不合要求，这项社会调查有必要重新组织。
中心极跟定理实际解决了大样本均值的检验问题。假定样本比较大(n＞50，这在社会调查中一般都能得到满足)，样本均值的抽样分布就与总体分布无关，而服从正态分布。当H0成立时，样本均值的观察值比较集中地分布在总体均值μ周围；当H0不成立时，对μ有明显偏离的趋势。因而，我们可以在选定的显著性水平上，通过计算检验统计量Z，对零假设进行检定。
[例7．5．1] 某单位统计报表显示，人均月收入为2330元，为了验证该统计报表的正确性，作了共81人的抽样调查，样本人均月收入为2350元，标准差为75元，问能否说明该统计报表显示的人均收入的数字有误(取显著性水平α＝0．05)。
[解] 根据题意，可作如下的假设
H0：μ＝2330元
H1：μ≠2330元
因α＝0．05，查正态分布表得Zα/2＝1．96，故否定域为|Z|≥1．96
根据(7．11)式计算检验统计量
Z＝≈
＝＝2．40＜1．96
所以，可以认为该单位人均月收入不是2330元，即可以认为该统计报表有误。
2．学生t分布(小样本总体均值的检验)
在大多数场合，把总体参数作为已知是不切实际的。通常我们既不知道μ的值，也不知σ的值。但中心极限定理涉及到σ，而我们又不能轻视这条定理的价值。那么怎么办呢？一种方法就是用样本标准差S来代替σ。在Z的公式中，σ／直接被S／取代。因为S可以从样本数据中计算出来，所以公式中就没有未知数了。事实证明，当n大的时候，用这种方法可以得到很好的结果。问题是当n较小的时候，用这种方法求出的概率可能是错误的，有必要做某种修正。于是人们设计了另一种检验统计量
t ＝ (7．12)
这个统计量最初是由戈塞持(Gosset，1876一1937年)用笔名“学生”发表，所以这个统计量的抽样分布称为学生t分布。比较t和Z，我们注意到它们的分子相同，而分母却稍有不同：①σ为S所代替(这一点无须解释)；②根号下是n―1。
图7．16大致从直观上说明(7．12)式中采用n―1的原因。因为样本数据的全距只能小于(顶多等于)总体数据的全距，可以明显看出，样本数据的离散程度小于总体数据的离散程度。如果用样本的标准差来代替总体的标准差，就会偏小，即产生所谓的“向下偏误”。为了修正这种偏误，以便使修正的样本标准差更好地估计总体标推差，所以用n―l而不用n。n―1实际为自由度数k，这一点将在第九章得到说明。

图７．1６

当Z为t替代的时候，虽然用因子n—I所导致的修正看起来不大，但在样本容量较小时，这种修正就会起很大作用了。所以当不知道σ值，而样本容量较小时，我们应该考虑应用t分布而不是Z分布。通过下式可以编制出t分布表(见附录5)。
＝＝ (７．13)
注意tα（k）写法的含义，它表示自由度数为k的t分布当分布函数＝时随机变量t的临界值。
当n变大，t分布将越来越接近正态分布，应用t分布还是Z分布就无所谓了。事实上随着n变大，S逐渐变成σ的精确估计量，因而分母项无论使用S还是σ，差别都非常小。但特别要留意，使用t分布的条件比使用Z分布的条件苛刻，即必须假定总体为正态。
[例７．5．2]一个容量为25的样本，具有均值52和标准差12，用单侧检验和双侧检验分别来检验总体均值为57的假设(都取0．05)。
[解] 据题意，已知n＝25，＝52，S＝12，μ＝57(零假设)。因n小而又不知道σ值，故采用t检验。对自由度24来讲，单侧检验和显著性水平0．05，查表知否定域为t值等于或大于 1．711；而双侧检验和显著性水平0．05，查表知否定域为t值等于或大于2．064。下面计算检验统计量
t＝＝＝-2．041
我们已经确定，单侧检验时，任何一个大于1．711的|t|值都在否定域内。现在因为|t|＝2．041，故单侧检验时要否定μ＝57的零假设。而双侧检验时，|t|值要在大于2．064时才落在否定城内。现在因为|t|＝2．041，所以双侧检验时不能否定μ＝57的零假设。
通过上例，我们又一次看到单侧检验的优点。在犯第一类错误概率相同的情况下，如果结果出现在预测方向上，研究者使用单侧检验比双侧检验更可能否定零假设。与此同时，犯第二类错误的危险也随之减少。反过来讲，当检验不能否定零假设时，使用单侧检验比使用双侧检验更令人放心。
现在可以对t分布的性质做三点归纳：①t分布对称于E(t)＝0，但非正态分布；②对比Z分布表和t分布表，只有当样本比较小的时候，Z分布和t分布才有较大的差别；③使用t分布表时，除非n较大，否则还必须假定总体为正态。因为当n相当大时，检验统计量t可以由Z来替代，所以t检验是在小样本且可假定总体为正态的情况下才具有实用价值。
3．关于总体成数的检验
有时，需要对总体中具有某种特征的单位在总体中所占的的比例p（即总体成数）作显著性检验，如人口中的失业率、学龄儿童中的失学率等等。成数检验与二项检验的联系是不言而愈的。因为在二项检验中，随机变量是样本的“成功”次数x，而在成数检验中，随机变量是样本的“成功”比例（即样本成数），这样在试验次数n一定的情况下，显然有
＝ (７．14)
记“失败”的样本成数为，显然同时有
＝＝1― (７．15)
既然是一个随机变量，那么把具体概率赋予样本成数的每一个取值，我们就得到了样本成数的抽样分布。根据中心极限定理，并参照表７．5、表７．6和表７．7，不难想见，当n足够大时，样本成数的抽样分布也服从正态分布。根据(６．３９)式和(６．４８)式，井利用成数检验与二项检验的密切关系，我们很容易就求得样本成数抽样分布的数学期望E()和变异数D()，即
E()＝E ()＝E (x)＝·np＝p＝ (７．16)
D()＝D()＝D (x)＝·npq＝＝ (７．17)
式中：p为总体中“成功”次数的比例，q为总体中“失败”次数的比例。必须再一次提醒大家，这里p和q是有关总体的固定值，即总体成数。
这样一来，大样本(n≥30，np≥5)的成数检验就变得很简单了。利用中心极限定理，关于成数的检验统计量Z可表示如下
Z＝ (７．18)
[例７．5．3] 某社区原来成年男性中吸烟者占64％，经过戒烟宣传后进行抽样调查，发现100名被调查者中，有55人是吸烟者，试问戒烟宣传是否收到明显成效(α取0．05)。
[解] 据题意，n＝100＞30，np＝l00×64＝64＞5，故可使用正态检验。
已知＝0．55，p＝0．64，q＝0．36，则
H0：p＝0．64
H1：p＜0．64
据题意，选择单侧检验，因α＝0．05，查正态分布表得Zα＝1．65，故否定域为|Z|≥1．65。[来源:学§科§网]
根据(７．18)式计算检验统计量
Z＝＝＝―1．88＜―1．65
所以，能否定零假设p＝0．64，即能认为戒烟宣传收到了显著成效。
[例７．5．4] 孟德尔遗传定律表明：在纯种红花豌豆与白花豌豆杂交后所生的子二代豌豆中，红花对白花之比为3：1。某次种植试验的结果为；红花豌豆176株，白花豌豆48株。试在α＝0．05的显著性水平上，检定孟德尔定律。
[解] H0：p＝0．75
H1：p≠0．75
因α＝0．05，查正态分布表得Zα/2 ＝1．96，故否定域为|Z|≥1．96。
根据(７．18)式计算检验统计量
Z＝＝＝1．23＜1．96
所以保留H0，即没有充分证据否定孟德尔定律，这次试验再次肯定了该定律的正确性。
最后，我们概括一下成数检验与二项检验的关系：①在二项分布中，我们处理的是成功次数x，而不是成数，将成功次数的期望值和标准差除以n，即可得到成数的期望值和标准差。②在样本容量较大时，我们可以用成数表示二项分布问题，再用正态检验来加以处理。但在样本容量较小时，则使用二项检验更合适。③应该注意到，成功次数x是离散型随机变量，而成数却可以是连续型随机变量。但成数检验和二项检验都属二分定类尺度，所以可以适用于不同测量层次。

www.shulihua.net
w。w-w*k&s%5￥u

www.shulihua.net
w。w-w*k&s%5￥u