Page 227 - 《社会》2014年第6期
P. 227
社会· 2014 · 6
的区别,即是否需要引入备择假设和如何拒绝原假设。费雪的显著性
检验模式中只有原假设,没有也不需要引入备择假设,并使用 狆 值(在
原假设为真的前提下,出现观测值及更极端值的概率)作为否定原假设
的依据。在费雪看来,即使拒绝了原假设,也没有足够的证据证明它的
对立命题,即 犖犘 检验中的备择假设为真;如果要验证备择假设是否
可取,则需设计另外一套检验程序,而不是在一次检验中拒绝某一假设
并同时接受另外一个假设。因此,他认为备择假设的引入完全是没有
必要的,研究者只需根据实际情境设计一个贴切的原假设,然后进行检
验,并用检 验 的 结 果,结 合 自 身 的 经 验 做 出 最 终 判 断 ( 犉犻狊犺犲狉 , 1971 ,
1973 )。 1 而奈曼 - 皮尔逊则认为,备择假设的引入以及由此产生的两类
错误(第一类错误与第二类错误,即弃真错误和纳伪错误)的划分,才使
人们可以进入假设检验的核心问题,即在从频率意义上控制第一类错
误( α )的前提条件下,谋求第二类错误( β )最小化,即利用似然比方法
寻找一致最大功效无偏检验。在原假设的拒绝方式上,他们使用了检
验统计量的值是否落入提前确定的拒绝域来作为是否拒绝原假设的二
分标准,并把费雪提出的显著性水平 α 赋予了频率化的解释:在假想的
若干次相同条件的重复测量前提下,出现原假设为真而将之拒绝的错
误次数与总观测次数之比。同时,研究者可根据检验的结果,做出是否
采取某一行动的行为决策( 犖犲 狔 犿犪狀犪狀犱犘犲犪狉狊狅狀 , 1966 )。当然,两者之
间还涉及诸多技术上与前提假设上的差别,这方面已有其他文献从统
计学的角度做了详尽的介绍( 犔犲犺犿犪狀狀 , 2011 ),此处不再赘述。
用数学的眼光看,费雪“一事一议”式的显著性检验,无法脱离具体
情境的限制,难以上升一个一般性的理论,因此存在逻辑上的缺憾。如
何制定一些原则和标准,对检验的优劣性进行比较,从而选择最优化的
检验方案?如何确立一个统一的行动准则,使得假设检验可以普遍性
地应用于各种情境?在奈曼 - 皮尔逊看来,一个完整的假设检验应当同
时考虑一类错误与二类错误;如果两个检验的显著性水平相同,则称它
们是“等价”( 犲 狇 狌犻狏犪犾犲狀狋 )的;如果仅考虑检验的水平,这种检验在形式
上就是费雪的显著性检验(当然费雪本人并不认可这一点)。如果在若
1. 费雪的多数论 文 及 信 件 均 可 在 此 网 站 找 到: 犺狋狋 狆 :// 犱犻 犵 犻狋犪犾.犾犻犫狉犪狉 狔 .犪犱犲犾犪犻犱犲.犲犱狌.犪狌 / 犮狅犾犾 /
狊 狆 犲犮犻犪犾 / 犳犻狊犺犲狉 。
· 2 2 0 ·