Page 232 - 《社会》2014年第6期

P. 232

从工具到范式：假设检验争议的知识社会学反思

三、犖犎犛犜的盛行：实用性对数学美的反击

首先必须指出，犖犎犛犜既不完全是费雪式的显著性检验（因为
犖犎犛犜使用备择假设），也不完全是奈曼－皮尔逊式的假设检验（因为
犖犎犛犜没有要求计算功效大小，也不完全要求使用拒绝域法，而可以采
用费雪的狆值法拒绝原假设），而是一种杂合体。这种杂合或许源自
于对实用性与数学美的折衷，即同时介绍两类错误的思想，但由于第二
类错误难以计算，故实际中又只控制第一类错误。尽管费雪言辞激烈
地声称：“我和我全世界的学生都从未想过要使用它（犖犘检验）。若要
我坦陈原因，那就是他们的处理方式完全走入歧途 ……”（犅犲狀狀犲狋狋，
１９９０：１４４），但这些批评似乎并未被数理统计学界完全接受。更普遍性
看法则是犖犘理论确实深化了费雪的显著性检验思想，不论费雪本人
是否认可。例如，有教材这样介绍假设检验思想：“既然我们不可能同
时控制一个检验的犯第一类、第二类错误的概率，在此背景下，只能采
取折中方案。通常的作法是仅限制第一类错误的概率，这就是费雪的
显著性检验”（茆师松、程依明、濮晓龙，２０１１：３６１）。这代表了统计学内
的众数意见。应用统计类的书籍往往就此打住，只有专业的数理统计
教材才以不同的篇幅和深度讨论作为犖犘检验核心的一致最大功效、
一致最大功效无偏及似然比检验的思想。
显然，一般意义上的数理统计学家完全了解不同假设检验模式之
间的区别，虽然许多统计学家（包括奈曼与皮尔逊本人）倾向于认为
犖犘检验是对显著性检验的更新和强化，但统计学内部对两者之间从
２０世纪３０年代初起延续至１９６２年费雪去世期间的论战也并不陌生。
此外，在费雪与奈曼－皮尔逊进行旷日持久的论战的同时，完全不认同
频率化概率解释的贝叶斯学派也已经兴起，并提出其自己的一套假设
检验理论。这一理论在２０世纪７０年代之后日渐流行，并伴随着计算
机软件的兴起，这种需要大量数值和符号运算的检验方式慢慢获得了
研究者的青睐。从数理统计的教育模式看，对于犖犎犛犜，虽然在入门阶
段都有介绍，但也不会停止于此，而会在高级教材或研究中详细说明其
他类型的检验模式。因此，至少在数理统计学内部，并不存在一个统一
的假设检验模式，而一直是多元化竞争的局面。尽管在多元化的声音
中，犖犘检验的声音在２０世纪中期曾一度占据着较为主导的地位，但

· ２２５ ·

227 228 229 230 231 232 233 234 235 236 237