Page 232 - 《社会》2014年第6期
P. 232
从工具到范式:假设检验争议的知识社会学反思
三、 犖犎犛犜 的盛行:实用性对数学美的反击
首先 必 须 指 出, 犖犎犛犜 既 不 完 全 是 费 雪 式 的 显 著 性 检 验 (因 为
犖犎犛犜 使用备择假设),也不完全是奈曼 - 皮尔逊式 的假 设检验(因 为
犖犎犛犜 没有要求计算功效大小,也不完全要求使用拒绝域法,而可以采
用费雪的 狆 值法拒绝原假设),而是一种杂合体。这种杂合或许源自
于对实用性与数学美的折衷,即同时介绍两类错误的思想,但由于第二
类错误难以计算,故实际中又只控制第一类错误。尽管费雪言辞激烈
地声称:“我和我全世界的学生都从未想过要使用它( 犖犘 检验)。若要
我坦陈原因,那 就 是 他 们 的 处 理方 式完 全走入 歧途 ……”( 犅犲狀狀犲狋狋 ,
1990 : 144 ),但这些批评似乎并未被数理统计学界完全接受。更普遍性
看法则是 犖犘 理论确实深化了费雪的显著性检验思想,不论费雪本人
是否认可。例如,有教材这样介绍假设检验思想:“既然我们不可能同
时控制一个检验的犯第一类、第二类错误的概率,在此背景下,只能采
取折中方案。通常的作法是仅限制第一类错误的概率,这就是费雪的
显著性检验”(茆师松、程依明、濮晓龙, 2011 : 361 )。这代表了统计学内
的众数意见。应用统计类的书籍往往就此打住,只有专业的数理统计
教材才以不同的篇幅和深度讨论作为 犖犘 检验核心的一致最大功效、
一致最大功效无偏及似然比检验的思想。
显然,一般意义上的数理统计学家完全了解不同假设检验模式之
间的区别,虽然许 多 统 计 学 家(包 括奈 曼与皮 尔逊 本人)倾向于认 为
犖犘 检验是对显著性检验的更新和强化,但统计学内部对两者之间从
20 世纪 30 年代初起延续至 1962 年费雪去世期间的论战也并不陌生。
此外,在费雪与奈曼 - 皮尔逊进行旷日持久的论战的同时,完全不认同
频率化概率解释的贝叶斯学派也已经兴起,并提出其自己的一套假设
检验理论。这一理论在 20 世纪 70 年代之后日渐流行,并伴随着计算
机软件的兴起,这种需要大量数值和符号运算的检验方式慢慢获得了
研究者的青睐。从数理统计的教育模式看,对于 犖犎犛犜 ,虽然在入门阶
段都有介绍,但也不会停止于此,而会在高级教材或研究中详细说明其
他类型的检验模式。因此,至少在数理统计学内部,并不存在一个统一
的假设检验模式,而一直是多元化竞争的局面。尽管在多元化的声音
中, 犖犘 检验的声音在 20 世纪中期曾一度占据着较为主导的地位,但
· 2 2 5 ·