Page 228 - 《社会》2014年第6期
P. 228
从工具到范式:假设检验争议的知识社会学反思
干竞争性的等价检验中,能够找到不论针对哪一个备择假设,其功效
( 1- β )都是最大的那个检验(假定这样的检验存在),这就是理想中的
假设检验模式:一致最大功效检验。这一假设在原假设和备择假设都
是简单假设的情况下容易证明是存在且唯一的,其拒绝域就是费雪的
显著性检验中采用的尾端区域。这就是著名的奈曼 - 皮尔逊引理。但
在其他更普遍的情况下,如单样本正态总体均值的双侧检验中,一致最
大功效检验往往并不存在。为此,奈曼 - 皮尔逊又提出了一致最大功效
无偏检验的思想,此方法的要点在于首先寻找一个无偏拒绝域(无偏的
直观意义是指当原假设为真时被拒绝的概率,应当不超过当其为假时
被拒绝的概率、即该检验的功效不得低于 α )。数学上能够证明这样的
检验总是能够存在的,当然这样的无偏拒绝域可能有多个,于是再在其
中寻找可 能 的 一 致 功 效 最 大 检 验,这 就 是 一 致 最 大 功 效 无 偏 检 验
( 犖犲 狔 犿犪狀犪狀犱犘犲犪狉狊狅狀 , 1933 )。虽然这种检验同样不一定存在,但其适
用范围已经比一致最大功效检验扩大了一层。
在这一系列的论证中,奈曼 - 皮尔逊的思考重心都在数学原理层
面,而不是应用层面;他们追求的是如何建立数学标准,使得“最优化”
的结果能够存在,并能通过一定的方式找到。这种论证方式其实非常
值得反思:“最优化”并不完全是客观发现的结果,而是提前引入了标准
后才“论证”出来的结果,即建构的结果;“最优化”也不必然是实用意义
上的最优化,而是数学理论意义上的最优化。当然,这种建构并不是完
全随意的,但确实是有限制条件的。
关于显著性检验与 犖犘 检验之间在数学形式的争议与技术上的
调和努力,已 有 一 些 文 献 进 行 了 相 关 探 讨 ( 犅犲狉 犵 犲狉 , 2003 ;吕 小 康,
2012 )。但在知识 社 会 学 的 视 野 中,更 值 得 注 意 的 问 题 是:从 费 雪 与
奈曼 - 皮尔逊的争议过程上看,这种数学形式上的差异并不是两者争议
的核心;造成费雪猛烈抨击奈曼 - 皮尔逊检验的根源,不是后者在数学
论证上的不严谨,而是这种形式上的严谨反而掩盖了假设检验的真正
功能———辅助科学家理解数据,而不是替代科学家理解数据。为此,有
必要了解费雪与奈曼 - 皮尔逊创立假设检验工具的真正动机。在统计
工具的建构过程中,统计学家的动机总是先于工具的形式和推导的过
程。不了解其动机,仅单纯地从数学形式上解释统计工具,将会把丰富
的、多面向的统计发展史压缩成一个简单的、单面向的数学符号演进
· 2 2 1 ·