Page 236 - 《社会》2014年第6期

P. 236

从工具到范式：假设检验争议的知识社会学反思

犖犎犛犜（犔犲犪犺犲狔２００５）。这种业内顶尖期刊在论文发表上的榜样效应
，
很容易为其他刊物模仿，进而演化为一种标准化的实证研究程序和方
法论要求，即凡是统计推论，均须进行假设检验；而进行假设检验，就是
应用犖犎犛犜。这种要求又通过实证研究的反复模仿与各学科内的统计
教材反复示范，最终在整个学科领域全面制度化。
在一个学科领域，顶尖杂志中有多数的定量分析都使用犖犎犛犜，而
且这种程序本身从统计学内部看还不是那么逻辑一致、完美无缺，这种
现象不能不引发人们的思考与争议。于是，从２０世纪６０年代起，统计
学家和各学科的统计应用者就已经不断地从各个角度批判犖犎犛犜的
矛盾与不足，当然，其中也包括一些误解和误批。但是这些争议并没有
终结犖犎犛犜的流行，学者们只是提出另外一些补充性的统计指标以弥
补犖犎犛犜的不足。其中，主要是提出了应当报告检验的效应值（犲犳犳犲犮狋
狊犻狕犲），以及采用置信区间法来替代简单的是否显著的二分判断，或直
接报告狆值大小的惯例。当然，由于不同学科所主要依赖的实证研究
方式的不同，对于犖犎犛犜的依赖程度和批判程度也不尽相同。例如，
随着样本量的不同，检验统计量的值与原假设中的假定值的同样差异
就会形成小样本下不显著、大样本下极其显著的结果；实际上，只要样
本量足够大，许多原本不显著的结果都可以变成显著的。而效应值可
以独立于样本量，反映出自变量与因变量之间的关联程度，因此，可以
提供比狆值更准确的、不因样本量大小而异的信息（犆狅犺犲狀，１９８８；
权朝鲁，２００３；吴艳、温忠麟，２０１１；郑昊敏、温忠麟、吴艳，２０１１）。所以，
医学、心理学之类学科较为依赖小样本对照组实验的学科，就特别看重
对效应值的报告，对犖犎犛犜的批判也较早且较为强烈。而经济学、社
会学和政治学之类的社会科学却因为主要针对大样本数据做分析，因
此对样本量问题并不过分敏感，对效应值的报告要求并不强烈，对
犖犎犛犜的质疑也就相对较晚和温和。
不管怎样，犖犎犛犜从未被彻底放弃，至今仍是统计教材讲解的重点
和论文发表的门槛。替代性报告方法的出现，也未从根本上“替代”实
证论文对狆值的“迷恋”和使用不同数量的“  ”表示不同显著性水平
的学术惯习。例如，美国心理学会（犃犘犃）在１９９４年的出版手册中就开
始建议报告效应值和检验功效，２００１年的第５版出版手册则明确提
出：“一般而言，最佳报告方式是置信区间法”（犃犿犲狉犻犮犪狀犘狊狔犮犺狅犾狅犵犻犮犪犾

· ２２９ ·

231 232 233 234 235 236 237 238 239 240 241