Page 237 - 《社会》2014年第6期

P. 237

社会· ２０１４ · ６

犃狊狊狅犮犻犪狋犻狅狀，２０１１：２２）。尽管如此，在此后的心理学论文中，几乎没有
一篇论文只报告置信区间，而是以同时报告置信区间和狆值的方法以
满足手册的出版要求。于是，有研究者感慨“我们的结论是：迄今为止，
心理学内部无数提倡统计改革的文章的影响微乎其微”（犉犻犱犾犲狉犪狀犱
，
犆狌犿犿犻狀犵２００７）。
当然，对替代方法的提倡也不是完全没有效果。在前述的两本顶
尖生态学杂志中，犖犎犛犜的报告率已从２００１年的９２％下降到２００５年
，
的７８％（犉犻犱犾犲狉，犆狌犿犿犻狀犵犅狌狉犵犿犪狀犪狀犱犜犺狅犿犪狊狅狀，２００４）。更为明显
的改观出现在医学领域，从２０世纪８０年代起，就有不少知名期刊要求
投稿者使用置信区间法报告研究结果。例如，《美国公共健康杂志》
（犃犑犘犎）从１９８３年起就要求投稿者删除所有狆值，否则就请转投其他

杂志。《流行病学》（犈狆犻犱犲犿犻狅犾狅犵狔）在１９９０创刊之初也公开声明：“作
者在投稿本刊时，若忽略显著性检验，将有助于提高稿件被录用的可能
性……我们根本就不采用这一方法”（犚狅狋犺犿犪狀，１９９８）。由于有这样强势
的录用策略，该杂志在２０００年时，有９４％的文章报告了置信区间，而无
一报告狆值（犉犻犱犾犲狉，犲狋犪犾．，２００４）。
不过，总体而言，犖犎犛犜至今仍然是最广受使用的检验方法，以至
于直到最近，仍然有不同学科的学者不断抨击这种方法的不合理之处
（犔犪犿犫犱犻狀，２０１２；犣犺狌，２０１２）。尽管效应值和置信区间的计算已经完全
内置于各种统计软件，根本上不同质的贝叶斯检验也已经在专业教材
和统计软件上得到更多的介绍与植入，但这也未从根本上动摇犖犎犛犜
的垄断地位。这充分说明：一个分析工具或一种学科规范一旦制度化，
就很难主动退出学科发展的历史舞台。即使竞争性的、甚至更优秀的
方法已经普遍性地涌现，但旧方法的流行性仍很有可能战胜新方法的
优异性。犖犎犛犜于是也仍因其历史上的使用惯性，成为实证研究最为
普遍的假设检验方法。这实际上是应用中的实用性对数学上的审美性
的一种反击。在这个意义上，费雪认为只需要显著性检验、不需要犖犘
检验的提法虽未在统计学内部得到太多的赞同，却似在实践中得到了
较好的回应。
四、从工具到范式：假设检验的地位演变及其功能反思

回到本文开始提出的问题：为什么一个本身充满争议、招致纷争几

· ２３０ ·

232 233 234 235 236 237 238 239 240 241 242