Page 237 - 《社会》2014年第6期
P. 237
社会· 2014 · 6
犃狊狊狅犮犻犪狋犻狅狀 , 2011 : 22 )。尽管如此,在此后的心理学论文中,几乎没有
一篇论文只报告置信区间,而是以同时报告置信区间和 狆 值的方法以
满足手册的出版要求。于是,有研究者感慨“我们的结论是:迄今为止,
心理学内 部 无 数 提 倡 统 计 改 革 的 文 章 的 影 响 微 乎 其 微”( 犉犻犱犾犲狉犪狀犱
,
犆狌犿犿犻狀 犵2007 )。
当然,对替代方法的提倡也不是完全没有效果。在前述的两本顶
尖生态学杂志中, 犖犎犛犜 的报告率已从 2001 年的 92% 下降到 2005 年
,
的 78% ( 犉犻犱犾犲狉 , 犆狌犿犿犻狀 犵 犅狌狉 犵 犿犪狀犪狀犱犜犺狅犿犪狊狅狀 , 2004 )。更为明显
的改观出现在医学领域,从 20 世纪 80 年代起,就有不少知名期刊要求
投稿者使用 置 信 区 间 法 报 告 研 究结 果。例 如,《美 国公 共健康 杂志》
( 犃犑犘犎 )从 1983 年起就要求投稿者删除所有 狆 值,否则就请转投其他
杂志。《流行病学》( 犈 狆 犻犱犲犿犻狅犾狅 犵狔 )在 1990 创刊之初也公开声明:“作
者在投稿本刊时,若忽略显著性检验,将有助于提高稿件被录用的可能
性……我们根本就不采用这一方法”( 犚狅狋犺犿犪狀 , 1998 )。由于有这样强势
的录用策略,该杂志在 2000 年时,有 94% 的文章报告了置信区间,而无
一报告 狆 值( 犉犻犱犾犲狉 , 犲狋犪犾. , 2004 )。
不过,总体而言, 犖犎犛犜 至今仍然是最广受使用的检验方法,以至
于直到最近,仍然有不同学科的学者不断抨击这种方法的不合理之处
( 犔犪犿犫犱犻狀 , 2012 ; 犣犺狌 , 2012 )。尽管效应值和置信区间的计算已经完全
内置于各种统计软件,根本上不同质的贝叶斯检验也已经在专业教材
和统计软件上得到更多的介绍与植入,但这也未从根本上动摇 犖犎犛犜
的垄断地位。这充分说明:一个分析工具或一种学科规范一旦制度化,
就很难主动退出学科发展的历史舞台。即使竞争性的、甚至更优秀的
方法已经普遍性地涌现,但旧方法的流行性仍很有可能战胜新方法的
优异性。 犖犎犛犜 于是也仍因其历史上的使用惯性,成为实证研究最为
普遍的假设检验方法。这实际上是应用中的实用性对数学上的审美性
的一种反击。在这个意义上,费雪认为只需要显著性检验、不需要 犖犘
检验的提法虽未在统计学内部得到太多的赞同,却似在实践中得到了
较好的回应。
四、从工具到范式:假设检验的地位演变及其功能反思
回到本文开始提出的问题:为什么一个本身充满争议、招致纷争几
· 2 3 0 ·