Page 237 - 《社会》2014年第6期
P. 237

社会· 2014 · 6

   犃狊狊狅犮犻犪狋犻狅狀 , 2011 : 22 )。尽管如此,在此后的心理学论文中,几乎没有
   一篇论文只报告置信区间,而是以同时报告置信区间和                          狆  值的方法以
   满足手册的出版要求。于是,有研究者感慨“我们的结论是:迄今为止,
   心理学内 部 无 数 提 倡 统 计 改 革 的 文 章 的 影 响 微 乎 其 微”( 犉犻犱犾犲狉犪狀犱
           ,
   犆狌犿犿犻狀 犵2007 )。
       当然,对替代方法的提倡也不是完全没有效果。在前述的两本顶
   尖生态学杂志中, 犖犎犛犜 的报告率已从 2001 年的 92% 下降到 2005 年
                          ,
   的 78% ( 犉犻犱犾犲狉 , 犆狌犿犿犻狀 犵 犅狌狉 犵 犿犪狀犪狀犱犜犺狅犿犪狊狅狀 , 2004 )。更为明显
   的改观出现在医学领域,从 20 世纪 80 年代起,就有不少知名期刊要求
   投稿者使用 置 信 区 间 法 报 告 研 究结 果。例 如,《美 国公 共健康 杂志》
   ( 犃犑犘犎 )从 1983 年起就要求投稿者删除所有             狆  值,否则就请转投其他

   杂志。《流行病学》( 犈 狆 犻犱犲犿犻狅犾狅 犵狔     )在 1990 创刊之初也公开声明:“作
   者在投稿本刊时,若忽略显著性检验,将有助于提高稿件被录用的可能
   性……我们根本就不采用这一方法”( 犚狅狋犺犿犪狀 , 1998 )。由于有这样强势
   的录用策略,该杂志在 2000 年时,有 94% 的文章报告了置信区间,而无
   一报告   狆  值( 犉犻犱犾犲狉 , 犲狋犪犾. , 2004 )。
       不过,总体而言, 犖犎犛犜 至今仍然是最广受使用的检验方法,以至
   于直到最近,仍然有不同学科的学者不断抨击这种方法的不合理之处
   ( 犔犪犿犫犱犻狀 , 2012 ; 犣犺狌 , 2012 )。尽管效应值和置信区间的计算已经完全
   内置于各种统计软件,根本上不同质的贝叶斯检验也已经在专业教材
   和统计软件上得到更多的介绍与植入,但这也未从根本上动摇 犖犎犛犜
   的垄断地位。这充分说明:一个分析工具或一种学科规范一旦制度化,
   就很难主动退出学科发展的历史舞台。即使竞争性的、甚至更优秀的
   方法已经普遍性地涌现,但旧方法的流行性仍很有可能战胜新方法的
   优异性。 犖犎犛犜 于是也仍因其历史上的使用惯性,成为实证研究最为
   普遍的假设检验方法。这实际上是应用中的实用性对数学上的审美性
   的一种反击。在这个意义上,费雪认为只需要显著性检验、不需要 犖犘
   检验的提法虽未在统计学内部得到太多的赞同,却似在实践中得到了
   较好的回应。
       四、从工具到范式:假设检验的地位演变及其功能反思


       回到本文开始提出的问题:为什么一个本身充满争议、招致纷争几

    · 2 3 0 ·
   232   233   234   235   236   237   238   239   240   241   242