Page 236 - 《社会》2014年第6期
P. 236

从工具到范式:假设检验争议的知识社会学反思


   犖犎犛犜 ( 犔犲犪犺犲 狔2005 )。这种业内顶尖期刊在论文发表上的榜样效应
                ,
   很容易为其他刊物模仿,进而演化为一种标准化的实证研究程序和方
   法论要求,即凡是统计推论,均须进行假设检验;而进行假设检验,就是
   应用 犖犎犛犜 。这种要求又通过实证研究的反复模仿与各学科内的统计
   教材反复示范,最终在整个学科领域全面制度化。
       在一个学科领域,顶尖杂志中有多数的定量分析都使用 犖犎犛犜 ,而
   且这种程序本身从统计学内部看还不是那么逻辑一致、完美无缺,这种
   现象不能不引发人们的思考与争议。于是,从 20 世纪 60 年代起,统计
   学家和各学科的统计应用者就已经不断地从各个角度批判 犖犎犛犜 的
   矛盾与不足,当然,其中也包括一些误解和误批。但是这些争议并没有
   终结 犖犎犛犜 的流行,学者们只是提出另外一些补充性的统计指标以弥
   补 犖犎犛犜 的不足。其中,主要是提出了应当报告检验的效应值( 犲犳犳犲犮狋
  狊犻狕犲 ),以及采用置信区间法来替代简单的是否显著的二分判断,或直
   接报告   狆  值大小的惯例。当然,由于不同学科所主要依赖的实证研究
   方式的不同,对于 犖犎犛犜 的依赖程度和批判程度也不尽相同。例如,
   随着样本量的不同,检验统计量的值与原假设中的假定值的同样差异
   就会形成小样本下不显著、大样本下极其显著的结果;实际上,只要样
   本量足够大,许多原本不显著的结果都可以变成显著的。而效应值可
   以独立于样本量,反映出自变量与因变量之间的关联程度,因此,可以
   提供 比   狆  值 更 准 确 的、不 因 样 本 量 大 小 而 异 的 信 息 ( 犆狅犺犲狀 , 1988 ;
   权朝鲁, 2003 ;吴艳、温忠麟, 2011 ;郑昊敏、温忠麟、吴艳, 2011 )。所以,
   医学、心理学之类学科较为依赖小样本对照组实验的学科,就特别看重
   对效应值的报告,对 犖犎犛犜 的批判也较早且较为强烈。而经济学、社
   会学和政治学之类的社会科学却因为主要针对大样本数据做分析,因
   此对样本量 问 题 并 不 过 分 敏 感,对 效 应 值 的 报 告 要 求 并 不 强 烈,对
   犖犎犛犜 的质疑也就相对较晚和温和。
       不管怎样, 犖犎犛犜 从未被彻底放弃,至今仍是统计教材讲解的重点
   和论文发表的门槛。替代性报告方法的出现,也未从根本上“替代”实
   证论文对     狆 值的“迷恋”和使用不同数量的“  ”表示不同显著性水平
   的学术惯习。例如,美国心理学会( 犃犘犃 )在 1994 年的出版手册中就开
   始建议报告效应值和检验功效, 2001 年的第 5 版出版手册则明确提
   出:“一般而言,最佳报告方式是置信区间法”( 犃犿犲狉犻犮犪狀犘狊 狔 犮犺狅犾狅 犵 犻犮犪犾

                                                          · 2 2 9 ·
   231   232   233   234   235   236   237   238   239   240   241