Page 236 - 《社会》2014年第6期
P. 236
从工具到范式:假设检验争议的知识社会学反思
犖犎犛犜 ( 犔犲犪犺犲 狔2005 )。这种业内顶尖期刊在论文发表上的榜样效应
,
很容易为其他刊物模仿,进而演化为一种标准化的实证研究程序和方
法论要求,即凡是统计推论,均须进行假设检验;而进行假设检验,就是
应用 犖犎犛犜 。这种要求又通过实证研究的反复模仿与各学科内的统计
教材反复示范,最终在整个学科领域全面制度化。
在一个学科领域,顶尖杂志中有多数的定量分析都使用 犖犎犛犜 ,而
且这种程序本身从统计学内部看还不是那么逻辑一致、完美无缺,这种
现象不能不引发人们的思考与争议。于是,从 20 世纪 60 年代起,统计
学家和各学科的统计应用者就已经不断地从各个角度批判 犖犎犛犜 的
矛盾与不足,当然,其中也包括一些误解和误批。但是这些争议并没有
终结 犖犎犛犜 的流行,学者们只是提出另外一些补充性的统计指标以弥
补 犖犎犛犜 的不足。其中,主要是提出了应当报告检验的效应值( 犲犳犳犲犮狋
狊犻狕犲 ),以及采用置信区间法来替代简单的是否显著的二分判断,或直
接报告 狆 值大小的惯例。当然,由于不同学科所主要依赖的实证研究
方式的不同,对于 犖犎犛犜 的依赖程度和批判程度也不尽相同。例如,
随着样本量的不同,检验统计量的值与原假设中的假定值的同样差异
就会形成小样本下不显著、大样本下极其显著的结果;实际上,只要样
本量足够大,许多原本不显著的结果都可以变成显著的。而效应值可
以独立于样本量,反映出自变量与因变量之间的关联程度,因此,可以
提供 比 狆 值 更 准 确 的、不 因 样 本 量 大 小 而 异 的 信 息 ( 犆狅犺犲狀 , 1988 ;
权朝鲁, 2003 ;吴艳、温忠麟, 2011 ;郑昊敏、温忠麟、吴艳, 2011 )。所以,
医学、心理学之类学科较为依赖小样本对照组实验的学科,就特别看重
对效应值的报告,对 犖犎犛犜 的批判也较早且较为强烈。而经济学、社
会学和政治学之类的社会科学却因为主要针对大样本数据做分析,因
此对样本量 问 题 并 不 过 分 敏 感,对 效 应 值 的 报 告 要 求 并 不 强 烈,对
犖犎犛犜 的质疑也就相对较晚和温和。
不管怎样, 犖犎犛犜 从未被彻底放弃,至今仍是统计教材讲解的重点
和论文发表的门槛。替代性报告方法的出现,也未从根本上“替代”实
证论文对 狆 值的“迷恋”和使用不同数量的“ ”表示不同显著性水平
的学术惯习。例如,美国心理学会( 犃犘犃 )在 1994 年的出版手册中就开
始建议报告效应值和检验功效, 2001 年的第 5 版出版手册则明确提
出:“一般而言,最佳报告方式是置信区间法”( 犃犿犲狉犻犮犪狀犘狊 狔 犮犺狅犾狅 犵 犻犮犪犾
· 2 2 9 ·