Page 225 - 《社会》2014年第6期
P. 225
社会· 2014 · 6
就国内外社会科学领域的多数研究看,假设检验的实现方式主要
是原假设显著性检验( 犖狌犾犾犎 狔狆 狅狋犺犲狊犻狊犛犻 犵 狀犻犳犻犮犪狀犮犲犜犲狊狋犻狀 犵 ,简称 犖犎犛犜 )
模式,贝叶斯检验在实际应用中还未完全普及。在 犖犎犛犜 模式下,建
立原假设和备择假设,选择检验统计量并计算其值,根据 狆 值是否小
于显著性水平,或临界值是否落入拒绝域,从而做出是否拒绝原假设的
统计判断,最后再将这种统计判断转化为现实情境下的行为判断(如实
验处理、政策干预是否确实有效),成为假设检验的标准流程。由此产
生的成果的发表偏向就体现为:统计上不显著的研究成果很难被发表,
绝大多数发表的成果都是统计上显著的,而且显著性越高(即 狆 值越
低或检验统计量的值越偏离预设的临界值)就越能证明研究的假设。
按一般的逻辑,作为判定标准的过程或程序,应当具备内在的一致
性和完备性,即判定标准自身应当逻辑一致,没有明显的矛盾和争议,
才能作为标准去检验研究结果。然而, 犖犎犛犜 似乎并不满足这一要求。
从现代假设检验的知识起源和演变过程看,不论此类统计工具的最早
开发者还是后来的改进者,不论是数理统计学内部还是统计工具的外
部应用领域,都从未停止对假设检验的方法适当性和应用局限性的争
议和反思。从数理统计学内部看,费雪( 犚狅狀犪犾犱犉犻狊犺犲狉 )首先提出的显
著性检验,加上奈曼( 犑犲狉狕 狔犖犲 狔 犿犪狀 )和皮尔逊( 犈 犵 狅狀犘犲犪狉狊狅狀 )提出的
假设检验模式,早就被称为“统计频率学派之间的最大裂隙”( 犛犪狏犪 犵 犲 ,
1961 );而贝叶斯学派由于在“什么是概率”这一最根本的命题上存在不
同理解,其假设检验采用了截然不同于频率学派的构建方式与计算程
序。从数理统计学的外部,即各统计应用领域看,作为现在诸多教材和
研究中采用的 犖犎犛犜 模式,虽然在 20 世纪 40 年代至 50 年代就已经在
生物学、医学、心理学和社会学等学科领域成型并逐渐制度化,但对它
的批判也从未停止过。这种批评在 20 世纪 60 年代末达到高峰, 20 世
纪 90 年代起至今又再度兴起批判的浪潮( 犅犪犽犪狀 , 1966 ; 犕狅狉狉犻狊狅狀犪狀犱
犎犲狀犽犲犾 , 1970 ; 犆狅犺犲狀 , 1994 ; 犌犻 犵 犲狉犲狀狕犲狉 , 2004 ; 犣犻犾犻犪犽犪狀犱 犕犮犆犾狅狊犽犲 狔 ,
,
2008 ; 犗狉犾犻狋狕犽 狔2012 ; 犖狌狕狕狅 , 2014 ;袁卫, 1990 ;童光荣、卢铁庄, 2010 )。
但毫无疑问的是,内外夹击下的 犖犎犛犜 不仅没有消失,反而依然在社
会科学的统计知识传授和实践应用中占据着主导地位,成为一种“驳而
不倒”的假设检验模式。
如此,一个基本的学科史事实是:在理论形态上,统计学内部发展
· 2 1 8 ·