Page 200 - 《社会》2017年第1期
P. 200
统计模型的“不确定性”问题与倾向值方法
( ) )
(
p M k狘X ) = p X狘M k π ( M k ( 4 )
( )( )
p X狘M k π M k
∑k
狆
很明显,在式( 4 )中,我们需要计算的是 ( 犡 | 犕 犽 )。这一统计量可
以从式( 3 )推导出来,即:
)
(
p X狘 γ , M k πγ狘M k d γ
p X狘M k = ∫∫ ( )( ) ( 5 )
在得到每个备选模型的后验概率之后,我们可以按照后验概率的
大小对这些备选模型进行排序。在实际操作中,备选模型的数量有很
狀
多。例如,如果混淆变量有 狀 个,那么我们会有 2 个备选模型。针对
这一问题,统计学家马迪根和拉夫特瑞( 犕犪犱犻 犵 犪狀犪狀犱犚犪犳狋犲狉 狔1994 )提
,
出了“奥卡姆窗口”( 犗犮犮犪犿 ’ 狊犠犻狀犱狅狑 )原则进行备选模型数量的删减。
这一原则可以表述为:与最有可能出现的模型相比,后验概率要小很多
(例如小 狀 倍,其中 狀 由研究者确定)的模型被剔除;如果简化模型的后
验概率更大,则复杂模型被剔除。基于这两个原则,研究者实际需要考
察的备选模型数量会大大减少。例如,在拉夫特瑞( 犚犪犳狋犲狉 狔1995 )的
,
一个研究中,按照“奥卡姆窗口”原则,备选模型数量从一开始的 32768
个降到了 14 个。
综上所述,基于“贝叶斯模型平均法”,我们能够明确地展示研究者
的多个备选模型及其后验概率。换句话说,研究过程中的模型形式的
不确定性被直接量化出来了。研究者此时可以依据不同模型的后验概
率决定选择哪个模型。
需要说明的是,已有的“贝叶斯平均方法”的使用最后会将多个备
选模型的系数估计值综合起来得到一个最终的估计值 δ 。例如,假设
,那么,最后综合起来的系
每个备选模型都有一个我们关心的系数 δ 犕
犽
数就是不同备选模型的加权平均数,其中权重便是不同备选模型的后
(
狆
验概率 ( 犕 犽 | 犡 ),亦即 δ=∑狆 犕 犽 | 犡 ) × δ 犕 。在本研究中,我们不采
犽
用这种加权平均的综合,而是利用“贝叶斯模型平均法”的分析过程产
生最优的几个备选模型,然后针对每个备选模型进行分析。换句话说,
我们没有对备选模型进行“平均”。
另外一点需要说明的是,模型的不确定性问题本质上关心的是应
当纳入哪些变量来估计倾向值。对于这一问题,一个可能的质疑是,倾
向值估计本身就代表了一种降维操作。无论有多少混淆变量,最后都
· 1 9 3 ·