Page 200 - 《社会》2017年第1期

P. 200

统计模型的“不确定性”问题与倾向值方法

（））
（
ｐＭｋ狘Ｘ）＝ｐＸ狘Ｍｋ π （Ｍｋ（４）
（）（）
ｐＸ狘Ｍｋ π Ｍｋ
∑ｋ
狆
很明显，在式（４）中，我们需要计算的是（犡｜犕犽）。这一统计量可
以从式（３）推导出来，即：
）
（
ｐＸ狘 γ ，Ｍｋ πγ狘Ｍｋｄ γ
ｐＸ狘Ｍｋ＝ ∫∫ （）（）（５）
在得到每个备选模型的后验概率之后，我们可以按照后验概率的
大小对这些备选模型进行排序。在实际操作中，备选模型的数量有很
狀
多。例如，如果混淆变量有狀个，那么我们会有２个备选模型。针对
这一问题，统计学家马迪根和拉夫特瑞（犕犪犱犻犵犪狀犪狀犱犚犪犳狋犲狉狔１９９４）提
，
出了“奥卡姆窗口”（犗犮犮犪犿 ’ 狊犠犻狀犱狅狑）原则进行备选模型数量的删减。
这一原则可以表述为：与最有可能出现的模型相比，后验概率要小很多
（例如小狀倍，其中狀由研究者确定）的模型被剔除；如果简化模型的后
验概率更大，则复杂模型被剔除。基于这两个原则，研究者实际需要考
察的备选模型数量会大大减少。例如，在拉夫特瑞（犚犪犳狋犲狉狔１９９５）的
，
一个研究中，按照“奥卡姆窗口”原则，备选模型数量从一开始的３２７６８
个降到了１４个。
综上所述，基于“贝叶斯模型平均法”，我们能够明确地展示研究者
的多个备选模型及其后验概率。换句话说，研究过程中的模型形式的
不确定性被直接量化出来了。研究者此时可以依据不同模型的后验概
率决定选择哪个模型。
需要说明的是，已有的“贝叶斯平均方法”的使用最后会将多个备
选模型的系数估计值综合起来得到一个最终的估计值 δ 。例如，假设
，那么，最后综合起来的系
每个备选模型都有一个我们关心的系数 δ 犕
犽
数就是不同备选模型的加权平均数，其中权重便是不同备选模型的后
（
狆
验概率（犕犽｜犡），亦即 δ＝∑狆犕犽｜犡） × δ 犕。在本研究中，我们不采
犽
用这种加权平均的综合，而是利用“贝叶斯模型平均法”的分析过程产
生最优的几个备选模型，然后针对每个备选模型进行分析。换句话说，
我们没有对备选模型进行“平均”。
另外一点需要说明的是，模型的不确定性问题本质上关心的是应
当纳入哪些变量来估计倾向值。对于这一问题，一个可能的质疑是，倾
向值估计本身就代表了一种降维操作。无论有多少混淆变量，最后都

· １９３ ·

195 196 197 198 199 200 201 202 203 204 205