Page 204 - 《社会》2017年第1期

P. 204

统计模型的“不确定性”问题与倾向值方法

米尼茨利用联合估计过程处理了模型形式不确定性问题。
相比于仅关注参数不确定性的研究，本文的突破点在于同时考虑
到参数的不确定性与模型的不确定性。在这一点上，本文的基本取向
是和卡普兰、齐格勒等人的研究一致的。然而，和卡普兰等（犓犪狆犾犪狀
犪狀犱犆犺犲狀，２０１４）的研究不同，我们没有对倾向值的后验分布进行加权
平均，而是针对每个可能的模型，分别利用联合似然函数做因果关系估
计，这样会更加直接展现基于模型差异所体现出的异质性。齐格勒和
多米尼茨的分析策略中的一个局限在于要求对 α 与因果效果的联合后
验概率分布进行估计。如果用 Δ 来指代因果关系的话，这个联合后验
概率分布就表示为（ α ， Δ｜经验数据）。不难看出，这一联合后验分布
狆
的估计是很困难的。为此，研究者不得不采用更为复杂的“马尔科夫
链  蒙特卡洛算法”（犕犪狉犽狅狏犆犺犪犻狀犕狅狀狋犲犆犪狉犾狅，犕犆犕犆）（例如，齐格勒
３
和多米尼茨所采用的犕犆以及犛犛犞犛算法）。本文绕开了复杂的算法
设计，首先采用“贝叶斯模型平均法”列举研究者所可能获得的候选模
型（模型的不确定性问题）。由于这种候选模型数量很多，我们仅列出
最优的五个模型。之后，基于每个备选模型，我们通过联合估计倾向值
模型与结果模型来估计因果关系（系数的不确定性问题）。换句话说，
我们没有直接估计 α 与 Δ 的联合后验分布（ α ， Δ｜经验数据），而是将
狆
（
其分解为：（， Δ｜经验数据）＝狆 Δ｜α ，经验数据） ×狆 α｜经验数据），
（
狆α
继而分别考察（ Δ｜α ，经验数据）和（经验数据）。
狆
狆α｜
五、基于“蒙特卡洛模拟”的示例
在这一部分，笔者利用“蒙特卡洛模拟”（犕狅狀狋犲犆犪狉犾狅犛犻犿狌犾犪狋犻狅狀）
方法，具体展示了在进行倾向值分析的时候所存在的不同类型的模型
不确定性问题。需要说明的是，在联合估计过程中，我们很难通过常规
数学方法直接计算出估计值及其置信区间，因此，依照前人研究，笔者
采用了“马尔科夫链  蒙特卡洛算法”以迭代计算出因果效果的边际后
验分布（犿犪狉犵犻狀犪犾狆狅狊狋犲狉犻狅狉犱犻狊狋狉犻犫狌狋犻狅狀）。为了最大限度地模拟现实研
究环境中的变量类型，我们在设置模拟数据的时候建立了１８个服从不
同分布类型的自变量，分别命名为狓１到狓１８。其中狓１到狓６服从正态
分布，狓７到狓１２服从“伯努利分布”，狓１３到狓１８服从“泊松分布”。其具
体的参数值如下：

· １９７ ·

199 200 201 202 203 204 205 206 207 208 209