Page 204 - 《社会》2017年第1期
P. 204
统计模型的“不确定性”问题与倾向值方法
米尼茨利用联合估计过程处理了模型形式不确定性问题。
相比于仅关注参数不确定性的研究,本文的突破点在于同时考虑
到参数的不确定性与模型的不确定性。在这一点上,本文的基本取向
是和卡普 兰、齐 格 勒 等 人 的 研 究 一 致 的。然 而,和 卡 普 兰 等 ( 犓犪 狆 犾犪狀
犪狀犱犆犺犲狀 , 2014 )的研究不同,我们没有对倾向值的后验分布进行加权
平均,而是针对每个可能的模型,分别利用联合似然函数做因果关系估
计,这样会更加直接展现基于模型差异所体现出的异质性。齐格勒和
多米尼茨的分析策略中的一个局限在于要求对 α 与因果效果的联合后
验概率分布进行估计。如果用 Δ 来指代因果关系的话,这个联合后验
概率分布就表示为 ( α , Δ| 经验数据)。不难看出,这一联合后验分布
狆
的估计是很困难的。为此,研究者不得不采用更为复杂的“马尔科夫
链 蒙特卡洛算法”( 犕犪狉犽狅狏犆犺犪犻狀犕狅狀狋犲犆犪狉犾狅 , 犕犆犕犆 )(例如,齐格勒
3
和多米尼茨所采用的 犕犆 以及 犛犛犞犛 算法)。本文绕开了复杂的算法
设计,首先采用“贝叶斯模型平均法”列举研究者所可能获得的候选模
型(模型的不确定性问题)。由于这种候选模型数量很多,我们仅列出
最优的五个模型。之后,基于每个备选模型,我们通过联合估计倾向值
模型与结果模型来估计因果关系(系数的不确定性问题)。换句话说,
我们没有直接估计 α 与 Δ 的联合后验分布 ( α , Δ| 经验数据),而是将
狆
(
其分解为:(, Δ| 经验数据) = 狆 Δ|α ,经验数据) ×狆 α| 经验数据),
(
狆α
继而分别考察 ( Δ|α ,经验数据)和 ( 经验数据)。
狆
狆α|
五、基于“蒙特卡洛模拟”的示例
在这一部分,笔者利用“蒙特卡洛模拟”( 犕狅狀狋犲犆犪狉犾狅犛犻犿狌犾犪狋犻狅狀 )
方法,具体展示了在进行倾向值分析的时候所存在的不同类型的模型
不确定性问题。需要说明的是,在联合估计过程中,我们很难通过常规
数学方法直接计算出估计值及其置信区间,因此,依照前人研究,笔者
采用了“马尔科夫链 蒙特卡洛算法”以迭代计算出因果效果的边际后
验分布( 犿犪狉 犵 犻狀犪犾 狆 狅狊狋犲狉犻狅狉犱犻狊狋狉犻犫狌狋犻狅狀 )。为了最大限度地模拟现实研
究环境中的变量类型,我们在设置模拟数据的时候建立了 18 个服从不
同分布类型的自变量,分别命名为 狓1 到 狓18 。其中 狓1 到 狓6 服从正态
分布, 狓7 到 狓12 服从“伯努利分布”, 狓13 到 狓18 服从“泊松分布”。其具
体的参数值如下:
· 1 9 7 ·