Page 204 - 《社会》2017年第1期
P. 204

统计模型的“不确定性”问题与倾向值方法


   米尼茨利用联合估计过程处理了模型形式不确定性问题。
       相比于仅关注参数不确定性的研究,本文的突破点在于同时考虑
   到参数的不确定性与模型的不确定性。在这一点上,本文的基本取向
   是和卡普 兰、齐 格 勒 等 人 的 研 究 一 致 的。然 而,和 卡 普 兰 等 ( 犓犪 狆 犾犪狀
   犪狀犱犆犺犲狀 , 2014 )的研究不同,我们没有对倾向值的后验分布进行加权
   平均,而是针对每个可能的模型,分别利用联合似然函数做因果关系估
   计,这样会更加直接展现基于模型差异所体现出的异质性。齐格勒和
   多米尼茨的分析策略中的一个局限在于要求对 α 与因果效果的联合后
   验概率分布进行估计。如果用 Δ 来指代因果关系的话,这个联合后验
   概率分布就表示为 ( α , Δ| 经验数据)。不难看出,这一联合后验分布
                    狆
   的估计是很困难的。为此,研究者不得不采用更为复杂的“马尔科夫
   链  蒙特卡洛算法”( 犕犪狉犽狅狏犆犺犪犻狀犕狅狀狋犲犆犪狉犾狅 , 犕犆犕犆 )(例如,齐格勒
                         3
   和多米尼茨所采用的 犕犆 以及 犛犛犞犛 算法)。本文绕开了复杂的算法
   设计,首先采用“贝叶斯模型平均法”列举研究者所可能获得的候选模
   型(模型的不确定性问题)。由于这种候选模型数量很多,我们仅列出
   最优的五个模型。之后,基于每个备选模型,我们通过联合估计倾向值
   模型与结果模型来估计因果关系(系数的不确定性问题)。换句话说,
   我们没有直接估计 α 与 Δ 的联合后验分布 ( α , Δ| 经验数据),而是将
                                         狆
                                 (
   其分解为:(, Δ| 经验数据) = 狆 Δ|α ,经验数据) ×狆 α| 经验数据),
                                                    (
            狆α
   继而分别考察 ( Δ|α ,经验数据)和 ( 经验数据)。
                狆
                                  狆α|
       五、基于“蒙特卡洛模拟”的示例
       在这一部分,笔者利用“蒙特卡洛模拟”( 犕狅狀狋犲犆犪狉犾狅犛犻犿狌犾犪狋犻狅狀 )
   方法,具体展示了在进行倾向值分析的时候所存在的不同类型的模型
   不确定性问题。需要说明的是,在联合估计过程中,我们很难通过常规
   数学方法直接计算出估计值及其置信区间,因此,依照前人研究,笔者
   采用了“马尔科夫链  蒙特卡洛算法”以迭代计算出因果效果的边际后
   验分布( 犿犪狉 犵 犻狀犪犾 狆 狅狊狋犲狉犻狅狉犱犻狊狋狉犻犫狌狋犻狅狀 )。为了最大限度地模拟现实研
   究环境中的变量类型,我们在设置模拟数据的时候建立了 18 个服从不
   同分布类型的自变量,分别命名为 狓1 到 狓18 。其中 狓1 到 狓6 服从正态
   分布, 狓7 到 狓12 服从“伯努利分布”, 狓13 到 狓18 服从“泊松分布”。其具
   体的参数值如下:

                                                          · 1 9 7 ·
   199   200   201   202   203   204   205   206   207   208   209