Page 200 - 《社会》2017年第1期
P. 200

统计模型的“不确定性”问题与倾向值方法


                                  (       )    )
                   (
                  p M k狘X ) =    p X狘M k π ( M k               ( 4 )
                                    (       )( )
                                   p X狘M k π M k
                               ∑k
                                          狆
      很明显,在式( 4 )中,我们需要计算的是 ( 犡 | 犕 犽             )。这一统计量可
   以从式( 3 )推导出来,即:
                        )
                (
                              p X狘 γ , M k πγ狘M k d γ
               p X狘M k =  ∫∫   (         )(       )            ( 5 )
      在得到每个备选模型的后验概率之后,我们可以按照后验概率的
   大小对这些备选模型进行排序。在实际操作中,备选模型的数量有很
                                               狀
   多。例如,如果混淆变量有 狀 个,那么我们会有 2 个备选模型。针对
   这一问题,统计学家马迪根和拉夫特瑞( 犕犪犱犻 犵 犪狀犪狀犱犚犪犳狋犲狉 狔1994 )提
                                                         ,
   出了“奥卡姆窗口”( 犗犮犮犪犿 ’ 狊犠犻狀犱狅狑 )原则进行备选模型数量的删减。
   这一原则可以表述为:与最有可能出现的模型相比,后验概率要小很多
   (例如小 狀 倍,其中 狀 由研究者确定)的模型被剔除;如果简化模型的后
   验概率更大,则复杂模型被剔除。基于这两个原则,研究者实际需要考
   察的备选模型数量会大大减少。例如,在拉夫特瑞( 犚犪犳狋犲狉 狔1995 )的
                                                         ,
   一个研究中,按照“奥卡姆窗口”原则,备选模型数量从一开始的 32768
   个降到了 14 个。
       综上所述,基于“贝叶斯模型平均法”,我们能够明确地展示研究者
   的多个备选模型及其后验概率。换句话说,研究过程中的模型形式的
   不确定性被直接量化出来了。研究者此时可以依据不同模型的后验概
   率决定选择哪个模型。
       需要说明的是,已有的“贝叶斯平均方法”的使用最后会将多个备
   选模型的系数估计值综合起来得到一个最终的估计值 δ 。例如,假设
                                          ,那么,最后综合起来的系
   每个备选模型都有一个我们关心的系数 δ 犕
                                         犽
   数就是不同备选模型的加权平均数,其中权重便是不同备选模型的后
                               (
         狆
   验概率 ( 犕 犽 | 犡 ),亦即 δ=∑狆 犕 犽 | 犡 ) × δ 犕  。在本研究中,我们不采
                                          犽
   用这种加权平均的综合,而是利用“贝叶斯模型平均法”的分析过程产
   生最优的几个备选模型,然后针对每个备选模型进行分析。换句话说,
   我们没有对备选模型进行“平均”。
       另外一点需要说明的是,模型的不确定性问题本质上关心的是应
   当纳入哪些变量来估计倾向值。对于这一问题,一个可能的质疑是,倾
   向值估计本身就代表了一种降维操作。无论有多少混淆变量,最后都

                                                          · 1 9 3 ·
   195   196   197   198   199   200   201   202   203   204   205