Page 201 - 《社会》2017年第1期
P. 201

社会· 2017 · 1

   “总结”成为一个数值,即倾向值。那么,又何必对这些混淆变量进行
   “挑选”呢?这一问题的答案在于,如果混淆变量过多,其彼此之间会产
   生虚假关联( 犉犪狀 , 犲狋犪犾. , 2014 ),此时,未经挑选的模型所估计出来的
   倾向值可能会有很高的均方误( 犿犲犪狀狊 狇 狌犪狉犲犲狉狉狅狉 ),从而带来倾向值
   估计上的问题。正因为如此,一般而言,对于存在大量混淆变量的情
   形,我们仍需要采用某种手段确定哪些混淆变量值得放进倾向值模型,
   这也是模型选择的题中之意。
       在考察了模型形式的不确定性之后,我们接下来讨论如何处理系
   数的不确定性。在倾向值方法中,系数不确定性涉及两个模型:预测倾
   向值得分的倾向值模型与计算处理效应的结果模型。这是因为在表达
   式( 2 )中,我们估计的 γ 和 β 都有各自的置信区间,因此,参数的不确定
   性需要将这两个系数的置信区间同时考虑在内。这一分析过程主要是
                                                             犼
   通过 对 倾 向 值 模 型 和 结 果 模 型 的 似 然 方 程 进 行 联 合 估 计 ( 狅犻狀狋
   犲狊狋犻犿犪狋犻狅狀 )实现的。顾名思义,联合估计要求我们同时估计 γ 和 β 。
   这就要求我们写出包含 γ 和 β 的似然方程,并将其合并起来。假设决
   定处理效应的过程与决定结果变量的过程独立,预测倾向值的逻辑斯
   蒂回归模型的似然方程就可以表示为:
                            (
                                               (
                ∏ i =1[  ex pγ U )  X i  1-  ex pγ U )  1 -X i  ( 6 )
                                                 ( ]
                              ( ]
                      1+ex pγ U ) [
                   n
          L X =                           1+ex pγ U )
   其中, 犡 是一个二分的处理变量,其他参数的含义参见上文。同理,我
   们也能够写出计算处理效应的结果模型的似然方程。如果 犢 是一个
   连续型变量,我们可以假设其服从正态分布。如果其为二分型变量,我
   们假设 犢 服从“伯努利分布”。此时,似然方程可以写成:
                            ( Y - β X ) 2
             烄    n   1   e -  i  2 i  ,如果 Y ~ N ( X , σ )
                                                    2
               ∏ i =1         2 σ             β
                      槡π
                    σ 2
                          (
                                              (
                     1+ex pγ U ) [
                                                ( ]
               ∏ i =1[      ( ]      1- 1+ex pγ U )
           L Y烅   n    ex pγ U )  Y i     ex pγ U )   1 -Y i ,  ( 7 )
                                       ( X )
               如果 Y ~ Bernoulli (  ex p β    )
                                        ( X )
             烆                   1+ex p β
      由于我们之前已经假设了两个似然方程彼此独立,因此,联合似然
   方程二者的乘积为:
                                                               ( 8 )
                            L= L X ×L Y
      联合估计之所以能够处理系数估计的不确定性,是因为在联合估
    · 1 9 4 ·
   196   197   198   199   200   201   202   203   204   205   206