Page 234 - 《社会》2015年第4期
P. 234

Lo g istic 模型的系数比较问题及解决策略:一个综述


   议,可以把不同模型的系数估计值都根据潜在因变量的方差进行重新
   调整,那么系数在模型之间就可以比较了。具体而言,就是用系数除以
   各自模型潜在因变量的估计标准差 犛犇 ( ),然后进行比较。
                                        
                                      狔
         犛犇 (  ) = 槡                       var ( 狓′b ) +3.29  ( 9 )
                      var ( 狓′b ) +var ( ε ) = 槡
             狔
                                                ,
      如式 9 所示( 犓犪狉犾狊狅狀 , 犲狋犪犾. , 2013 : 298 ; 犔狅狀 犵1997 : 129 ),模型潜
   在因变量的估计标准差 犛犇 ( )由两个部分组成:一是预测值的方差;
                             
                            狔
   二是残差的设 定 方 差( 3.29 )。由于第 二部 分是 固定的,所以模型 间
        
   犛犇 ( )的差异就来自于第一部分。而第一部分预测值的方差又取决
      狔
   于模型所包含的自变量。如上文所述,当增加自变量时,预测值方差就
   会增加,导致潜在因变量的方差也相应增加。因此,“  标准化”就是
                                                  狔
                                      
   通过用系数除以        狔   标准差,即 犫 / 犛犇 ( ),来减小预测值方差增加的
                                     狔
   影响,使系数表达出自变量变化一个单位,因变量变化多少个潜变量
                                                    )。 13 需要注意
   狔  的标准差单位( 狊狋犪狀犱犪狉犱犱犲狏犻犪狋犻狅狀狌狀犻狋犮犺犪狀 犵 犲犻狀狔
   的是,“ 标准化”方法仅适用于同一样本内不同模型之间的系数比较,
          
         狔
   因为我们不知道不同样本之间的未观测到异质性是否存在差异。在
   犛狋犪狋犪 软件中,在执行 犔狅 犵 犻狋 模型命令之后运行“ 犾犻狊狋犮狅犲犳 , 狊狋犱犺犲犾 狆    ”命令,可
   以直接输出     狔   标准化后的模型系数( 犔狅狀 犵 犪狀犱犉狉犲犲狊犲 , 2001 : 155 )。
       2.犓犎犅 分解
       卡尔森等( 犓犪狉犾狊狅狀 , 犲狋犪犾. , 2013 )提出了分解“混杂效应”和“标尺
                                                     回归后的残差
   改变效应”的方法。 犓犎犅 方法的核心是得到 狓 2                  对 狓 1
                                             进入方程 4犪 ,得到方程
  狓 2                     。然后用珟 替代 狓 2
                                   狓 2
   珟 ,即方程 5 的误差项 狏 犻
   10 。可以 证 明 在 方 程 3犪 、方 程 4犪 和 方 程 10 中,      β 1犚 = β 1犉  和 σ 犉 =
                                                        
     14
  σ 犉  。
                                 珟                        ( 10 )
                      狔 犻 =狓 1犻 β 1犉 +狓 2犻 β 2 + σ 犉 ε 犻
      这两个 等 式 的 具 体 数 学 证 明 可参见 卡尔 森等( 犓犪狉犾狊狅狀 , 犲狋犪犾. ,
   2013 : 292 )的研究,笔者在此仅进行简单阐释,帮助读者理解其基本逻
                                                        不相关,那
                 狓 2
   辑。首先,由于珟 是 狓 2        对 狓 1  回归后的残差,所以珟 与 狓 1
                                                狓 2
                                                     线性解释以外
   么珟 不会影响的 狓 1       系数估计,因为珟 反映了 狓 2          被 狓 1
     狓 2
                                   狓 2
   13. 标准化的另一原因在于潜在因变量本身没有量测单位,因而非标准化系数的大小没有意
   义(唐启明, 2012 : 327 )。
   14. 有关残差与偏回归估计的内容可参见谢宇( 2010 : 149-152 )的研究。
                                                          · 2 2 7 ·
   229   230   231   232   233   234   235   236   237   238   239