Page 238 - 《社会》2015年第4期
P. 238

Lo g istic 模型的系数比较问题及解决策略:一个综述


   的一个简便识别方法:如果一个群体的模型系数系统性和成比例的高
   于或低于另一个群体的系数,那就很可能就存在残差变异干扰。一般
   来说,当模型中加入较多的控制变量后,不同群体之间系数不可比较问
   题的严 重 性 就 会 降 低,因 为 未 被 观 测 到 的 异 质 性 减 小 了 ( 犃犾犾犻狊狅狀 ,
   1999 )。
       1. 异质选择模型( 犺犲狋犲狉狅 犵 犲狀犲狅狌狊犮犺狅犻犮犲犿狅犱犲犾 )
       威廉姆斯( 犠犻犾犾犻犪犿狊 , 2009 )提出可以用异质选择模型来解决群体
   间 犔狅 犵 犻狋 系数的比较问题,并认为埃里森( 犃犾犾犻狊狅狀 , 1999 )的模型和豪斯
   等( 犎犪狌狊犲狉犪狀犱犃狀犱狉犲狑 , 2006 )的 犔狅 犵 犻狊狋犻犮 响应模型都是异质选择模型
   的子类型。异质选择模型也称位置标尺 模型( 犾狅犮犪狋犻狅狀狊犮犪犾犲犿狅犱犲犾 )。
   该模型不 仅 可 以 处 理 残 差 方 差 变 异,还 能 处 理 其 他 来 源 的 异 方 差
   ( 犺犲狋犲狉狅狊犮犲犱犪狊狋犻犮犻 狔 )问题。
       异质选择模型同时拟合两个方程,一个是选择方程(或位置方程),
   即传统的 犔狅 犵 犻狋 模型估计;另一个是残差方差方程(或标尺方程),纳入
   那些会影响异方差性的变量,反映了潜在因变量在不同组别中是如何
   以不同标尺来测量的。异质选择模型的因变量可以是二分变量,也可
   以是定序变量。在因变量是二分变量的情况下,模型表达式如式 14 所
   示(这里使用的是转换的方式):
                                           狓 犻 β
                                                        狓 犻 β
                        ex p狕 犻 γ ] [
         Pr ( =1 ) =犵   [  狓 犻 β  =犵   ex pln ( σ 犻 ] =犵 (  ) ( 14 )
            狔 犻
                            ( )
                                                ))
                                          (
                                                        σ 犻
   其中, 代 表 联 结 方 程 (本 文 中 以 犔狅 犵 犻狋 为 例,但 也 可 以 是 犘狉狅犫犻狋 、
        犵
                        、
   犆狅犿 狆 犾犲犿犲狀狋犪狉 狔 犾狅 犵 犾狅 犵 犔狅 犵 犾狅 犵 和 犆犪狌犮犺犻狋 )。 狓 是第 犻 个观测的一组
   值,所有的 狓 是决定选择结果的解释变量。 狕 也是第 犻 个观测的一组
   值,所有的 狕 决定了群体之间在潜在因变量上的残差变异。 狕 不仅可
   以包括性别、族群等分类变量,也可以包括与残差方差相关的连续变
   量。需要注意的是, 狕 和狓 并不一定要包含相同的变量。 17 和 γ 是系
                                                       β
   数矩阵,它们分别表示 狓 如何影响选择结果、 狕 如何影响方差(更准确
   地说是调整系数 σ 的自然对数)。在式 14 中,分子被称为选择方程,分
   母被称为方差方程。简单来说,异质选择模型就是在控制残差变异情

   17. 一 般 来 说,在 实 际 研 究 中, 狕 所 包 含 的 变 量 相 对 较 少。 犛狋犪狋犪 软 件 中 狅 犵 犾犿 命 令 适 用
   狊狋犲 狆 狑犻狊犲 筛选功能,即只把那些显著影响残差变异的变量保留在方差方程中。

                                                          · 2 3 1 ·
   233   234   235   236   237   238   239   240   241   242   243