Page 238 - 《社会》2015年第4期
P. 238
Lo g istic 模型的系数比较问题及解决策略:一个综述
的一个简便识别方法:如果一个群体的模型系数系统性和成比例的高
于或低于另一个群体的系数,那就很可能就存在残差变异干扰。一般
来说,当模型中加入较多的控制变量后,不同群体之间系数不可比较问
题的严 重 性 就 会 降 低,因 为 未 被 观 测 到 的 异 质 性 减 小 了 ( 犃犾犾犻狊狅狀 ,
1999 )。
1. 异质选择模型( 犺犲狋犲狉狅 犵 犲狀犲狅狌狊犮犺狅犻犮犲犿狅犱犲犾 )
威廉姆斯( 犠犻犾犾犻犪犿狊 , 2009 )提出可以用异质选择模型来解决群体
间 犔狅 犵 犻狋 系数的比较问题,并认为埃里森( 犃犾犾犻狊狅狀 , 1999 )的模型和豪斯
等( 犎犪狌狊犲狉犪狀犱犃狀犱狉犲狑 , 2006 )的 犔狅 犵 犻狊狋犻犮 响应模型都是异质选择模型
的子类型。异质选择模型也称位置标尺 模型( 犾狅犮犪狋犻狅狀狊犮犪犾犲犿狅犱犲犾 )。
该模型不 仅 可 以 处 理 残 差 方 差 变 异,还 能 处 理 其 他 来 源 的 异 方 差
( 犺犲狋犲狉狅狊犮犲犱犪狊狋犻犮犻 狔 )问题。
异质选择模型同时拟合两个方程,一个是选择方程(或位置方程),
即传统的 犔狅 犵 犻狋 模型估计;另一个是残差方差方程(或标尺方程),纳入
那些会影响异方差性的变量,反映了潜在因变量在不同组别中是如何
以不同标尺来测量的。异质选择模型的因变量可以是二分变量,也可
以是定序变量。在因变量是二分变量的情况下,模型表达式如式 14 所
示(这里使用的是转换的方式):
狓 犻 β
狓 犻 β
ex p狕 犻 γ ] [
Pr ( =1 ) =犵 [ 狓 犻 β =犵 ex pln ( σ 犻 ] =犵 ( ) ( 14 )
狔 犻
( )
))
(
σ 犻
其中, 代 表 联 结 方 程 (本 文 中 以 犔狅 犵 犻狋 为 例,但 也 可 以 是 犘狉狅犫犻狋 、
犵
、
犆狅犿 狆 犾犲犿犲狀狋犪狉 狔 犾狅 犵 犾狅 犵 犔狅 犵 犾狅 犵 和 犆犪狌犮犺犻狋 )。 狓 是第 犻 个观测的一组
值,所有的 狓 是决定选择结果的解释变量。 狕 也是第 犻 个观测的一组
值,所有的 狕 决定了群体之间在潜在因变量上的残差变异。 狕 不仅可
以包括性别、族群等分类变量,也可以包括与残差方差相关的连续变
量。需要注意的是, 狕 和狓 并不一定要包含相同的变量。 17 和 γ 是系
β
数矩阵,它们分别表示 狓 如何影响选择结果、 狕 如何影响方差(更准确
地说是调整系数 σ 的自然对数)。在式 14 中,分子被称为选择方程,分
母被称为方差方程。简单来说,异质选择模型就是在控制残差变异情
17. 一 般 来 说,在 实 际 研 究 中, 狕 所 包 含 的 变 量 相 对 较 少。 犛狋犪狋犪 软 件 中 狅 犵 犾犿 命 令 适 用
狊狋犲 狆 狑犻狊犲 筛选功能,即只把那些显著影响残差变异的变量保留在方差方程中。
· 2 3 1 ·