Page 234 - 《社会》2015年第4期
P. 234
Lo g istic 模型的系数比较问题及解决策略:一个综述
议,可以把不同模型的系数估计值都根据潜在因变量的方差进行重新
调整,那么系数在模型之间就可以比较了。具体而言,就是用系数除以
各自模型潜在因变量的估计标准差 犛犇 ( ),然后进行比较。
狔
犛犇 ( ) = 槡 var ( 狓′b ) +3.29 ( 9 )
var ( 狓′b ) +var ( ε ) = 槡
狔
,
如式 9 所示( 犓犪狉犾狊狅狀 , 犲狋犪犾. , 2013 : 298 ; 犔狅狀 犵1997 : 129 ),模型潜
在因变量的估计标准差 犛犇 ( )由两个部分组成:一是预测值的方差;
狔
二是残差的设 定 方 差( 3.29 )。由于第 二部 分是 固定的,所以模型 间
犛犇 ( )的差异就来自于第一部分。而第一部分预测值的方差又取决
狔
于模型所包含的自变量。如上文所述,当增加自变量时,预测值方差就
会增加,导致潜在因变量的方差也相应增加。因此,“ 标准化”就是
狔
通过用系数除以 狔 标准差,即 犫 / 犛犇 ( ),来减小预测值方差增加的
狔
影响,使系数表达出自变量变化一个单位,因变量变化多少个潜变量
)。 13 需要注意
狔 的标准差单位( 狊狋犪狀犱犪狉犱犱犲狏犻犪狋犻狅狀狌狀犻狋犮犺犪狀 犵 犲犻狀狔
的是,“ 标准化”方法仅适用于同一样本内不同模型之间的系数比较,
狔
因为我们不知道不同样本之间的未观测到异质性是否存在差异。在
犛狋犪狋犪 软件中,在执行 犔狅 犵 犻狋 模型命令之后运行“ 犾犻狊狋犮狅犲犳 , 狊狋犱犺犲犾 狆 ”命令,可
以直接输出 狔 标准化后的模型系数( 犔狅狀 犵 犪狀犱犉狉犲犲狊犲 , 2001 : 155 )。
2.犓犎犅 分解
卡尔森等( 犓犪狉犾狊狅狀 , 犲狋犪犾. , 2013 )提出了分解“混杂效应”和“标尺
回归后的残差
改变效应”的方法。 犓犎犅 方法的核心是得到 狓 2 对 狓 1
进入方程 4犪 ,得到方程
狓 2 。然后用珟 替代 狓 2
狓 2
珟 ,即方程 5 的误差项 狏 犻
10 。可以 证 明 在 方 程 3犪 、方 程 4犪 和 方 程 10 中, β 1犚 = β 1犉 和 σ 犉 =
14
σ 犉 。
珟 ( 10 )
狔 犻 =狓 1犻 β 1犉 +狓 2犻 β 2 + σ 犉 ε 犻
这两个 等 式 的 具 体 数 学 证 明 可参见 卡尔 森等( 犓犪狉犾狊狅狀 , 犲狋犪犾. ,
2013 : 292 )的研究,笔者在此仅进行简单阐释,帮助读者理解其基本逻
不相关,那
狓 2
辑。首先,由于珟 是 狓 2 对 狓 1 回归后的残差,所以珟 与 狓 1
狓 2
线性解释以外
么珟 不会影响的 狓 1 系数估计,因为珟 反映了 狓 2 被 狓 1
狓 2
狓 2
13. 标准化的另一原因在于潜在因变量本身没有量测单位,因而非标准化系数的大小没有意
义(唐启明, 2012 : 327 )。
14. 有关残差与偏回归估计的内容可参见谢宇( 2010 : 149-152 )的研究。
· 2 2 7 ·