Page 240 - 《社会》2015年第4期
P. 240
Lo g istic 模型的系数比较问题及解决策略:一个综述
的 犔狅 犵 犻狊狋犻犮 分布的概率分布方程
β
犳 β
第 犻 个观测的 犔狅 犵 犻狋 值, ( 狓 犻 )是 狓 犻
的“边际效应”时,需要把所有其他变量固定在某些取
( 犘犇犉 )。计算 狓 1
值上,一般选取均值( 犕狅狅犱 , 2010 : 75 )。
未观测到的异质性会低估变量效应(即系数绝对值减小,如式 7 所
示),但概率值则向 0.5 变化,导致 犘 ( =1 ) × [ 1-犘 ( =1 )]的值
狔 犻 狔 犻
向其最大值 0.25 变动,所以概率变动值可以部分抵消对系数的低估。
因此,研究者建议使用“平均偏效应”( 犃犘犈 )进行模型间、样本间的系数
比较,因为它几乎不受与自变量无关的未观测异质性影响( 犆狉犪犿犲狉 ,
取特定值或特定区
2007 )。 犃犘犈 的表达式如式 15犫 所示,计算的是 狓 1
间内,“边际效应”的平均数。譬如,我们可以取均值左右 0.01 个标准差
范围的个案来计算 犃犘犈 。因此, 犃犘犈 本质上是“边际效应”在样本中的
取 值的变化而 变
加权平均数,与“边际效应”一样, 犃犘犈 也会随 着 狓 1
化,从而体现分布的非线性特征。
犖 犖
1 1 ex p β )
( 狓 犻
(
犳 狓 )
∑ β 犻 β 1 = ∑ [ )] ( 15b )
2 β 1
( 狓 犻
犖 犻 =1 犖 犻 =1 1+ex p β
虽然卡尔森等( 犓犪狉犾狊狅狀 , 犲狋犪犾. , 2013 )认为 犃犘犈 的效果不如 犓犎犅
好,但 犃犘犈 的优势在于不仅适用于嵌套模型间的系数比较,也适用于
不同样本之间的系数比较,并且其解释是基于概率的,更易为读者理
解。 犛狋犪狋犪 软件中可用 犿犪狉 犵 犲犳犳 命令计算 犃犘犈 ,默认报告的是根据 狓 1
所有取值计算得到的 犃犘犈 值。 18
3. 线性概率模型( 犔犘犕 )
最后介绍的方法是线性概率模型( 犔犻狀犲犪狉犘狉狅犫犪犫犻犾犻狋 狔 犕狅犱犲犾 ,简称
犔犘犕 ),即运用线性回归来分析二分因变量。这一方法的争议颇多,因
为 犔狅 犵 犻狋 模型或 犘狉狅犫犻狋 模型的合法性就是部分地建立在批判 犔犘犕 之
上的。从回归角度引介 犔狅 犵 犻狊狋犻犮 模型时,往往会指出,如果因变量是二
分变量,不可以用线性回归进行估计,主要原因有三:首先,这违背了多
元回归的假设,尤其是不同自变量的误差具有相同方差这一假设,即方
差齐性( 犺狅犿狅狊犮犲犱犪狊狋犻犮犻狋 狔 );其次,预测值通常会超过符合逻辑的概率
范围( 0-1 ),即预测值取值范围的荒谬性;第三,模型设置错误,因为变
18. 也即克瑞默( 犆狉犪犿犲狉 , 2007 )所说的 犃犛犈 。犿犪狉 犵 犲犳犳 命令也可以计算在某些固定值(比如均
值)上的偏效应。
· 2 3 3 ·