Page 232 - 《社会》2015年第4期
P. 232
Lo g istic 模型的系数比较问题及解决策略:一个综述
估计的就是 / σ= ;
中, σ=1 ,即真实的残差方差就是 3.29 ,那么 犫 1
β 1 β 1
2
,真实的残差方差就变成了 狏犪狉 ( ε ) + β 2 狏犪狉 ( 狏 ),这样 σ
但如果忽略了 狓 2
3.29+ β 2 var ( 狏 )/ 3.29 。
= 槡 2 槡
估计的就不是 ,
因此,如果我们从方程 4 中排除了 狓 2 ,那么 犫 1
β 1
而是如式 6 所示:
2
)[ 3.29 / 3.29+ β 2var ( 狏 )] ( 6 )
槡
β 1
犫 1 = ( + β 2 γ 1 槡
不相关,那么式 6 就等于:
如果 狓 1 和 狓 2
犫 1 = β 1 槡 槡 2 )] ( 7 )
[ 3.29 / 3.29+ β 2var ( 狓 2
在线性回归模型中,如果忽略了与模型中与其他自变量无关的变
量,就不会发生忽略变量偏误( 狅犿犻狋狋犲犱狏犪狉犻犪犫犾犲犫犻犪狊 ),即对估计不会产
生影响(谢宇, 2010 : 105 )。但由上述分析可知,在 犔狅 犵 犻狊狋犻犮 模型中,即使
添加的变量与其他自变量无关,对系数估计也会产生影响。根据式 7 可
知,这一问题会低估变量的效应(系数绝对值减小),而未被观测到的异
)]及其对 的效应大小( )。
质性大小取决于忽略变量的方差[ 狏犪狉 ( 狓 2 狔 β 2
由于我们的模型所能解释的因变量变异的比例通常都不高, 10 即
2
存在较多的忽略变量,所以, var ( 狏 )存在很大的增长空间,未被观测
β 2
到的异质性问题始终萦绕不散。由式 7 可知,如果未观测的异质性与
自变量无关,那么即使我们不知道未观测到异质性的大小,其影响方向
也是可知的,即低估已有自变量的效应,因为调整系数 σ> 1 。由于调
整系数在同一模型中是固定的,所以它不会影响自变量效应的方向,以
及同一模型中自变量效应之间的相对大小( 犠狅狅犾犱狉犻犱 犵 犲 , 2002 : 470 )。
因此,未被观 测 的 异 质 性问 题导 致 我 们 无 法 像 线 性 回 归 那 样 对
犔狅 犵 犻狊狋犻犮 嵌套模型之间的系数直接进行比较。同样,我们也无法直接
比较同一 犔狅 犵 犻狊狋犻犮 模型在不同群体中的效应,如比较同样一些因素对
升学的效应是否存在男女差异、族群差异和时期差异。直接简单比较
所隐含的假设是:不同的样本或同一样本的子群体之间具有相同的未
观测到异质性。这是一个较强的假定,但往往不符合实际。
毋庸置疑,模型之间和样本之间某变量效应的比较是社会学定量研
究关注的一个核心,不可能因为上述原因而放弃比较。一个便捷的替代
10. 在一般线性回归中,相对应的是 犚 往往并不高,表明模型并未包含所有解释因变量变异
2
的解释变量。
· 2 2 5 ·