Page 241 - 《社会》2015年第4期
P. 241

社会· 2015 · 4

   量间关系不是线性的(郭志刚, 1999 ;谢宇, 2010 : 332 )。
       针对方差 齐 性 问 题,可 以 采 用 加 权 最 小 二 乘 法 ( 犠犲犻 犵 犺狋犲犱犔犲犪狊狋
   犛 狇 狌犪狉犲狊 )或 异 方 差 稳 健 标 准 误 ( 犎犲狋犲狉狅狊犮犲犱犪狊狋犻犮犻狋 狔 狉狅犫狌狊狋犛狋犪狀犱犪狉犱
   犈狉狉狅狉狊 )来处理(鲍威斯、谢宇, 2009 : 34 ; 犕狅狅犱 , 2010 )。对于预测值超出
   [ 0 , 1 ]范围的取值荒谬性问题,谢宇( 2010 : 338 )认为是线性模型处理二
   分因变量存在 的 最 大 问 题,温 什 普 和 迈 耶 ( 犠犻狀狊犺犻 狆犪狀犱 犕犪狉犲 , 1984 :
   514 )也认为这是更青睐 犔狅 犵 犻狋 模型和 犘狉狅犫犻狋 模型的原因。但朗( 犔狅狀 犵              ,
   1997 )指出,在非二分因变量的线性回归中,预测值超出可能范围的情
   况并不鲜见,因此只要小于 0 和大于 1 的预测值数量不是太多,就不是
   一个太严重的问题。穆德( 犕狅狅犱 , 2010 )认为只有第三 个才是 最严 重
   的、目前难以解决的问题。 犔犘犕 模型与 犔狅 犵 犻狋 模型的最大区别在于,
   犔犘犕 模型假定连续自变量的“边际效应”( 犕犪狉 犵 犻狀犪犾犈犳犳犲犮狋 )为常数,而
   犔狅 犵 犻狋 模型意味着偏效应的大小是递减的(伍德里奇, 2003 : 520 )。如果
   非线性很重要,那么 犔犘犕 模型可能就会使读者对变量关系理解有误。
   但其优点在于系数比较更容易,系数理解更直观,因此研究者在实际分
   析中需要权衡利弊。
       穆德( 犕狅狅犱 , 2010 )建议,在需要进行嵌套模型间系数比较时,线性
   概率模型不失为一个值得考虑的选择。 19 如伍德里奇( 2003 : 519 )对已
   婚妇女的劳动力市场参与数据的分析分别运用了 犔犘犕 模型、 犔狅 犵 犻狋 模
   型和 犘狉狅犫犻狋 模型,结果发现三个模型的结论一致,即每个模型所得到
   的系数符号都 相 同,而 且 具有 统 计 显著 性的变 量也 相 同。卡 尔 森 等

   ( 犓犪狉犾狊狅狀 , 犲狋犪犾. , 2013 )的模拟数据分析也表明,与简单直接比较 犔狅 犵 犻狋
   系数相比, 犔犘犕 模型系数比较更接近真实的差异。

       四、实例:教育递进率模型

       在这一部分,笔者以教育递进率模型为例,考察不同方法对估计结
   果的影响。教育递进率模型由迈耶( 犕犪狉犲 , 1980 ; 1981 )首次提出,但该
   模型不仅存在内生选择性问题,其教育转折方程的残差也不同,因而存
   在“标尺效应”问题,导致不同转折点方程中的系数相互之间无法直接


   19. 在讨论序次因变量时,唐启明( 2012 : 332 )指出常规最小二乘法也是一种选择。在实际研
   究中,很多学者会用线性回归方法来分析序次因变量(胡安宁, 2014 ; 犠犪狀 犵犪狀犱犡犻犲 , 2014 )。

    · 2 3 4 ·
   236   237   238   239   240   241   242   243   244   245   246