Page 175 - 《社会》2015年第4期
P. 175
社会· 2015 · 4
型中由于缺失变量、度量误差所产生的内生估计偏差。本文将从两个
方面来解决这一问题,进而识别文化差异与移民规模之间的因果关系。
首先,为剔除缺失变量对估计结果产生的偏差,本文采用工具变量
法。一个有效的工具变量应该同内生变量具有较强的相关关系,但对
被解释变量没有直接的影响。对本研究而言,有效的工具变量应与文
化差异有较强的相关关系,但对移民率没有直接影响。因此,地区间滞
后一期的战争频率差异可作为工具变量识别缺失变量所产生的估计偏
差。其逻辑是:滞后一期的地区间战争频率差异对当前的移民率没有
直接影响,但对滞后一期的文化差异产生影响。如果这个假说成立,那
么滞后一期的地区间战争频率差异将外生于当期的移民率。两阶段回
归方程设定如下:
^
犡 ( 2 )
ln犿犻 犵 犻 犼 狋 =α ln犮狌犾狋 犻 犼 狋 - 1 + β 犻 犼 狋 + ε 犻 犼 狋
犡 ( 3 )
ln犮狌犾狋 犻 犼 狋 - 1 =γ ln狑犪狉 犳 狉犲 狇 犻 犼 狋 - 1 + φ 犻 犼 狋 + σ 犻 犼 狋 - 1
这里,方程( 2 )同方程( 1 )基本相同,所不同的是作为核心被解释变量的
是通过第一阶段回归方程( 3 )获得的估计值。而在第一阶段
ln犮狌犾狋 犻 犼 狋 - 1
是两地区之间 狋 - 1 期的文化差异的对数,即所需
方程( 3 )中, ln犮狌犾狋 犻 犼 狋 - 1
为滞后一 期的 地区 间战争 频率 差
处理的内生变量;而 ln狑犪狉 犳 狉犲 狇 犻 犼 狋 - 1
异,是识别文化差异内生变量的工具变量。
其次,还要考虑可能对估计结果产生影响的度量误差。一方面,尽
管姓氏基因距离是一个衡量历史上地区间文化差异的有效变量,但同
其他指标一样,它并不能完全反应文化特征,会产生度量误差。因此,
可根据 犇犖犃 计算的基因距离和语言距离替代姓氏基因距离,用来度量
文化差异。另一方面,由于缺乏历史移民数据,尽管本文使用移民率作
为移民规模的度量,但是被解释变量依然可能存在度量误差。因此,在
采用小样本进行一致性估计检验的同时,本文也根据曹树基( 1997犪 )整
理的移民宗族和移民村庄的迁移信息重新构建两个数据库,考察被解
释变量的度量误差是否对估计结果产生影响。
四、实证结果
(一) 犗犔犛 估计结果
表 3 报告了根据回归方程( 2 )采用最小二乘法( 犗犔犛 )的估计结
· 1 6 8 ·