Page 130 - 《社会》2013年第1期
P. 130
同乡的力量:同乡聚集对农民工工资收入的影响
狊犮狅狉犲犿犪狋犮犺犻狀 犵 )的方法。该方法根据一系列影响农民工是否进入同乡
聚集的因素或特征变量建立 犔狅 犵 犻狋 模型(或 犘狉狅犫犻狋 模型),并根据该模
型结 果 对 样 本 中 每 一 个 人 估 计 一 个 进 入 同 乡 聚 集 的 倾 向 分 数
( 狉狅 狆 犲狀狊犻狋 狔 狊犮狅狉犲 )。倾向分数是一组连续的数值,数值越高,表示一个
狆
人越可能接受干预(这里的干预指进入同乡聚集)。估计倾向分数这一
步将诸 多 影 响 是 否 接 受 干 预 的 因 素 (或 干 预 前 特 征, 狉犲狋狉犲犪狋犿犲狀狋
狆
犮犺犪狉犪犮狋犲狉犻狊狋犻犮狊 )合成为一个综合数值。笔者进一步将倾向性分数分段
分层,并在各层中分配样本,使各倾向分数分层( 狊狋狉犪狋犪 )内部的干预组和
控制组在上一步 犔狅 犵 犻狋 模型中协变量的分布上没有显著差别,即各层内
部接受干预者和未受干预者的差别仅存在于事实上是否进入了同乡聚
集。接着,在各层内计算实际进入同乡聚集者和未进入者在收入上的平
均差别,并通过样本在各层中的分布加权,根据以下公式 4 ,计算整个样
本中同乡聚集的平均影响( 犪狏犲狉犪 犵 犲狋狉犲犪狋犿犲狀狋犲犳犳犲犮狋 )及其标准误。
犓 狀 犓
δ ^ = [ 犢 1犓 -犢 0犓 ]
∑犓=1
犖
2
∑犓=1( )
犓
狀 犓
Var ( δ ^ ) = 犖 Var [ 犢 1犓 -犢 0犓 ]
为了比较在进入同乡聚集企业后,不同特征的人谁更可能获益更高,本
研 究 使 用 的 是 异 质 性 干 预 模 型 ( 犎犲狋犲狉狅 犵 犲狀犲狅狌狊 犜狉犲犪狋犿犲狀狋犈犳犳犲犮狋
犕狅犱犲犾 ) 5 ,具体做法只需要在已经获得倾向分数分层的基础上,将同乡
聚集对收入的影响效应作为因变量,以倾向分数分层作为自变量 6 ,用
方 差 最 小 二 乘 估 计 法 回 归 ( 犞犪狉犻犪狀犮犲 犠犲犻 犵 犺狋犲犱 犔犲犪狊狋 犛 狇 狌犪狉犲
犚犲 犵 狉犲狊狊犻狅狀 )估计不同倾向性群体(不同分层)之间同乡聚集对收入的
4. 该公式的使用亦可参见 犌狌狅犪狀犱犉狉犪狊犲狉 ( 2010 : 155-156 )。公式中的 犽 表示各层, 狀犓 表示
各层的样本数量, 犢 1犓 是各层中实际进入同乡聚集者(干预组)工资对数的均值, 犢 0犓 是各层中
实际没有进入同乡聚集者(控制组)工资对数的均值。
5. 异质性干预模型的相关方法介绍详见 犡犻犲 , 犅狉犪狀犱 , 犪狀犱犑犪狀狀 ( 2012 )。
6. 从用倾向分数分层匹配来估计同乡聚集的平均影响,到估计倾向分数分层对同乡聚集收入
效应的影响,可以视作是对分层线性模型的两个层次( 犾犲狏犲犾 )的分别估计。层 1 模型是以收入的
对数为因变量,是否进入同乡聚集为自变量,而不同的倾向分数分层为层 2 的分组( 犮犾狌狊狋犲狉 )。
在每一个分组里(倾向分数分层内部),分别估计同乡聚集对收入的影响。估计倾向分数分层对
同乡聚集收入效应的影响,是在层 2 模型中以同乡聚集的影响系数为因变量,不同的倾向分数
分层为自变量来得到同乡聚集的影响系数是如何随着倾向分数分层的改变而改变。
· 1 2 3 ·