Page 236 - 《社会》2019年第1期

P. 236

方言能力、语言环境与城市移民创业行为

力资本的个体，可能与讲方言的移民有系统上的差异。其次，把样本分
为同方言区移民和跨方言区移民。因为讲方言的同方言区移民天然具
有会说本地方言的能力，而讲方言的跨方言区移民自身不具有会说本
地方言的能力，这样做可以排除因个人能力突出导致的样本选择偏误。
最后，为保证最大限度的匹配，协变量为可能影响移民创业活动的所有
控制变量，包括年龄、性别、教育水平、婚姻状况、户口、政治面貌等。匹
配的处理变量是“移民是否是同方言区流动”这个二分虚拟变量，如果
是同方言区流动，则赋值为１，反之为０。结果变量为创业决策变量和
创业收入变量。以上三步使得两组样本之间的差异可以近似地看做由
移民是否会说当地方言所致，使得识别样本更加干净。通过倾向分值
匹配，可以对控制组进行更准确的选择，即在构造控制组时只选择落在
共同支持区间的控制组。匹配前后的变量平衡情况如表６所示。可以
看出，与匹配之前相比，匹配后的变量偏度明显下降，处理组均值更加
接近，处理组与控制组的匹配协变量不存在显著差异，这说明匹配质量
总体来说较好，倾向得分估计函数设定较为合理。也就是说，匹配后使
得处理组与控制组除了核心自变量之外，其他可能影响移民创业的因
素具有相似性，即构成了“双胞胎样本”。共同支持检验发现，同方言区
流动的样本倾向分大都落在［０．８９，１．１３］区间，换句话说，共有２２２４
个样本获得了共同支持，其中处理组样本１１０７个，控制组样本１１１７
个，匹配样本达到平衡，结果的可信度较高。
表７报告了倾向得分匹配的结果，其中匹配采用的是卡尺内近
邻无放回匹配，卡尺为０．０１，匹配个数为１。犘犛犕犇犐犇模型是把
２０１２年看做实验期。结果显示，无论采用何种匹配方式，在创业决
策模型中拥有当地方言能力的平均处理效应都在０．０１的统计水平
上显著为正，这说明方言能力显著提高了移民创业意愿；在创业收入
模型中，方言能力的平均处理效应也都显著为正，说明方言能力显著
提高了移民创业者的收入。可以看出，经过倾向值匹配后的平均处
理效应要高于基准回归的结果，可能与在基准回归中没有很好的平
衡未被观测到的，对移民创业具有负向影响的遗漏变量有关，造成结
果被低估了。同时，也有可能是因为没有剔除说普通话的个体，造成
向下的样本选择偏误所致。

· ２２９ ·

231 232 233 234 235 236 237 238 239 240 241