Page 236 - 《社会》2019年第1期
P. 236
方言能力、语言环境与城市移民创业行为
力资本的个体,可能与讲方言的移民有系统上的差异。其次,把样本分
为同方言区移民和跨方言区移民。因为讲方言的同方言区移民天然具
有会说本地方言的能力,而讲方言的跨方言区移民自身不具有会说本
地方言的能力,这样做可以排除因个人能力突出导致的样本选择偏误。
最后,为保证最大限度的匹配,协变量为可能影响移民创业活动的所有
控制变量,包括年龄、性别、教育水平、婚姻状况、户口、政治面貌等。匹
配的处理变量是“移民是否是同方言区流动”这个二分虚拟变量,如果
是同方言区流动,则赋值为 1 ,反之为 0 。结果变量为创业决策变量和
创业收入变量。以上三步使得两组样本之间的差异可以近似地看做由
移民是否会说当地方言所致,使得识别样本更加干净。通过倾向分值
匹配,可以对控制组进行更准确的选择,即在构造控制组时只选择落在
共同支持区间的控制组。匹配前后的变量平衡情况如表 6 所示。可以
看出,与匹配之前相比,匹配后的变量偏度明显下降,处理组均值更加
接近,处理组与控制组的匹配协变量不存在显著差异,这说明匹配质量
总体来说较好,倾向得分估计函数设定较为合理。也就是说,匹配后使
得处理组与控制组除了核心自变量之外,其他可能影响移民创业的因
素具有相似性,即构成了“双胞胎样本”。共同支持检验发现,同方言区
流动的样本倾向分大都落在[ 0.89 , 1.13 ]区间,换句话说,共有 2224
个样本获得了共同支持,其中处理组样本 1107 个,控制组样本 1117
个,匹配样本达到平衡,结果的可信度较高。
表 7 报告了倾向得 分 匹 配的 结果,其 中匹 配采用 的 是 卡 尺 内 近
邻无放回 匹 配,卡 尺 为 0.01 ,匹 配 个 数 为 1 。 犘犛犕犇犐犇 模 型 是 把
2012 年看做实 验 期。结 果 显 示,无 论 采 用 何 种 匹 配 方 式,在 创 业 决
策模型中拥有当地方言 能 力 的 平 均处 理效应 都在 0.01 的统 计水平
上显著为正,这说明方言能力显著提高了移民创业意愿;在创业收入
模型中,方言能力的平均处理效应也都显著为正,说明方言能力显著
提高了移民创业者 的 收 入。可以 看出,经 过倾 向值匹 配后的 平均处
理效应要高于基准回 归 的结 果,可能 与在 基准回 归中 没有很 好 的平
衡未被观测到的,对移民创业具有负向影响的遗漏变量有关,造成结
果被低估了。同时,也有可能是因为没有剔除说普通话的个体,造成
向下的样本选择偏误所致。
· 2 2 9 ·