Page 236 - 《社会》2019年第1期
P. 236

方言能力、语言环境与城市移民创业行为


   力资本的个体,可能与讲方言的移民有系统上的差异。其次,把样本分
   为同方言区移民和跨方言区移民。因为讲方言的同方言区移民天然具
   有会说本地方言的能力,而讲方言的跨方言区移民自身不具有会说本
   地方言的能力,这样做可以排除因个人能力突出导致的样本选择偏误。
   最后,为保证最大限度的匹配,协变量为可能影响移民创业活动的所有
   控制变量,包括年龄、性别、教育水平、婚姻状况、户口、政治面貌等。匹
   配的处理变量是“移民是否是同方言区流动”这个二分虚拟变量,如果
   是同方言区流动,则赋值为 1 ,反之为 0 。结果变量为创业决策变量和
   创业收入变量。以上三步使得两组样本之间的差异可以近似地看做由
   移民是否会说当地方言所致,使得识别样本更加干净。通过倾向分值
   匹配,可以对控制组进行更准确的选择,即在构造控制组时只选择落在
   共同支持区间的控制组。匹配前后的变量平衡情况如表 6 所示。可以
   看出,与匹配之前相比,匹配后的变量偏度明显下降,处理组均值更加
   接近,处理组与控制组的匹配协变量不存在显著差异,这说明匹配质量
   总体来说较好,倾向得分估计函数设定较为合理。也就是说,匹配后使
   得处理组与控制组除了核心自变量之外,其他可能影响移民创业的因
   素具有相似性,即构成了“双胞胎样本”。共同支持检验发现,同方言区
   流动的样本倾向分大都落在[ 0.89 , 1.13 ]区间,换句话说,共有 2224
   个样本获得了共同支持,其中处理组样本 1107 个,控制组样本 1117
   个,匹配样本达到平衡,结果的可信度较高。
       表 7 报告了倾向得 分 匹 配的 结果,其 中匹 配采用 的 是 卡 尺 内 近
   邻无放回 匹 配,卡 尺 为 0.01 ,匹 配 个 数 为 1 。 犘犛犕犇犐犇 模 型 是 把
   2012 年看做实 验 期。结 果 显 示,无 论 采 用 何 种 匹 配 方 式,在 创 业 决
   策模型中拥有当地方言 能 力 的 平 均处 理效应 都在 0.01 的统 计水平
   上显著为正,这说明方言能力显著提高了移民创业意愿;在创业收入
   模型中,方言能力的平均处理效应也都显著为正,说明方言能力显著
   提高了移民创业者 的 收 入。可以 看出,经 过倾 向值匹 配后的 平均处
   理效应要高于基准回 归 的结 果,可能 与在 基准回 归中 没有很 好 的平
   衡未被观测到的,对移民创业具有负向影响的遗漏变量有关,造成结
   果被低估了。同时,也有可能是因为没有剔除说普通话的个体,造成
   向下的样本选择偏误所致。



                                                          · 2 2 9 ·
   231   232   233   234   235   236   237   238   239   240   241