Page 80 - 《社会》2016年第3期
P. 80
中国高学历劳动者的教育匹配与收入回报
本研究的因变量是每月的工作收入(取对数)。在收入决定方程
中,过度教育是关键自变量,此外还包括性别、年龄、工作时间(小时/
周)、部门、行业、职业、组织规模(取对数)、工作地点的城乡类型、工作
地点是否在北京等。 2
在以过度教育为因变量预测倾向值时,本文提出了一个综合决定
模型,包括家庭背景、学校出身、人力资本、劳动力市场四大方面的因
素。家庭背景因素包括出生时的户籍、父母的最高学历、上大学前的家
庭收入(取对数)、上大学前家庭所在地的城乡类型等变量;学校出身因
素包括大学层次、所学专业等变量;人力资本因素包括性别、年龄、政治
面貌等变量;劳动力市场因素包括部门、行业、职业、地区等变量。 3 最
后,本文还使用了标准化后的高考分数变量,它与上述四大因素都有关
联,可以视为智力或能力的一个代理变量( 狉狅狓 狔狏犪狉犻犪犫犾犲 )。标准化的
狆
计算公式是(原始高考分数 — 省一本分数线)/(省一本分数线 — 省
二本分数线),其中原始高考分数由受访者报告,受访者高考时所在省
的一本和二本分数线(分文理科)来自教育部的“阳光高考”信息平台。
标准化后的高考分数反映了考生在所属省份的相对位置,具有跨省份
比较的意义。
五、分析结果
在本研究的分析样本中,过度教育的发生率为 28.84% (见表 1 ),
表 1 还给出了其他变量的描述性统计量。 犗犔犛 回归结果见表 2 。在不
控制任何其他变量的情况下(模型 1 ),过度教育者比适度教育者的月
收入低 20.86% ( 1犲 -0.234 =0.2086 )。当控制了性别和年龄后(模型
2 ),该估计值没有太大变化。在控制了工作时间、部门、行业、职业、组织
2. 尽管本文的分析样本来自同一届学生,但仍存在一定的年龄差异, 93.39% 的样本集中在
23-25 岁区间,其他则在此区间上下一两岁,因此需要控制年龄。虽然首都高校的毕业生大
多留京工作,但也有部分去其他城市、小城镇乃至农村工作,因此需要控制工作地点的城乡类
型以及是否在北京。
3. 由于“首都大学生成长追踪调查”在抽样时将北京大学、清华大学、中国人民大学三所学校
单独分层,所以本文将大学层次变量区分为三个类别:非“ 211 ”、“ 211 ”、北大/清华/人大。由
于大学毕业生有不少在高端服务业任职,所以本文将行业变量区分为第二产业、 犐犜 业、银行
金融业、其他第三产业四个类别。类似地,由于高学历劳动者从事专业技术人员的比例较高,
所以本文将职业变量区分为一般工作人员、专业技术人员和其他三个类别。
· 7 3 ·