Page 80 - 《社会》2016年第3期

P. 80

中国高学历劳动者的教育匹配与收入回报

本研究的因变量是每月的工作收入（取对数）。在收入决定方程
中，过度教育是关键自变量，此外还包括性别、年龄、工作时间（小时／
周）、部门、行业、职业、组织规模（取对数）、工作地点的城乡类型、工作
地点是否在北京等。２
在以过度教育为因变量预测倾向值时，本文提出了一个综合决定
模型，包括家庭背景、学校出身、人力资本、劳动力市场四大方面的因
素。家庭背景因素包括出生时的户籍、父母的最高学历、上大学前的家
庭收入（取对数）、上大学前家庭所在地的城乡类型等变量；学校出身因
素包括大学层次、所学专业等变量；人力资本因素包括性别、年龄、政治
面貌等变量；劳动力市场因素包括部门、行业、职业、地区等变量。３最
后，本文还使用了标准化后的高考分数变量，它与上述四大因素都有关
联，可以视为智力或能力的一个代理变量（狉狅狓狔狏犪狉犻犪犫犾犲）。标准化的
狆
计算公式是（原始高考分数 — 省一本分数线）／（省一本分数线 — 省
二本分数线），其中原始高考分数由受访者报告，受访者高考时所在省
的一本和二本分数线（分文理科）来自教育部的“阳光高考”信息平台。
标准化后的高考分数反映了考生在所属省份的相对位置，具有跨省份
比较的意义。

五、分析结果

在本研究的分析样本中，过度教育的发生率为２８．８４％（见表１），
表１还给出了其他变量的描述性统计量。犗犔犛回归结果见表２。在不
控制任何其他变量的情况下（模型１），过度教育者比适度教育者的月
收入低２０．８６％（１犲－０．２３４＝０．２０８６）。当控制了性别和年龄后（模型
２），该估计值没有太大变化。在控制了工作时间、部门、行业、职业、组织

２．尽管本文的分析样本来自同一届学生，但仍存在一定的年龄差异，９３．３９％的样本集中在
２３－２５岁区间，其他则在此区间上下一两岁，因此需要控制年龄。虽然首都高校的毕业生大
多留京工作，但也有部分去其他城市、小城镇乃至农村工作，因此需要控制工作地点的城乡类
型以及是否在北京。
３．由于“首都大学生成长追踪调查”在抽样时将北京大学、清华大学、中国人民大学三所学校
单独分层，所以本文将大学层次变量区分为三个类别：非“ ２１１ ”、“ ２１１ ”、北大／清华／人大。由
于大学毕业生有不少在高端服务业任职，所以本文将行业变量区分为第二产业、犐犜业、银行
金融业、其他第三产业四个类别。类似地，由于高学历劳动者从事专业技术人员的比例较高，
所以本文将职业变量区分为一般工作人员、专业技术人员和其他三个类别。

· ７３ ·

75 76 77 78 79 80 81 82 83 84 85