Page 79 - 《社会》2016年第3期
P. 79
社会· 2016 · 3
综合考虑劳动力市场的结构性因素以及个人的人力资本、家庭背景、学
校出身等各方面的影响。
四、数据、变量与测量
本文所用的数据来自中国人民大学中国调查与数据中心( 犖犛犚犆 )
组织实 施 的 “首 都 大 学 生 成 长 追 踪 调 查”( 犅犲犻 犼 犻狀 犵犆狅犾犾犲 犵 犲犛狋狌犱犲狀狋狊
,
犘犪狀犲犾犛狌狉狏犲 狔 犅犆犛犘犛 )。该调查以 2009 年为起点,随机抽取北京市 15
所高校的 5100 名 2008 级(时为大学一年级下学期)和 2006 级(时为
大学三年级下学期)的学生进行追踪调查。尽管该调查的抽样范围仅
限于北京,但鉴于北京高校类型的多样性,这个样本仍然具有良好的代
表性(李路路, 2013 )。由于 2008 级学生毕业较晚,因此本文实际使用
的是 2006 级学生的前 3 期数据( 2009 — 2011 年)。更准确地讲,本文
是对 2006 级学生在 2011 年的就业情况进行横截面分析,但适当地加
入了他们在前两期调查中所报告的一些其他信息。本研究的原始有效
样本约 900 人,但由于所需变量存在不同程度的缺失,最终分析样本为
742 人。 1
本研究的关键变量是教育匹配或过度教育。如果受访者在 2011
年调查时处于工作状态,则他/她会被问到:“您认为这份工作需要由哪
种教育程度的人来做才适合? ”由于受访者都是本科毕业生,所以,回答
非本科毕业就可以做的被视为“过度教育”,回答本科毕业才能做的被
视为“适度教育”,回答研究生毕业才能做的被视为“教育不足”。这种
主观认定方法是测量教育匹配的三种方法之一,在以往的研究中曾经
被广泛应用( 犎犪狉狋狅 犵2000 ; 犌狉狅狅狋犪狀犱犅狉犻狀犽 , 2000 )。
,
在本文所用的数据中,虽然教育匹配的三种状况都可以区分出来,
但实际上“教育不足”这个类别的人数非常少,只有 20 人不到。有鉴于
此,且许多既有研究都关注的是过度教育者与适度教育者之间的比较,
因此,本文将教育不足者排除在分析之外,只保留过度教育者与适度教
育者,将前者编码为 1 ,后者编码为 0 。
1.2011 年的调查成功追访到约 1900 名 2006 级学生,其中 800 余名学生继续读研究生,约
1000 名学生进入劳动力市场,另有约 100 名学生既未读研也未工作。将 742 人的分析样本
与 900 余人的原始有效样本相比较,在性别、年龄、学校层次、家庭背景、教育匹配等变量上的
分布均十分相似,并未发现有偏。
· 7 2 ·