Page 181 - 《社会》2016年第2期
P. 181
社会· 2016 · 2
人(谢宇等, 2014 )。本研究使用的是中国家庭动态调查的全国代表性
样本,所得到的结论在全国范围内具有推论意义。
本文仅仅讨 论 高 中 阶 段 两种 不同 类 型 教 育 的 回 报 差 异,故 而 从
犆犉犘犛2010 的成人数据库中抽取了最高学历为高中(包括普通高中、职
业高中、中专和技校)的子样本。考虑到成人教育与全日制教育存在诸
多差异,故 将 成 人 教 育 剔 除 出 分 析 样 本,只 保 留 全 日 制 教 育 样 本。
犆犉犘犛2010 的成人样本中最高学历为全日制高中程度的有 4261 人,将
初中毕业时间限定为 1978 年之后,并限定所有分析变量均非缺失值,
得到有效子样本数量为 1526 个。
(二)变量描述
中国家庭动态调查数据提供了收入明细,包括职业收入、第二职业
收入和其他类型的收入。考虑到灵活就业以及家庭经营等诸多影响收
入测量的因素,本研究使用的收入变量为被访者在调查前一年( 2009
年)归于自己名下的所有收入。为了控制极值的影响,本研究剔除了年
收入低于 1000 元和年收入高于 40 万元的样本,并对收入取对数作为
本研究的因变量。
被访者职业是一个多类别变量。 2010 年的中国家庭动态调查详
细询问了被访者的工作内容,调查后期对工作内容按照《中国家庭动态
跟踪调查职业分类表》进行编码。除了使用成人问卷中的职业编码,本
文还使用家庭关系数据库的信息填补了缺失值,但仍有一部分样本拥
有收入却缺乏职业记录。根据职业编码,把军人和无职业者剔除,并将
职业区分为单位负责人、专业技术人员、办事人员和商业服务业人员、
操作工人、农业劳动者、其他职业、职业缺失七类。
在以往的研究中,职业教育和普通高中教育往往被视为同一层级
的教育。但实质上,这两种教育在内容和毕业之后的职业路径方面均
存在诸多差异。作为本研究关键自变量的教育类型被重新编码为一个
虚拟变量: 1 代表职业教育,包括中专、技校以及职业高中; 0 代表普通
高中教育。
控制变量除年龄、年龄平方、性别(男性 =1 )、民族(汉族 =1 )、中共
党员(党员 =1 )、户口(城镇户口 =1 )和所在地区(西部 =0 ,中部 =1 ,东
部 =2 )之 外,还 包 括 了 被 访 者 的 认 知 能 力。 认 知 能 力 变 量 来 自
犆犉犘犛2010 数据库的字词测试和数学测试。这两种测试基于学历水平
· 1 7 4 ·