Page 163 - 《社会》2021年第3期
P. 163

社会·2021·3

           归类得到238 个非农职业。
               (二)变量测量
               此次研究的因变量是与被 访 者 这 份 职业相关的所有月 收 入 的对
           数,包括工资收入、浮动工资、奖金和福利等。最关键的一组自变量是职
           业特征变量, 在参照之前同样也使用 O*Net 职业数据库构建相应的职
                                                                      8
           业 特 征 的 研 究 的 基 础 上(Hadden , et al . , 2003 ; Shauman , 2006), 我
           们 主 要使用因子分析的主成分分析法和最大旋转法构建了 238 个非农
           职业一系列职业特征的变量, 并保留了与研究假设相关的核心职业特征
           变量。 最终得到 5 个与研究相关的职业特征变量,包括 2 个认知能力层
           面的变量———语言能力和量化能力;还包括操作修理能力、照料服务 技
           能以及工作环境的恶劣程度, 这 5 个变量的取值区间基本都为(-3.5,3),
           均值为 0,标准差为 1。 我们将这 5 个职业特征变量合并到 CFPS2010 的
                   9
           数据中, 经过数 据清理,2010 年的 CFPS 数 据中共 包括 193 个 非 农 职
           业,因此,我们获得了这 193 个职业的特征信息。
               本研究所使用的职业内部的男性比例是根据“六普”数据计算得到
           的,需要注意的是,由于需要配合使用 O*Net 数据库,我们将一些职业
                       10
           进行了归类, 并重新计算了这些职业的男性比例。 在进行数据合并
           时, 我们尽可能地保证了合并的职业类型在职能和对职业技能方面的
           要求是基本相似和一致的,同时这些职业的性别比例也很相近,因此,
           这种合并对我们的计算结果不会有明显影响。
               此外,本研究还控制了个体层面的人力资本变量和个人特征变量,
           包括受教育年限、工龄和工龄的平方和、每月工作小时及其平方和、户
           口类型(“城市”=1)。 除此之外,考虑到中国社会中单位体制的分割同
           样会影响性别间的收入差距(吴愈晓、吴晓刚,2009),因此,本研究也纳
           入了“体制内/外”的变量。 我们将在政府部门、党政机关、国有/集体企


           8. 由于之前的研究是依据美国的职业分类系统建立的职业特征,而中国和美国的职业
           结构并不完全一致,所以我们最终得到的职业特征的因子也存在一定差别。
           9. 关于具体构建职业特征变量的过程和相应的因子荷载请查看文后的附录 1 和附录
           2。 在附录中,我们还报告了每个职业特征值最高和最低的职业类型。
           10.因为美国的职业分类系统有些类别与中国并不完全一致,所以我们进行了一定的职
           业类型合并, 主要是由于美国的职业分类系统中对于加工制造类职业的分类更粗,例
           如,中国的职业分类系统将制药职业分为多种类型,而美国只有一类。


           · 156·
   158   159   160   161   162   163   164   165   166   167   168