Page 124 - 《社会》2017年第3期
P. 124
教育的同型婚姻与中国社会的家庭工资收入不平等: 1996 — 2012
区/直辖市”,夫妻双方在这一变量上取值一致。 犔犎犛犆1996 的案例覆
盖 26 个省级行政区划, 16 犆犌犛犛2012 的案例覆盖 29 个省级行政区划,
具体的地域分布可查询该调查的基本介绍,在此不赘述。
5. 控制变量:年龄
本文用受访年份减去出生年变量获得夫妻二人的年龄信息。这虽
然并不完全准确,但误差较小,在本文的分析方法中不会产生特别重大
的影响。用丈夫年龄减去妻子年龄获得夫妻的年龄差,多数情况下丈
夫年龄比妻子大且年龄差多数在 5 岁以内。
(三)因变量:工资收入的泰尔指数
本文研究教育同型婚姻的状况与中国社会收入不平等之间的关
系。参考布林和萨拉查( 犅狉犲犲狀犪狀犱犛犪犾犪狕犪狉 , 2011 )的做法,本文用于测
量收入不平等的方法是对核心家庭夫妇双方的工资收入之和计算泰尔
指数。
在众多测量不平等的指标中选用泰尔指数是因为它具备可分解的特
点。泰尔指数是从信息论对信息熵的一般表达式修改而来,公式如下:
狀
1 狓 犻 狓 犻
T = ln [ ]
∑ 狓
狀 犻 =1 狓
为第 犻 个案例
其中, 犜 代表泰尔指数( 犜犺犲犻犾犐狀犱犲狓 ), 狀 为样本量, 狓 犻
的值, 狓 是样本平均值。如果样本中的数据完全相等,则泰尔指数为
0 ;反之则为 1 。它可以被拆解成如下形式:
狓 犼 狓 犼 狓 犼
T = ∑ 狆 犼 狓 ln( ) + ∑ 狆 犼 狓 犜 犼
犼 狓 犼
犼 表示第 犼 组的均值,
其中, 表示第 组在样本中所占的比例, 狓 犼
狆 犼
表示第 组自己的泰尔指数。该表达式的前半部分衡量组间的不平
犜 犼 犼
等程度,后半部分则衡量组内不平等程度按组大小加权后的值。在本
文的分析中,由夫妻受教育程度交互组成的 49 种情况就是本研究关心
的组。对本研究的样本数据进行计算,得到的泰尔指数如表 5 所示:
表 5 :家庭工资收入不平等指数的总体情况
组间不平等 组内不平等 总不平等泰尔指数 基尼系数
犔犎犛犆1996 0.033 0.192 0.224 0.353
犆犌犛犛2012 0.171 0.315 0.486 0.500
增幅 418% 64% 117% 41%
16. 重庆于 1997 年恢复成为直辖市。
· 1 1 7 ·