Page 128 - 《社会》2017年第3期
P. 128
教育的同型婚姻与中国社会的家庭工资收入不平等: 1996 — 2012
新的方法作为对置换检验的一种改进较好地解决了“放进框里”的
弊病。年龄的限制作用有了一定的模糊性,对每一个个案重新进行匹
配的概率分布也不会被人为地截断。上述置换检验采取的是无放回抽
取,较少遗漏信息。
随机取值的概率分布决定了“模糊性”的程度。如果概率分布较为
集中,则模糊性较低;若概率分布扁平,则模糊性高。这一概率分布作
为研究者人为设定的参数,可以按照需要合理地进行调整。本文仅对
年龄变量采取了模糊置换检验,设定的概率分布是把夫妻年龄差限制
在两岁以内得到的比例分布,并将其对称化。这意味着在极端的情况
下,按照年龄重新配对的实际范围可达上下 4 岁。 18
本文在每一次模拟中对样本中的丈夫实施 700 次随机配对程序,
在多次模拟间逐步加入年龄、户口、省份等控制变量,再加入教育变量
考察教育同型婚姻的影响。通过比较观测值与多次模拟得到的统计量
置换分布的关系,可以计算含义类似参数模型的 狆 值。但是要获得统
计量准确的置换分布,理论上来讲要进行 犖 的阶乘次 结果不 同的 置
换,这对于一个有 70 万个案的样本来说是无法处理的天文数字。由于
有限次置换检验得到的均值会向总体均值收敛,因此模拟次数达到一
定规模就可以了。由于样本量巨大,本文进行的模拟次数肯定无法得
出令人满意的置换分布(参考 犓狀犻 犼 狀犲狀犫狌狉 犵犲狋犪犾. , 2009 ),但如果目的
,
仅是以其均值估计总体情况的话,所得的结果大概足以符合要求。
三、研究结果
表 6 显示的是加入不同变量的若干次模拟所得的泰尔指数及其构
成。不仅包含了每一次模拟的结果,还计算了与完全随机相比,每一次
改变控制变量所计算出的组间不平等和总不平等的泰尔指数的增幅。
模拟 犪 显示的是完全随机匹配得到的泰尔指数均值,图 1 上方黑
线表示的是截面数据的观测值。二者相距甚远,说明目前中国社会收
入不平等的局面经由某种匹配机制产生,而且匹配的总效应加剧了家
庭工资收入的不平等。
18. 本文采用 犚3.2.5 进 行 演 算,源 文 件 已 在《社 会》杂 志 官 网 公 开, 狉犿犱 格 式 的 文 件 可 用
犚犛狋狌犱犻狅 打开。
· 1 2 1 ·