Page 126 - 《社会》2017年第3期
P. 126
教育的同型婚姻与中国社会的家庭工资收入不平等: 1996 — 2012
1. 选择一个要检验的统计量,即 犛 ( 犜 )。
2. 对初始的数据计算 犛 ( 犜 )。
3. 不 断 随 机 地 重 复 排 列 观 测 值 并 在 每 一 次 重 新 排 列 后 计 算 犛
( 犜 ),从而获得 犛 ( 犜 )的置换分布。
4. 根据初始数据 犛 ( 犜 )与其置换分布临界值的相对关系,选择接
受或拒绝原假设。
当初始数 据 的 犛 ( 犜 )难 于 处 理 时,可 以 把 它 的 数 值 转 化 为 排 序
( 狉犪狀犽 )并实施类似的步骤。显然,置换检验的一个充分条件是在原假
设下观测值可以彼此交换。与之类似的另一个重复抽样方法是自展法
( 犫狅狅狋狊狋狉犪 狆 ),其与置换检验相比主要区别在于置换检验的重复排列相
当于无放回抽取,而自展法是有放回抽取,也就是说经过自展法得到的
数据中可能出现重复的观测值。
在本研究的实际操作中,即按照一定的条件重新分配夫(或妻,择
一即可)的家庭编号,再通过编号与配偶进行匹配。重新匹配之后计算
家庭工资收入总和,再对该次模拟计算泰尔指数并记录在案。
如果打乱编号的过程是在全部家庭范围内发生的,那么获得的泰
尔指数反映的就是在社会成员完全随机选择配偶的前提下,家庭工资
收入不平等的程度。经验来看,这一不平等程度未必是最低的,但与实
际情况相比随机配对的结果应该较低,因为实际上人总有某种正向的
选择偏好。
在此基础上,我们可以逐步加入定类变量,探讨其影响。置换检验
可以通过对协变量的控制考察不同因素对 犛 ( 犜 )的影响。控制协变量
有两种策略:有学者( 犌犪犻犾 , 犲狋犪犾. , 1988 )建议先通过参数方法(例如线
性回归)剔除协变量与 犛 ( 犜 )的函数关系,再对残差进行置换检验;另一
种方法是限制随机化( 狉犲狊狋狉犻犮狋犲犱狉犪狀犱狅犿犻狕犪狋犻狅狀 )( 犈犱 犵 犻狀 犵 狋狅狀 , 1983 ),如
果协变量取值较少,那么可以在协变量的不同组合构成的组内进行置
换检验,从而剔除协变量的影响。
具体来说,如果仅在同一户口身份的丈夫之间重新分配其编号,再
与编号未改变的妻子进行匹配,那么虽然每次模拟某一个特定案例匹
配到的丈夫未必相同,但所匹配到的丈夫总与其观察数据中的丈夫具
有相同的户口身份。这就意味着,户口身份的联合分布保持不变。也
就是说,这时候观察到的泰尔指数是控制了户口这一变量的联合分布
· 1 1 9 ·