Page 126 - 《社会》2017年第3期
P. 126

教育的同型婚姻与中国社会的家庭工资收入不平等: 1996 — 2012

       1. 选择一个要检验的统计量,即 犛 ( 犜 )。
       2. 对初始的数据计算 犛 ( 犜 )。
       3. 不 断 随 机 地 重 复 排 列 观 测 值 并 在 每 一 次 重 新 排 列 后 计 算 犛
   ( 犜 ),从而获得 犛 ( 犜 )的置换分布。
       4. 根据初始数据 犛 ( 犜 )与其置换分布临界值的相对关系,选择接
   受或拒绝原假设。
       当初始数 据 的 犛 ( 犜 )难 于 处 理 时,可 以 把 它 的 数 值 转 化 为 排 序
   ( 狉犪狀犽 )并实施类似的步骤。显然,置换检验的一个充分条件是在原假
   设下观测值可以彼此交换。与之类似的另一个重复抽样方法是自展法

   ( 犫狅狅狋狊狋狉犪 狆 ),其与置换检验相比主要区别在于置换检验的重复排列相
   当于无放回抽取,而自展法是有放回抽取,也就是说经过自展法得到的
   数据中可能出现重复的观测值。
       在本研究的实际操作中,即按照一定的条件重新分配夫(或妻,择
   一即可)的家庭编号,再通过编号与配偶进行匹配。重新匹配之后计算
   家庭工资收入总和,再对该次模拟计算泰尔指数并记录在案。
       如果打乱编号的过程是在全部家庭范围内发生的,那么获得的泰
   尔指数反映的就是在社会成员完全随机选择配偶的前提下,家庭工资
   收入不平等的程度。经验来看,这一不平等程度未必是最低的,但与实
   际情况相比随机配对的结果应该较低,因为实际上人总有某种正向的
   选择偏好。
       在此基础上,我们可以逐步加入定类变量,探讨其影响。置换检验
   可以通过对协变量的控制考察不同因素对 犛 ( 犜 )的影响。控制协变量
   有两种策略:有学者( 犌犪犻犾 , 犲狋犪犾. , 1988 )建议先通过参数方法(例如线
   性回归)剔除协变量与 犛 ( 犜 )的函数关系,再对残差进行置换检验;另一
   种方法是限制随机化( 狉犲狊狋狉犻犮狋犲犱狉犪狀犱狅犿犻狕犪狋犻狅狀 )( 犈犱 犵 犻狀 犵 狋狅狀 , 1983 ),如
   果协变量取值较少,那么可以在协变量的不同组合构成的组内进行置
   换检验,从而剔除协变量的影响。
       具体来说,如果仅在同一户口身份的丈夫之间重新分配其编号,再
   与编号未改变的妻子进行匹配,那么虽然每次模拟某一个特定案例匹
   配到的丈夫未必相同,但所匹配到的丈夫总与其观察数据中的丈夫具
   有相同的户口身份。这就意味着,户口身份的联合分布保持不变。也
   就是说,这时候观察到的泰尔指数是控制了户口这一变量的联合分布

                                                          · 1 1 9 ·
   121   122   123   124   125   126   127   128   129   130   131