Page 238 - 《社会》2022年第1期
P. 238

被访者驱动抽样:基于多种方法的估计诊断

                两条种子链收敛到大致相同的值,说明每条种子链的样本来自同一群
                体。 从图 6-D 的滚动瓶颈图看,最大的种子链条的招募过程显示出一
                个明确的模式,即先迅速招募到年龄相对年轻的受访者,然后再进入
                年龄较大的家政工人中招募。 总的来看,佛山的样本也基本消除了对
                种子的依赖性。



























                                   图 6:佛 山 样 本 的 收 敛 图 和 瓶 颈 图

                    通过绘制年龄变量的 RDS 样本收敛图和瓶颈图,我们发现,无锡、
                广州和佛山的样本基本消除了对种子的依赖性, 南京的样本组成虽然
                在一定程度上受到种子选择的影响,但影响可能不大。 基于此,我们认
                为,与结果相关的非随机招募没有对本次 RDS 调查获得的样本造成严
                重威胁,样本对总体具有代表性,可以进行有效的 RDS 估计。
                    (三)经纬度信息的诊断结果
                    同样,我们还从地理区域角度考察了非随机招募对 RDS 样本所覆
                盖的区域范围的影响。 我们根据经纬度信息构造了四个城市的招募区
                域凸壳,用来表示 RDS 招募过程的有效覆盖范围。 由于本次调查的家
                政工人主要在城市的城区活动,因此 RDS 招募的有效覆盖范围应接近
                实际的城区面积。
                     图 7 展 示 的 是 南 京 RDS 招 募 过 程 的 有 效 地 理 覆 盖 情 况 。 根 据


                                                                          · 231·
   233   234   235   236   237   238   239   240   241   242   243