Page 238 - 《社会》2022年第1期
P. 238
被访者驱动抽样:基于多种方法的估计诊断
两条种子链收敛到大致相同的值,说明每条种子链的样本来自同一群
体。 从图 6-D 的滚动瓶颈图看,最大的种子链条的招募过程显示出一
个明确的模式,即先迅速招募到年龄相对年轻的受访者,然后再进入
年龄较大的家政工人中招募。 总的来看,佛山的样本也基本消除了对
种子的依赖性。
图 6:佛 山 样 本 的 收 敛 图 和 瓶 颈 图
通过绘制年龄变量的 RDS 样本收敛图和瓶颈图,我们发现,无锡、
广州和佛山的样本基本消除了对种子的依赖性, 南京的样本组成虽然
在一定程度上受到种子选择的影响,但影响可能不大。 基于此,我们认
为,与结果相关的非随机招募没有对本次 RDS 调查获得的样本造成严
重威胁,样本对总体具有代表性,可以进行有效的 RDS 估计。
(三)经纬度信息的诊断结果
同样,我们还从地理区域角度考察了非随机招募对 RDS 样本所覆
盖的区域范围的影响。 我们根据经纬度信息构造了四个城市的招募区
域凸壳,用来表示 RDS 招募过程的有效覆盖范围。 由于本次调查的家
政工人主要在城市的城区活动,因此 RDS 招募的有效覆盖范围应接近
实际的城区面积。
图 7 展 示 的 是 南 京 RDS 招 募 过 程 的 有 效 地 理 覆 盖 情 况 。 根 据
· 231·