Page 242 - 《社会》2022年第1期
P. 242
被访者驱动抽样:基于多种方法的估计诊断
样本的招募工作确实是在一些小区域范围内进行, 这一发现也证实了
表 2 所揭示的佛山样本存在同小区招募倾向的情况。 综上所述,我们认
为,佛山某些样本是从某一局部区域招募而来。
图 10:佛 山 RDS 招 募 过 程 的 地 理 覆 盖 面 积
总之,使用经纬度信息构造凸壳面积可以表征 RDS 招募过程。 通
过以上分析,我们发现,南京、无锡和广州的样本可以看作从整个调查
区域招募而来,而佛山存在一部分样本是从某一局部区域招募而来。 基
于此,我们认为,与地理区域相关的非随机招募对南京、无锡和广州的
样本没有造成严重威胁,以此样本进行的 RDS 估计是可靠的;佛山样
本受到与区域相关的非随机招募行为影响,以此样本进行的 RDS 估计
是否有效需要根据其他的诊断结果综合判断。
(四)RDS 估计结果
我们在前文花费大量篇幅,使用 RDS 估计器、收敛图、瓶颈图、经
纬度信息等多种诊断方法深入系统地诊断了违反“随机招募假设”情况
下 RDS 样本的同质性问题和样本的总体代表性问题(即样本质量),以
便判断基于此样本的 RDS 估计有效性。 基于多种方法的诊断结果表
明,大体而言,适度违反“随机招募假设”并不会导致样本同质性水平变
高和威胁样本的总体代表性,基于这些样本进行的 RDS 估计可以看作
有效的。 因此,我们有必要对四个城市家政工人样本的 RDS 估计结果
进行展示。
表 4 报告了四个城市家政工人 RDS 样本的总体参数估计。 除了实
· 235·