Page 242 - 《社会》2022年第1期
P. 242

被访者驱动抽样:基于多种方法的估计诊断

                样本的招募工作确实是在一些小区域范围内进行, 这一发现也证实了
                表 2 所揭示的佛山样本存在同小区招募倾向的情况。 综上所述,我们认
                为,佛山某些样本是从某一局部区域招募而来。






















                                图 10:佛 山 RDS 招 募 过 程 的 地 理 覆 盖 面 积
                    总之,使用经纬度信息构造凸壳面积可以表征 RDS 招募过程。 通
                过以上分析,我们发现,南京、无锡和广州的样本可以看作从整个调查
                区域招募而来,而佛山存在一部分样本是从某一局部区域招募而来。 基
                于此,我们认为,与地理区域相关的非随机招募对南京、无锡和广州的
                样本没有造成严重威胁,以此样本进行的 RDS 估计是可靠的;佛山样
                本受到与区域相关的非随机招募行为影响,以此样本进行的 RDS 估计
                是否有效需要根据其他的诊断结果综合判断。
                    (四)RDS 估计结果
                     我们在前文花费大量篇幅,使用 RDS 估计器、收敛图、瓶颈图、经
                纬度信息等多种诊断方法深入系统地诊断了违反“随机招募假设”情况
                下 RDS 样本的同质性问题和样本的总体代表性问题(即样本质量),以
                便判断基于此样本的 RDS 估计有效性。 基于多种方法的诊断结果表
                明,大体而言,适度违反“随机招募假设”并不会导致样本同质性水平变
                高和威胁样本的总体代表性,基于这些样本进行的 RDS 估计可以看作
                有效的。 因此,我们有必要对四个城市家政工人样本的 RDS 估计结果
                进行展示。
                    表 4 报告了四个城市家政工人 RDS 样本的总体参数估计。 除了实


                                                                          · 235·
   237   238   239   240   241   242   243   244   245   246   247