Page 227 - 《社会》2022年第1期
P. 227

社会·2022·1

           可能变得不确定。 在招募其他受访者时,受访者可能从调查区域之外招
           募,也可能只招募研究区域中某一局部范围(例如特定的小区)内的其
           他受访者,非随机招募通常会导致样本不能覆盖整个调查区域。 比如,
           一项对 RDS 调查进行地理可视化的研究发现,尽管 RDS 样本的地理分
           布具有很强的异质性, 但一些关键地理区域仍被排除在外(Toledo,et
           al.,2011)。 不过,也有研究表明,非随机的 RDS 招募会带来地理偏差,
           但这种偏差对 RDS 估计有效性的影响微乎其微(Jenness,et al.,2014)。
           马克莱斯等( McCreesh,et al.,2012)通过绘制研究对象、种子和调查地
           点的位置地理图, 系统评估了 RDS 样本的质量, 发现有代表性的 RDS
           样本是覆盖了整个调查区域的。国内学者邱培媛等(Qiu,et al.,2012)同
           时采用 RDS 估计器和地理信息系统(GIS)技术对 RDS 样本质量进行诊
           断,进一步证实了马克莱斯等人的研究发现。
               金姆等(Kim,et al.,2020)创造性地利用经纬度信息构造地理凸壳                     3
           来表示受访者的招募范围,通过观察凸壳大小随调查时间的变化,来确
           定招募过程是始终发生在一个很小的区域,还是在不同的区域。 根据金
           姆等( Kim,et al.,2020)的观点,如果招募是在局部区域进行,那么某些
           样本链条很可能就无法跳出区域边界, 或者一些关键区域的受访者就
           没有被招募到,因此,RDS 的有效覆盖范围将大大少于实际的调查区域
           面积;如果招募是在整个调查区域进行的,则 RDS 的有效覆盖范围将
           接近实际的调查区域面积。 也就是说,通过观察凸壳的有效覆盖范围的
           变化趋势来评估样本是否存在局部区域招募的情况,以此诊断 RDS 样
           本的总体代表性。 不过, 使用经纬度信息来诊断样本数据也存在局限
           性。 出于隐私考虑,获得的经纬度信息一般比较粗糙,可能难以保证研
           究者观察到同一社区目标群体的网络是否真实连接的情况, 因为网络
           不相交的目标群体也可能占据相同的地理空间,因收入、教育水平、性
           别或种族(民族)的不同而分隔(Kim,et al.,2020)。
               以上简要回顾了国内外学者在诊断 RDS 估计有效性方面进行的
           重要工作。 总的来说,这些研究通常只关注到一种诊断方法,使用的诊断
           手段还比较单一,为此,本文以 RDS 抽样获得的四城市家政工人专题
           调查数据为例,综合使用 RDS 估计器、收敛图瓶颈图和经纬度信息,对

           3. 凸壳是指在二维平面上所有点构成的最小凸图形, 以往研究通常利用凸壳来确定动
           物的活动范围(Kim,et al.,2020)。

           · 220·
   222   223   224   225   226   227   228   229   230   231   232