Page 222 - 《社会》2022年第1期
P. 222

被访者驱动抽样:基于多种方法的估计诊断

                    由于这些假设违反会影响 RDS 估计的有效性 (Abdesselam,et al.,
                2020), 从而容易使隐藏人群和无抽样框群体的研究出现重大失误,因
                此, 着手诊断假设违反对 RDS 估计造成的影响便显得非常重要且必
                要。 回应这一问题,不仅可以帮助研究者能够更好地理解 RDS 方法,而
                且对未来 RDS 抽样和统计估计的发展具有重要意义。
                    一些研究者已经关注到这一问题。 从检索结果看,2005—2020 年,
                有 100 多篇有关诊断和改进 RDS 估计的文献发表。 这些文献主要通过
                三种途径来诊断 RDS 估计的有效性(Gile,et al.,2015):第一,利用经典
                估计器对 RDS 样本的同质性水平进行诊断。 如果假设违反后的样本同
                质性水平仍处于估计器所允许的阈值范围内,则认为 RDS 估计是有效
                的。 第二,对 RDS 样本的总体代表性进行诊断。 如果假设违反未对 RDS
                样本质量造成显著威胁,也就是说,当 RDS 样本仍然可以代表总体情
                况时,获得的 RDS 估计也是可靠的。 第三,放松假设,开发一些新的对
                假设不那么敏感的 RDS 估计器,使用新的估计器对总体进行估计。 中
                国是使用 RDS 方法频率较高的国家之一(White,et al.,2015),但绝大部
                分诊断 RDS 估计的文献是国外学者的研究,国内学者更多停留在介绍
                和运用 RDS 方法等方面(刘石柱等,2005;赵延东、Pedersen,2007;张文
                宏、雷开春,2008,2009;梁玉成,2013),对诊断 RDS 估计有效性这一重
                要问题的关照还非常不够,亟须国内研究者对该问题做进一步探索。 而
                且,现有文献在诊断 RDS 估计的方式上还比较单一,通常只使用多种
                诊断方法中的一种,单一的诊断方式得到的诊断结果可能是片面的,甚
                至是有误的,也不能提供更多有关 RDS 的数据、抽样过程和估计的新
                认识,因此,也需要研究者对 RDS 估计的诊断做出较为综合的探索。 基
                于此,本文利用 RDS 获得的南京、无锡、广州和佛山四个城市家政工人
                样本数据,使用多种方法共同诊断 RDS 估计,以期丰富现有的诊断方
                法,并提供更多有关 RDS 估计的诊断细节,为促进 RDS 估计的标准化
                报告作出贡献,也为其他学科合理使用 RDS 方法提供借鉴。

                     二、文献回顾

                    本文重点关注“随机招募假设”违反导致的 RDS 估计有效性问题。
                之所以关注 “随机招募假设”,是因为该假设要求 RDS 的招募过程是随
                机发生的。 实际上,RDS 的整个招募过程完全由受访者主导完成,研究


                                                                          · 215·
   217   218   219   220   221   222   223   224   225   226   227