Page 246 - 《社会》2022年第1期
P. 246

被访者驱动抽样:基于多种方法的估计诊断

                仅限于某些区域时,研究者可以考虑在不同的区域添加更多的种子,或
                者要求受访者招募更多来自其他地点的人, 以改善局部区域招募带来
                的空间同质性问题。 但是,由于城市的整体结构和布局的差异,利用经
                纬度信息构造的凸壳面积并不是特别准确,而且,当调查正在进行时,
                研究者对凸壳面积的变化很难解释, 需要询问受访者更多额外的信息
                才能做出合理决策。此外,经纬度信息可能涉及受访者的隐私,因此,研
                究者需要考虑研究伦理,在数据获取和隐私保护方面做出平衡。
                     需要进一步要讨论的是,就抽样方法本身而言,目前 RDS 方法很
                难与经典的概率抽样设计竞争,如果可以构建相对较好的抽样框,并能
                接触到研究群体,选择传统的概率抽样是比较好的。 然而,如果方便抽
                样是对研究群体的唯一选择,那么 RDS 方法则是更好的选择,因为它
                可以提供近似随机的概率抽样。 RDS 看起来是一种相对容易实现的方
                法,实际上,该方法的严格假设在实际调查中经常被违反,需要研究者
                格外注意。 由于 RDS 既是数据收集方法,也是数据分析方法,因此,一
                旦使用 RDS 方法收集数据,就必须要对 RDS 估计进行诊断,只有在调
                查中同时使用了这两种方法才能称为 RDS。 然而,许多研究者往往在不
                了解 RDS 方法的情况下使用 RDS (Johnston,et al.,2016), 这就是 RDS
                被滥用的原因之一。
                    本文的局限在于,其一,由于家政工人群体属于无抽样框群体,无
                法获得真实的总体参数, 因此只能依赖不同诊断方法的相互印证来讨
                论各个诊断方法的优劣。 这种优劣是相对而不是绝对的,后续研究者可
                以结合真实的总体参数对不同 RDS 诊断方法进行分析,也许会得到更
                明确的结论。 其二,本文仅是对违反“随机招募假设”造成的 RDS 估计
                有效性问题进行诊断,而有效的 RDS 估计还要满足其他假设。 这些假
                设,如“替换抽样假设”“准确报告网络规模假设”等,在实际调查中也
                经常被违反,违反这些假设会对 RDS 估计造成什么影响也值得我们思
                考。 由于这些重要问题已经超出了本文的探讨范围,所以希望有研究者
                继续探索,为推动 RDS 抽样和统计估计发展作出贡献。

                参考文献(References)

                樊敏、张晓丽.2021.被访者驱动抽样法在中国退役运动员群体调查中的应用[J].成都体
                    育学院学报(1):112-117.


                                                                          · 239·
   241   242   243   244   245   246   247   248   249   250