Page 244 - 《社会》2022年第1期
P. 244

被访者驱动抽样:基于多种方法的估计诊断

                    尽管四个城市的样本量、种子数和招募批次都非常不同,但无论是
                均衡比例估计、总体比例估计还是 Volz鄄Heckathorn 比例估计,均显示年
                龄和教育在同一城市样本中表现出较好的一致性估计。 三种不同的比
                例估计均与样本比例较为一致,说明此次 RDS 调查获得的样本比例较
                为准确地反映了总体情况,也从侧面证实了适度违反“随机招募假设”
                并不会影响 RDS 估计有效性。 基于 RDS 总体参数估计的结果表明,超
                过 80%的国内家政工人年龄在 40 岁以上,教育程度为初中及以下。

                     五、结论和讨论

                    鉴于国内学者对 RDS 估计有效性问题的普遍忽视,以及国外学者
                单一的诊断 RDS 估计有效性的方法, 本文利用四个城市家政工人的
                RDS 样本数据, 系统介绍了如何综合使用 RDS 估计器、 收敛图、 瓶颈
                图、经纬度等具体方法对违反“随机招募假设”导致的 RDS 估计有效性
                问题进行诊断。 结果表明,适度违反“随机招募假设”并不会给 RDS 估
                计带来严重偏差,基于这些样本获得的 RDS 估计仍然有效。 这一结论
                进一步印证和丰富了以往的研究发现 ( Jenness,et al.,2014;Aronow and
                Crawford,2015;Barash,et al.,2016)。 由于“随机招募假设”在实际调查过
                程中被普遍性违反,那么,如何判断假设违反是“适度”的呢? 对此,有
                必要从方法论角度来具体阐述。
                    第一,使用 RDS 估计器对样本的同质性水平和均衡收敛情况进行
                诊断,如果样本同质性水平低于 0.7,同时样本的特征比例能在 6 个招
                募批次内完成均衡收敛,我们就可以认为,此时的对“随机招募假设”的
                违反是适度的。 第二,绘制重要分析变量的收敛图和瓶颈图对样本组成
                的种子依赖性情况进行诊断, 当全部样本或者不同链条样本的累积收
                敛图、瓶颈图和滚动收敛图、瓶颈图均能显示样本最终在收敛值上聚合
                并稳定下来时,表明样本组成基本消除了种子依赖性。 我们认为,此时
               “随机招募假设”的违反是适度的。第三,利用经纬度信息构造出有效地
                理覆盖面积对样本是否来源于整个调查区域进行诊断, 当全部样本的
                有效地理覆盖面积基本接近整个调查区域面积时, 或者当不同种子链
                样本的有效地理覆盖面积尽管小于实际的调查区域面积, 但覆盖范围
                不重合且变化幅度较大时,表明绝大部分样本来自整个调查区域。 我们
                认为,此时“随机招募假设”的违反是适度的。


                                                                          · 237·
   239   240   241   242   243   244   245   246   247   248   249