Page 225 - 《社会》2022年第1期
P. 225
社会·2022·1
2
性 不足(Rudolph,et al.,2014)。 与结果相关的非随机招募受到招募者
网络特征、招募动态的影响,通常是一种基于兴趣结果的招募行为,比
如招募与自己类似的其他受访者;与地域相关的非随机招募则是一种从
特定地理区域招募受访者的招募行为,受访者倾向于局部区域招募,比
如受访者招募同区域的其他受访者。 如此,这两种非随机招募方式会导
致 RDS 样本不具有总体代表性, 以此样本进行的 RDS 估计可能是无效
的。
具体来说, 与结果相关的非随机招募会加剧样本组成对种子的依
赖性。 在 RDS 调查中,种子通常是通过方便样本来选择的,严重依赖种
子的 RDS 样本可能不具有总体代表性, 导致 RDS 估计无效。 尽管RDS
原理认为,只要招募批次足够长,种子选择是否随机无关紧要,样本组
成将独立于种子,生成有代表性的样本( Heckathorn,2002,2011;Salganik
and Heckathorn,2004;Volz and Heckathorn,2008)。但是,在非随机招募过
程中, 招募批次需要多长才能使最终样本摆脱对方便样本的依赖性尚
未有明确的认识,而且,在有限的样本量中,仅通过招募批次来解决种
子带来的影响可能是不明智的( Gile and Handcock,2010)。 吉尔和汉考
特(Gile and Handcock,2010)的模拟研究表明,RDS 链条的典型长 度 不
足以消除样本的种子依赖性,理论上,马尔可夫链可能需要数千次迭代
才能达到均衡收敛,而大多数 RDS 研究的招募波数都不到 20(Fellows,
2019)。 这样可以预见,在实际调查中,由于招募过程不随机,招募批次
不 长 , 种 子 特 征 很 可 能 会 影 响 最 终 的 样 本 特 征 (Gile and Handcock,
2010)。 也就是说,在样本量不大、招募批次不够长的情况下,非随机招
募的受访者特征可能与种子特征很相似,从而导致样本变异性不够,总
体代表性不足。
吉尔等( Gile,et al.,2015)另辟蹊径,提出使用一系列图形 方 法 来
诊断样本是否受到种子依赖的影响。 他们建议,利用受访者参与调查的
时间、所在链条批次等信息,对重要的分析变量绘制收敛图和瓶颈图。
样本收敛在统计上表现为向某一值靠近, 也就是说, 如果 RDS 样本消
除了对种子的依赖性,那么随着招募的继续,收敛图中的招募链条将聚
合到摆脱了种子依赖的总体估计值上, 表明样本不会因种子选择而产
2. 有 代 表 性 的 样 本 应 该 是 “样 本 统 计 量 能 代 表 总 体 所 呈 现 的 值 ”(刘 易 斯 - 伯 克 等 ,
2017:1171)。
· 218·