Page 234 - 《社会》2022年第1期
P. 234
被访者驱动抽样:基于多种方法的估计诊断
看,尽管各子群年龄同质性水平也不高,但小于 40 岁的子群样本表现
出一定程度的异质性招募,这意味着,无锡和佛山中有一部分相对年轻
的家政工人倾向于异质性交往, 即表现出与年龄较大的家政工人的交
往偏好;从广州的样本来看,各子群年龄同质性水平差异较大,40 岁以
下的子群样本表现出一定的异质性招募,50 岁以上的子群样本表现出
较高同质性招募, 同质性程度达到 0.58, 这说明, 在广州的家政工人
中,年龄差异对人际交往选择影响较大,年龄较大的家政工人更倾向于
同质性交往,表现出强烈的与其他年龄较大的家政工人交往的偏好。
从样本的均衡收敛批次来看,无论是年龄变量还是教育变量,佛山
样本只需要 3 个批次就能均衡收敛, 南京和无锡的样本也只需要 4 个
招募批次就能达到均衡收敛; 广州样本在年龄方面需要 5 个批次均衡
收敛,在教育方面只需要 3 个批次就能均衡收敛。 均衡收敛意味着样本
比例保持了稳定, 即使后续有受访者加入也不会对样本比例变化产生
显著影响。 由于四个城市的样本均在 5 个招募批次内完成均衡收敛,说
明四个城市的样本同质性水平并不高,未造成样本难以均衡收敛的情况。
总之,从 RDS 估计器的诊断结果来看,本次 RDS 调查违反“随机招
募假设”并未导致严重的样本同质性问题,其同质性水平均在 RDS 估
计器可接受的阈值范围内, 而且四个城市的样本也均能在较短的批次内
实现均衡收敛。 因此,我们认为,以此样本进行 RDS 估计可能是有效的。
(二)收敛图和瓶颈图的诊断结果
但是,本次 RDS 样本毕竟是非随机招募而来,尽管同质性水平并
不高,样本也还是确实存在同质性问题。 那么,从样本质量角度来看,
这样的样本是否对总体具有代表性呢? 为此,我们进一步考察违反“随
机招募假设”对样本质量造成的影响。 考虑到年龄变量的同质性水平
相对较高, 我们着重对四个城市样本的年龄变 量 绘 制 收 敛 图 和 瓶 颈
6
图, 以便了解样本是否存在种子依赖。 图 3 是南京的样本情况,上半
部分为收敛图,分别是累积平均年龄收敛图(图 3-A)和滚动平均年龄
收敛图(图 3-B);下半部分为瓶颈图,分别是累积平均年龄瓶颈图(图
3-C)和滚动平均 年龄瓶 颈 图(图 3-D);图 中 虚 线 表示 平均 年龄的收
敛估计值。
6. 教育的收敛图和瓶颈图呈现的结果与年龄变量的收敛图和瓶颈图类似,由于篇幅所
限,本文没有报告这部分内容。 读者如有兴趣,可向作者索取。
· 227·