Page 229 - 《社会》2022年第1期
P. 229
社会·2022·1
从表 1 可以看到,研究者在四个城市使用的种子数并不统一,在南
京、无锡、佛山各选择了 5 个种子,在广州选择了 8 个种子。 通过种子招
募的样本数最多的是广州和南京,在 300 个左右,其次是佛山和无锡,
分别为 201 个和 178 个。 各城市中不同种子间招募的样本数差异很大,
既有招募样本数超过总招募样本数 50%的“超级种”,也存在只招募到
1—5 个样本的“不良种”和没有招募到任何受访者的“不育种”。 各城市
招募批次平均为 5 个,最长招募批次超过 10 个,分别为无锡 11 个、佛
山 13 个、南京 14 个和广州 15 个。 总的来说,四个城市的家政工人的
RDS 样本量不大,招募批次也不长。
此外,我们还分析了家政工人的招募特征。 表 2 显示了家政工人同
区域、同工种招募模式的情况。 4 从地理区域看,南京、无锡和广州的家
政工人主要是跨小区招募而不是同小区招募, 不同工作类型的家政工
人的区域招募模式没有显著差异, 但佛山家政工人的区域招募模式存
在显著差异( p<0.001),与其他工作类型的家政工人相比,保洁员主要
是同小区招募而来;从工种来看,四城市的家政工人的工种招募模式存
在显著差异( p<0.001),具体而言,南京的月嫂、育儿嫂、家务员、保洁员
主要是工种内部招募,无锡和广州的月嫂、养老护理员,佛山的月嫂、育
儿嫂、保洁员,也都主要是同工种招募。
结合表 1 和表 2,我们可知,四个城市的 RDS 样本量有限,平均招
募批次不长,大多数家政工人都倾向于同工种招募其他受访者,部分家
政工人还存在同小区招募的情况。 因此,我们认为,本次调查在一定程
度上违反了“随机招募假设”,样本存在同质性问题。 由于 RDS 种子是
根据家政工人工作类型、 工作区域等特征选择的, 我们因此还可以认
为, 非随机招募也加剧了样本对种子选择的依赖和样本所覆盖的地理
区域不足等问题。 不过,此次 RDS 样本的同质性水平有多高,样本代表
性有多差,是否威胁了 RDS 的估计有效性,都不得而知。 为此,我们使
用 RDS 估计器、收敛图和瓶颈图、经纬度等方法来综合评估违反“随机
招募假设”造成的影响,进而完成对 RDS 估计有效性的诊断。
(二)方法操作说明
1. RDS 估计器
4. 同区域招募是指在同一小区的家政工人相互招募;同工种招募是指同工种的家政工
人相互招募。
· 222·