Page 231 - 《社会》2022年第1期
P. 231
社会·2022·1
需的最长批次;rds 命令为主要的估算命令, 帮助估计样本的同质性程
度和均衡比例。 具体的语法操作可通过 help rds_network 和 help rds 获得。
2. 收敛图和瓶颈图
我们遵循吉尔等(Gile,et al.,2015)的做法,通过 Stata 15.0 软件实
现收敛图和瓶颈图方法的诊断,主要操作如下:
(1) 绘制累积收敛图和瓶颈图。 由于存在不同招募批次的受访者
在相同的时间进入调查, 以及相同招募批次的受访者在不同时间段陆
续进入调查,因此,在绘制累积收敛图和瓶颈图时,需要根据受访者参
与调查的时间顺序来计算分析变量的累积加权统计量。 累积收敛图显
示的是样本的加权统计量情况:在横轴上显示样本量,在纵轴上显示分
析变量的累积加权统计量,虚线为分析变量的收敛值。 累积瓶颈图类似
累积收敛图,但是按照种子链的情况进行绘制,以显示不同种子链之间
的差异。 为简洁起见,本文只提供了大部分样本的种子链(最多为三条
种子链)的收敛估计值变化情况。
( 2) 绘制滚动收敛图和瓶颈图。 为了解具有某些特征的受访者是
在何时招募到的,我们绘制了滚动收敛图和瓶颈图。 根据受访者参与调
查的时间顺序, 计算某一时间点上最近 25 名受访者的滚动加权统计
量。 25 这个数字是任意选择的,也可以选择其他数字,本质上只会改变
滚动趋势的平滑度,对诊断结果没有影响。 同样,滚动收敛图在横轴上
显示样本量,在纵轴上显示分析变量的滚动加权统计量,虚线为分析变
量的收敛值。 滚动瓶颈图与滚动收敛图类似,但按照种子链的情况进行
相应绘制。
3. 经纬度信息
我们借鉴金姆等(Kim,et al.,2020)的做法,通过 R 3.6.2 软件实现
经纬度方法的诊断,主要操作如下:
( 1) 利用经纬度信息构造凸壳并计算其面积。 本次调查收集了受
访者指定调查地点的经纬度信息, 这些指定的调查地点绝大部分是受
访者工作地点附近或住所附近的公共场所位置, 可以看作受访者的活
动区域。 根据这些经纬度信息,首先使用 R 包 grDevices 中的 chull 函数
将经纬度信息转换为地理坐标点;然后使用 ggplot2 包中的geom_polygon
函数将地理坐标点连接起来,构造出地理凸壳;最后使用GeoSphere 包
中的 areaPolygon 函数来计算凸壳面积(以平方公里为单位),用来表示
· 224·