Page 231 - 《社会》2022年第1期
P. 231

社会·2022·1

           需的最长批次;rds 命令为主要的估算命令, 帮助估计样本的同质性程
           度和均衡比例。 具体的语法操作可通过 help rds_network 和 help rds 获得。
               2. 收敛图和瓶颈图
               我们遵循吉尔等(Gile,et al.,2015)的做法,通过 Stata 15.0 软件实
           现收敛图和瓶颈图方法的诊断,主要操作如下:
               (1) 绘制累积收敛图和瓶颈图。 由于存在不同招募批次的受访者
           在相同的时间进入调查, 以及相同招募批次的受访者在不同时间段陆
           续进入调查,因此,在绘制累积收敛图和瓶颈图时,需要根据受访者参
           与调查的时间顺序来计算分析变量的累积加权统计量。 累积收敛图显
           示的是样本的加权统计量情况:在横轴上显示样本量,在纵轴上显示分
           析变量的累积加权统计量,虚线为分析变量的收敛值。 累积瓶颈图类似
           累积收敛图,但是按照种子链的情况进行绘制,以显示不同种子链之间
           的差异。 为简洁起见,本文只提供了大部分样本的种子链(最多为三条
           种子链)的收敛估计值变化情况。
               ( 2) 绘制滚动收敛图和瓶颈图。 为了解具有某些特征的受访者是
           在何时招募到的,我们绘制了滚动收敛图和瓶颈图。 根据受访者参与调
           查的时间顺序, 计算某一时间点上最近 25 名受访者的滚动加权统计
           量。 25 这个数字是任意选择的,也可以选择其他数字,本质上只会改变
           滚动趋势的平滑度,对诊断结果没有影响。 同样,滚动收敛图在横轴上
           显示样本量,在纵轴上显示分析变量的滚动加权统计量,虚线为分析变
           量的收敛值。 滚动瓶颈图与滚动收敛图类似,但按照种子链的情况进行
           相应绘制。
               3. 经纬度信息
               我们借鉴金姆等(Kim,et al.,2020)的做法,通过 R 3.6.2 软件实现
           经纬度方法的诊断,主要操作如下:
               ( 1) 利用经纬度信息构造凸壳并计算其面积。 本次调查收集了受
           访者指定调查地点的经纬度信息, 这些指定的调查地点绝大部分是受
           访者工作地点附近或住所附近的公共场所位置, 可以看作受访者的活
           动区域。 根据这些经纬度信息,首先使用 R 包 grDevices 中的 chull 函数
           将经纬度信息转换为地理坐标点;然后使用 ggplot2 包中的geom_polygon
           函数将地理坐标点连接起来,构造出地理凸壳;最后使用GeoSphere 包
           中的 areaPolygon 函数来计算凸壳面积(以平方公里为单位),用来表示


           · 224·
   226   227   228   229   230   231   232   233   234   235   236