Page 208 - 《社会》2014年第1期

P. 208

问卷调查质量研究：应答代表性评估

为代表性指标隐含了一个很强的假定，即应答总体的均值与无应答总
体的均值有恒定的差异。所以，应答率与应答偏差成反比，也即，应答
率越高，应答偏差越小。如果无应答是完全随机的，上述命题成立，应
答率就可以作为有效的代表性指标使用。
应答率在应用上有很多便利，既可以在不同调查之间进行比较，也
可以在同一调查的不同时间点进行比较。追求高应答率常常会影响数
据采集的策略及人力物力的投入。
第二类指标主要包括分组应答率（犌狉狅狏犲狊，犅狉犻犮犽，犲狋犪犾．，２００８）和
犚指标（（犛犮犺狅狌狋犲狀，犆狅犫犫犲狀犪狀犱犅犲狋犺犾犲犺犲犿，２００９）。这一类指标不仅要
用到样本是否应答的信息，同时还要借助样本框数据或并行数据进行
分组或建构模型。样本框数据是关于样本总体的数据，如人口特征、人
口密度、地区经济等统计结果，并行数据则来自数据采集过程，如联系
记录、访员观察和访问痕迹等。无论是对应答者还是无应答者，这些数
据都可以采集到，因而，可以用来分析应答者和无应答者在这些变量上
的区别。
分组应答率就是根据这些变量类别将样本分为若干子样本，计算
每个子样本的应答率，然后得出这些子样本应答率的变异系数
（犮狅犲犳犳犻犮犻犲狀狋狅犳狏犪狉犻犪狋犻狅狀）作为评估应答代表性的指标。系数越低，说明
应答样本越趋向于总样本在这些变量上的一个无偏的子样本。
犚指标则要基于样本框数据和并行数据建构应答倾向模型，并根
据这个模型估计出每个样本的应答概率。应答概率的方差越小，犚指
标的数值就越大，也意味着应答样本的代表性越强。
第二类指标有三个优势。第一，其指标建构包含了更多的信息，而
且这些信息对于所有样本都是完整和无缺失的；第二，这类指标可以在
不同调查之间进行比较，其条件是这些调查具有相同的样本框，在指标
计算上要选取相同的样本框数据和并行数据；第三，这类指标也可以用
于同一调查不同时间点上的比较，条件也是计算时要选用相同的样本
框数据和并行数据。在数据采集过程中，组织者可以根据这些指标提
供的信息来调整工作策略，以求在各个子样本上取得平衡的应答效果。
这类指标的弱点也很明显。第一，分组或模型的建构依赖自变量
的选取，不同研究者采用不同的分组标准和模型建构会得出不同的结
果；第二，指标的质量还取决于数据质量，特别是在不同调查之间进行

· ２０１ ·

203 204 205 206 207 208 209 210 211 212 213