Page 208 - 《社会》2014年第1期
P. 208
问卷调查质量研究:应答代表性评估
为代表性指标隐含了一个很强的假定,即应答总体的均值与无应答总
体的均值有恒定的差异。所以,应答率与应答偏差成反比,也即,应答
率越高,应答偏差越小。如果无应答是完全随机的,上述命题成立,应
答率就可以作为有效的代表性指标使用。
应答率在应用上有很多便利,既可以在不同调查之间进行比较,也
可以在同一调查的不同时间点进行比较。追求高应答率常常会影响数
据采集的策略及人力物力的投入。
第二类指标主要包括分组应答率( 犌狉狅狏犲狊 , 犅狉犻犮犽 , 犲狋犪犾. , 2008 )和
犚 指标(( 犛犮犺狅狌狋犲狀 , 犆狅犫犫犲狀犪狀犱犅犲狋犺犾犲犺犲犿 , 2009 )。这一类指标不仅要
用到样本是否应答的信息,同时还要借助样本框数据或并行数据进行
分组或建构模型。样本框数据是关于样本总体的数据,如人口特征、人
口密度、地区经济等统计结果,并行数据则来自数据采集过程,如联系
记录、访员观察和访问痕迹等。无论是对应答者还是无应答者,这些数
据都可以采集到,因而,可以用来分析应答者和无应答者在这些变量上
的区别。
分组应答率就是根据这些变量类别将样本分为若干子样本,计算
每 个 子 样 本 的 应 答 率,然 后 得 出 这 些 子 样 本 应 答 率 的 变 异 系 数
( 犮狅犲犳犳犻犮犻犲狀狋狅犳狏犪狉犻犪狋犻狅狀 )作为评估应答代表性的指标。系数越低,说明
应答样本越趋向于总样本在这些变量上的一个无偏的子样本。
犚 指标则要基于样本框数据和并行数据建构应答倾向模型,并根
据这个模型估计出每个样本的应答概率。应答概率的方差越小, 犚 指
标的数值就越大,也意味着应答样本的代表性越强。
第二类指标有三个优势。第一,其指标建构包含了更多的信息,而
且这些信息对于所有样本都是完整和无缺失的;第二,这类指标可以在
不同调查之间进行比较,其条件是这些调查具有相同的样本框,在指标
计算上要选取相同的样本框数据和并行数据;第三,这类指标也可以用
于同一调查不同时间点上的比较,条件也是计算时要选用相同的样本
框数据和并行数据。在数据采集过程中,组织者可以根据这些指标提
供的信息来调整工作策略,以求在各个子样本上取得平衡的应答效果。
这类指标的弱点也很明显。第一,分组或模型的建构依赖自变量
的选取,不同研究者采用不同的分组标准和模型建构会得出不同的结
果;第二,指标的质量还取决于数据质量,特别是在不同调查之间进行
· 2 0 1 ·