Page 216 - 《社会》2014年第1期
P. 216
问卷调查质量研究:应答代表性评估
表 3 : 犆犉犘犛2010 不同调查阶段访到的家户样本代表性测量
第一阶段 第二阶段 第三阶段
访到率( % ) 55.9 79.7 82.8
犚 指标 0.731 0.783 0.791
最大绝对偏差 0.240 0.136 0.126
无条件偏 犚 指标
区县人均 犌犇犘 0.064 0.071 0.069
区县非农人口比例 0.096 0.069 0.066
区县人口密度 0.068 0.073 0.068
村/居类型 0.105 0.088 0.084
村/居委会配合程度 0.067 0.050 0.051
访员性别 0.013 0.004 0.004
条件偏 犚 指标
区县人均 犌犇犘 0.017 0.016 0.016
区县非农人口比例 0.033 0.010 0.008
区县人口密度 0.021 0.020 0.018
村/居类型 0.041 0.039 0.037
村/居委会配合程度 0.037 0.021 0.023
访员性别 0.029 0.020 0.020
这一数值在第一阶段高达 0.240 ,而在第三阶段降低到 0.126 ,意味着这
些辅助性变量或并行数据在应答样本中的估计偏差明显降低。
我们可以从偏 犚 指标观察影响样本代表性的变量情况,主要有三
个发现:第一,这些变量的条件偏 犚 指标和无条件偏 犚 指标差异明显,
证明这些变量之间并不是彼此独立的,而是彼此关联的,这与常识相
符;第二,村/居类型在这些变量中是最有影响的,在所有三个阶段的影
响力中都是最强的,说明访问到的样本在不同类型的村/居内分布不均
衡;第三,随着调查进入后两个阶段,所有变量数据都有不同程度的降
低,其中区县非农人口比例表现最为显著,其条件偏 犚 指标从第一阶
段的 0.033 降至第三阶段的 0.008 ,这表明后期的访问明显提高了应答
样本在这些变量上的代表性,尤其是有效地弥补了前期访到样本在不
同非农人口比例地区的失衡。
我们还可以通过变量类别的偏 犚 指标考察应答样本在不同类别
上的代表性情况,其结果按照第三阶段的无条件偏 犚 指标从小到大排
序可参见表 4 。无条件偏 犚 指标如果呈现负值,表示此类别上的应答
样本代表性不足,需要增加该类别上应答样本比例。负值越小,表明需
· 2 0 9 ·