Page 216 - 《社会》2014年第1期
P. 216

问卷调查质量研究:应答代表性评估


            表 3 : 犆犉犘犛2010 不同调查阶段访到的家户样本代表性测量
                               第一阶段       第二阶段        第三阶段
        访到率( % )                55.9        79.7       82.8
        犚 指标                     0.731      0.783       0.791
        最大绝对偏差                   0.240      0.136       0.126
        无条件偏 犚 指标
          区县人均 犌犇犘               0.064      0.071       0.069
          区县非农人口比例               0.096      0.069       0.066
          区县人口密度                 0.068      0.073       0.068
          村/居类型                  0.105      0.088       0.084
          村/居委会配合程度              0.067      0.050       0.051
          访员性别                   0.013      0.004       0.004
        条件偏 犚 指标
          区县人均 犌犇犘               0.017      0.016       0.016
          区县非农人口比例               0.033      0.010       0.008
          区县人口密度                 0.021      0.020       0.018
          村/居类型                  0.041      0.039       0.037
          村/居委会配合程度              0.037      0.021       0.023
          访员性别                   0.029      0.020       0.020

   这一数值在第一阶段高达 0.240 ,而在第三阶段降低到 0.126 ,意味着这
   些辅助性变量或并行数据在应答样本中的估计偏差明显降低。

       我们可以从偏 犚 指标观察影响样本代表性的变量情况,主要有三
   个发现:第一,这些变量的条件偏 犚 指标和无条件偏 犚 指标差异明显,
   证明这些变量之间并不是彼此独立的,而是彼此关联的,这与常识相
   符;第二,村/居类型在这些变量中是最有影响的,在所有三个阶段的影
   响力中都是最强的,说明访问到的样本在不同类型的村/居内分布不均
   衡;第三,随着调查进入后两个阶段,所有变量数据都有不同程度的降
   低,其中区县非农人口比例表现最为显著,其条件偏 犚 指标从第一阶
   段的 0.033 降至第三阶段的 0.008 ,这表明后期的访问明显提高了应答
   样本在这些变量上的代表性,尤其是有效地弥补了前期访到样本在不
   同非农人口比例地区的失衡。
       我们还可以通过变量类别的偏 犚 指标考察应答样本在不同类别
   上的代表性情况,其结果按照第三阶段的无条件偏 犚 指标从小到大排
   序可参见表 4 。无条件偏 犚 指标如果呈现负值,表示此类别上的应答
   样本代表性不足,需要增加该类别上应答样本比例。负值越小,表明需

                                                          · 2 0 9 ·
   211   212   213   214   215   216   217   218   219   220   221