Page 209 - 《社会》2014年第1期
P. 209

社会· 2014 · 1

   比较时,很难保证并行数据具有相同的质量;第三,这类指标只基于样
   本框数据和并行数据,也隐含了一个很强的假定,即选用的样本框数据
   和并行数据与调查主题的所有估计值密切相关。实际上,大多数调查
   都不只包含一个主题,因而这个假定很难得到证实。
       第三类指标在一定程度上针对的是第二类指标的第三个弱点。这
   些指标从处理调查数据的缺失值入手,通过统计手段,利用样本框数据
   和并行数据,或对辅助数据与调查数据的关系进行分析,或对事后权重
   进行调整,或对缺失值进行插补,然后在这些分析结果的基础上评价应
   答样本的代表性。
       这类指标的例子很多,如辅助数据与调查变量的相关性( 犓狉犲狌狋犲狉 ,
   犲狋犪犾. , 2010 )、事后权重与调查变量的相关性( 犗犾狊狅狀 , 2006 )、缺失信息
   分值( 犉狉犪犮狋犻狅狀狅犳犕犻狊狊犻狀 犵 犐狀犳狅狉犿犪狋犻狅狀 , 犉犕犐 )( 犠犪 犵 狀犲狉 , 2010 )等。这一
   类指标在计算上要相对复杂,而且会遇到第二类指标同样的问题,即模
   型建构中变量的选取和数据质量问题。这些评价方法更多是建立在估
   计维度基础上,会受到调查变量的影响,在不同调查间的比较和调查过
   程的指导上具有局限性。
       通过对上述应答代表性指标或评估方法的了解和比较,本文认为
   犚 指标具有明显的优势。首先,相对于第一类指标中的应答率, 犚 指标
   不仅有更强的理论依据,也借助样本框数据和并行数据,提升了指标的
   信息量;其次,与同一类指标中的分组应答率相比, 犚 指标可以避免变
   量在多类别多情况下的分组复杂性;第三,在计算难度和应用上, 犚 指
   标也明显优于第三类指标,并能不受调查内容的影响,可以实现不同调
   查项目的横向比较。同时, 犚 指标也不受变量值变动的影响,可以实现
   同一项目在不同执行阶段的纵向比较。因此,在问卷调查中, 犚 指标有
   很好的应用前景。
       接下来将对 犚 指标的建构和应用进行详细介绍。
       三、 犚 指标的建构


       为进一步讨论 犚 指标对应答样本的代表性,首先要对概念进行界定。
       (一)“应答代表性”的定义
       “代 表 性 ”有 “强 ”和 “弱 ”两 个 定 义 ( 犛犮犺狅狌狋犲狀 , 犆狅犫犫犲狀 犪狀犱
   犅犲狋犺犾犲犺犲犿 , 2009 ):如果目标总体中所有单元的应答概率完全相同并相

    · 2 0 2 ·
   204   205   206   207   208   209   210   211   212   213   214