Page 209 - 《社会》2014年第1期
P. 209
社会· 2014 · 1
比较时,很难保证并行数据具有相同的质量;第三,这类指标只基于样
本框数据和并行数据,也隐含了一个很强的假定,即选用的样本框数据
和并行数据与调查主题的所有估计值密切相关。实际上,大多数调查
都不只包含一个主题,因而这个假定很难得到证实。
第三类指标在一定程度上针对的是第二类指标的第三个弱点。这
些指标从处理调查数据的缺失值入手,通过统计手段,利用样本框数据
和并行数据,或对辅助数据与调查数据的关系进行分析,或对事后权重
进行调整,或对缺失值进行插补,然后在这些分析结果的基础上评价应
答样本的代表性。
这类指标的例子很多,如辅助数据与调查变量的相关性( 犓狉犲狌狋犲狉 ,
犲狋犪犾. , 2010 )、事后权重与调查变量的相关性( 犗犾狊狅狀 , 2006 )、缺失信息
分值( 犉狉犪犮狋犻狅狀狅犳犕犻狊狊犻狀 犵 犐狀犳狅狉犿犪狋犻狅狀 , 犉犕犐 )( 犠犪 犵 狀犲狉 , 2010 )等。这一
类指标在计算上要相对复杂,而且会遇到第二类指标同样的问题,即模
型建构中变量的选取和数据质量问题。这些评价方法更多是建立在估
计维度基础上,会受到调查变量的影响,在不同调查间的比较和调查过
程的指导上具有局限性。
通过对上述应答代表性指标或评估方法的了解和比较,本文认为
犚 指标具有明显的优势。首先,相对于第一类指标中的应答率, 犚 指标
不仅有更强的理论依据,也借助样本框数据和并行数据,提升了指标的
信息量;其次,与同一类指标中的分组应答率相比, 犚 指标可以避免变
量在多类别多情况下的分组复杂性;第三,在计算难度和应用上, 犚 指
标也明显优于第三类指标,并能不受调查内容的影响,可以实现不同调
查项目的横向比较。同时, 犚 指标也不受变量值变动的影响,可以实现
同一项目在不同执行阶段的纵向比较。因此,在问卷调查中, 犚 指标有
很好的应用前景。
接下来将对 犚 指标的建构和应用进行详细介绍。
三、 犚 指标的建构
为进一步讨论 犚 指标对应答样本的代表性,首先要对概念进行界定。
(一)“应答代表性”的定义
“代 表 性 ”有 “强 ”和 “弱 ”两 个 定 义 ( 犛犮犺狅狌狋犲狀 , 犆狅犫犫犲狀 犪狀犱
犅犲狋犺犾犲犺犲犿 , 2009 ):如果目标总体中所有单元的应答概率完全相同并相
· 2 0 2 ·