Page 217 - 《社会》2014年第1期

P. 217

社会· ２０１４ · １

要增加的应答样本比例越高。如果呈现正值，则意味着该类别被过度
代表，正值越大，过度代表的程度越大。因此，那些拥有较低的负向无
条件偏犚指标和较高的条件偏犚指标最应引起调查执行人员和研究
人员的注意。
在变量的偏犚指标上，我们已经发现，村／居类型对应答样本代表
性的影响较大，表４更是清楚地显示，这一变量中处于城市的村／居的
应答样本呈现代表性不足的状况，其影响在所有调查阶段和所有变量
类别中居于首位。与其对应的是处于农村的村／居样本被过度代表，其
影响也比其他变量类别大。
除了城市的村／居，区县犌犇犘大于或等于４００００元，区县人口密
２
度大于等于１６００人／犽犿，区县非农人口比例在０．８和１之间，村／居
委会配合程度很少的子样本的应答代表性也相对不足，这些都反映了
目前中国抽样入户调查的困难主要集中在具有这些特征的地区。
此外，变量类别对于应答代表性的影响力在不同的调查阶段也不
相同，这表现在表４中三个阶段变量类别的不同排序上。如区县犌犇犘
大于或等于４００００元的变量类别在第一阶段的影响力位居第５，而到
访问全部结束时，其影响力上升至第２。这表明，后期调查访问的样本
较多集中在区县犌犇犘小于４００００元的地区，加重了前者的代表性不
足问题。同时我们也发现，区县非农人口比例在０．８和１之间的变量
类别的影响力从第一阶段的第２降到采访结束时的第４，说明后期的
调查在这类地区访到了较多的样本，在一定程度上增加了应答样本的
代表性。
（三）犚指标的作用
在犆犉犘犛２０１０年的初访调查中，我们是在调查结束后开始计算犚
指标的。事后计算的好处在于，变量选取时更为谨慎，一方面可以从
所有获取数据中有效筛选相关分类变量，另一方面对所选变量的数据
质量也有全面认识。通过对犚指标及其辅助指标结果的分析，我们可
以对调查数据的代表性有更深入的了解，并为数据使用者提供重要的
参考信息。同时，因为犆犉犘犛是跟踪调查，我们也可以从初访调查中吸
取经验和教训，有针对性地制定管理方案，提高一些子样本的代表性，
应用到下一轮的跟踪调查中。

· ２１０ ·

212 213 214 215 216 217 218 219 220 221 222