Page 108 - 《社会》2015年第2期
P. 108

必要与如何:基于历史资料的量化数据库构建与分析


   反映社会的变革与实际,所以我们选择分析家长职业而不是家庭出身。
       因此,尽管户籍和家庭出身信息非常容易被分类,且被许多主流社
   会抽样调查问卷采用,我们也确实对其进行了定量分析,但最终并没有
   在主体研究中采用和汇报结果。尤其需要注意的是,由于社会抽样调
   查强调问卷对全国不同地区和不同年龄人口的普遍适用性,其变量设
   置不免会更加注意简明直接的分类。大部分可供分析的相关信息都是
   以类似的形式出现,大部分采用这些数据的定量研究文献就不可避免
   地采用了这些分类的方式,成为主流。但这并不代表在有其他形式的
   材料和更丰富的信息时,我们应该僵化地沿袭既有分类,放弃更加细致
   的信息所带来的学术价值。所以,我们认为研究者必须注重社会的实
   际变迁,选取历史资料中最能提供翔实信息的变量设计与编码方式,而
   不能局限于已有的标准或研究习惯。当然,在最大化利用丰富信息的
   同时,重视研究设计和结果与已有研究,尤其基于不同材料类型的研究
   的可比性,同样是非常重要的。
       第三、对历史资料的灵活编码,还体现在根据具体研究问题的需
   要,对特定变量编码的宽严结合。学籍卡一类的材料,表格信息都由学
   生填写而来,大家对填写标准的认识程度参差不齐,内容自然五花八
   门,这给编码带来了很大难度。实际上,类似的情况非常普遍,自填型
   的社会问卷调查和其他信息收集方式同样不可避免,如果不谨慎处理,
   就可能会影响研究结果的准确性。就“无声的革命”研究而言,职业编
   码即是如此。学生在此处填写父母工作单位名称的有之,填写职务的
   有之,混合杂乱的亦有之。比如,对于职业编码分类中的第一大类“国
   家机关、党群组织、企业、事业单位负责人”或我们通俗称呼的“干部”,
   根据学生填写的信息种类,很多难以准确判断是负责人还是一般工作
   人员。很多学生填写了具体职务,如主任、队长、经理等,不结合更具体
   的信息根本无法弄清楚这些职务是否算得上负责人,因为太多不同等
   级和类型的单位可能存在这些头衔。如主任可能是中央机关的部门负
   责人,也可能是乡村的治保主任或妇女主任,性质完全不同。经理在改
   革开放后的经济活跃地区更是多如牛毛,任何一个单位的销售员、采购
   员都可以冠以此头衔,以便于他们的工作。
       考虑到大部分历史数据都无法如当代专门社会调查一样可以重新
   收集和确认信息,我们建议遵循的处理原则是在明确研究侧重点的基

                                                          · 1 0 1 ·
   103   104   105   106   107   108   109   110   111   112   113