Page 104 - 《社会》2015年第2期
P. 104

必要与如何:基于历史资料的量化数据库构建与分析


   究和数据收集方法论体系基本上是 20 世纪中后期学科迅速发展的产
   物。绝大部分历史资料都早于这个阶段,而且绝大部分历史记录都并
   非为学术研究而存在,而往往是行政管理、商业交易、宗教风俗等各种
   社会经济制度的衍生品。这些现实共同决定了基于历史数据的学术研
   究几乎无法像许多当代定量研究那样事先制定详细的研究计划和步
   骤、设计具体变量和指标、确定特定研究对象和科学化收集相应信息。
   但是,无论是对历史数据,还是当代数据的研究,都是同等重要且互补
   的,其目的也更为一致,即如何通过有限的数据最大化地巩固已知或构
   建新知识。
       显然,历史数据的局限比当代数据要大得多。一方面,由于不是专
   为学术研究设计和收集,历史数据所包含的信息往往未必尽善尽美,并
   且无法重新收集。另一方面,更为现实的是,时至今日,很多历史资料
   都因各种原因没有得到完整留存或公开,导致数据缺失。可供分析的
   有效数据往往只局限在一定时期、一定地区或其他类型的局部个案。
       个案研究的逻辑往往成为应对历史数据所具有的各类现实问题的
   折中之策。首先需要说明的是,我们并不认同有学者强调的“标准的定
   量分析的基本前提是随机抽样”。随机抽样只是通过利用有限“个案”
   信息合理推论“总体”情况的一种收集信息和统计推论的方法,远非定
   量分析的全部或“基本前提”。各种基于“总体”数据直接进行分析的定
   量研究,如常见的基于人口普查微观数据的研究,就是反例。就受限于
   数据缺失的大规模量化微观数据“个案”研究而言,只要数据能全面系
   统覆盖这个“个案”(如某些地区、某些组织等)内的所有分析个体(如
   人、事件等),那么,这 些 数 据 记录 的就是 该“个案”自身所 定义的“总
   体”。基于“个案”数据应用各种定量分析工具得出的结果,对于这个
   “个案”本身是可靠和有效的。如需进一步基于“个案”数据结果对由
   “个案”组成的更高层面的“总体”(如一个包含很多地区的国家或包含
   很多组织的行业)进行推论,则需要研究者继续附加一定的分析和讨
   论,不能直接将“个案”的经验等同于“整体”的经验。前文提到,留存下
   来或可供分析的历史数据往往比较“随意”且原因复杂,若将这些可供
   分析的历史数据作为“个案”,那么这些“个案”往往不具有对“整体”的
   统计代表性,因为它们并非由严格意义上的随机抽样来确定,但这不等
   于不可以用个案分析的结论来推论总体状况。实际上,有学者已经指

                                                           · 9 7 ·
   99   100   101   102   103   104   105   106   107   108   109