Page 113 - 《社会》2015年第2期
P. 113
社会· 2015 · 2
不可靠。 10 因此,众多基础的“史实”在当下中国可能都需要学者们努力
“重建”一番(茅海建, 2005 :自序)。
构建量化历史数据库和定量分析的研究模式是在明确研究方向和
研究问题的基础上,以“大数据”为驱动,发现社会实际与证实/修正社
会理论并重。定量分析不应只是对数据单纯地简单描述统计和相关分
析,而应以理论为导向从大规模数据中发现“已知”和“未知”规律并回
应、补充或 升 华 已 有 理 论 的 有 效 工 具 ( 犅狅狅狀狊狋狉犪 , 犅狉犲狌狉犲犪狀犱犇狅狅狉狀 ,
2006 )。西方主流学界已经意识到大数据分析是非常重要的学术工具
( 犅犻 犵犇犪狋犪犻狊犪犅犻 犵犇犲犪犾 ),能提升众多学科的研究模式与深度( 犛犺犪狑 ,
2014 )。量化数据库构建和定量分析使得部分历史研究从“解读分析特
定历史文献和档案的历史研究经典模式向收集、整理和统计分析系统
成规模的历史记录数据的社会科学研究模式转变”( 犃狀犱犲狉狊狅狀 , 2007 ),
通过全面的大数据分析寻找出相关现象或规律。同时,更多的大规模
历史数据,以及更多历史学家在定量方面学术意识的提高,对社会科学
更深入地研究各种社会、经济、人口方面的长期演变大有裨益。大规模
微观数据库一般包含了某一范围内大部分或所有分析个体的状况,而
且不同于抽样数据,可以允许通过个体层面数据对当时的宏观层面社
会环境信息进行一定程度的复原。现有统计分析方法可以兼顾个体分
布的影响与权重,还可以估计个体、组织和整体等不同社会层面特点的
影响和互动,从而在帮助历史学者避免选择材料时的疏漏与偏废的同
时,还可以帮助社会科学学者拓宽研究领域和视角,更加全面地理解许
多经典议题和当代问题。
当然,必须强调的是,正如前文所论述的那样,构建历史数据库并
开展量化研究绝非易事。一方面,构建量化数据库通常包括数据采集、
数据分类、数据编码、数据存储、数据信息挖掘和定量分析等多个环节,
数据库建成后还可能需要数据管理和维护等多种工作。相对于这种以
数据为中心的“科学化”、“电子化”的研究方式,“传统史学研究多少显
得有些手工艺式的陈旧”( 犅犲狊狋 , 1991 ),这使得当下很多史学研究者很
难掌握这一研究方法。因此,尽管很多历史学学者也承认量化分析可
10. 李伯重( 2002 : 110-121 )指出前者是指“从有关材料中选取一两种据信是最重要或最有
‘代表性’的,以此为据来概括全面”;后者是指在研究“一个较长时期或一个较大地区中的重
大历史现象时,将与此有关的各种历史资料尽量搜寻出来加以取舍,从中挑选出若干最重要
或最有代表性的,集中到一起,合成一个全面性证据,以求勾画历史现象的全貌”。
· 1 0 6 ·