Page 79 - 《党政研究》2026年第3期
P. 79
据,达到让证据自身说话的目的,使结论扎实有力。否则,缺乏数据或使用的数据存在缺
陷,任何观点都只是空谈甚至是误导。这种情况在司法实践中更为直观且重要。对于嫌疑
人是否有罪的审判,如果证据不足,就应当遵循疑罪从无的原则,若仅凭轻微的嫌疑便定
罪,将会制造大量的冤假错案。因此,重视数据实质上是极其重要的证据思维。在社会科
学研究中,应特别重视系统性的证据思维。有了证据思维和意识,研究者才可能会重视数
据的采集、管理和应用。
对于社会科学研究而言,其所依之根据、凭据大体经历了如下三个阶段的演进。
一是以史料证据为主的阶段,向已经发生的事实找证据。对于既往社会政治状况的研
究,我们往往不得不借助史料来展开研究。但史料是静态性数据,多是 “胜利者的记
录”,往往会发生 “幸存性偏差”问题。如对费孝通的名篇 《中国绅士》,弗兰兹·迈克
尔曾评论道,“这些关于民国时代有选择的描述与来自中国古籍的某些随想结合,并不能
代表对帝国时代绅士的研究” 。这正是对单纯依靠史料研究的批评。
〔 3〕
二是以实证数据为主的阶段,向现实即正在发生的事实找证据。这种证据是动态性数
据,具有可控制性、可监督性等特点,因而质量能有较好的保证。正如牛顿所言,在自然
科学里,应该像在数学里一样,在研究困难的事物时,总是应当先用分析的方法,然后才
用综合的方法。这种分析方法包括做实验和观察,用归纳法从中作出普遍结论,并且不使
这些结论遭到异议,除非这些异议来自实验或者其他可靠的真理方面 。受自然科学研究
〔 4〕
方法的启发,包括政治学在内的社会科学研究出现重大变化。18 世纪美国革命和建政的
政治家麦迪逊和汉密尔顿自认为是杰出的政治科学家,他们运用美国 13 个殖民地的实践
经验验证了孟德斯鸠、洛克等哲学家的理论思想,并在 《联邦党人文集》中极为自信地
写道,“政治学和其他大多数学科一样,已经大有进步。各种原理的效果,现在可以了解
得清清楚楚” 。至 19 世纪上半叶,托克维尔也呼吁,一个全新的世界,需要一新的政治
〔 5〕
科学 。人们将政治社会研究看作是科学研究,有关政治的知识被描述为一系列基于实证
〔 6〕
观察与逻辑推理、并与政治制度和政治事件相关的规律性因素的集合。由此,有关政治的
“科学”研究焕发出新的生机。学者们对于政治现象的本质揭示及其解释方式,越来越多
地建立在历史归纳的基础上,而不再基于人性的假设 。
〔 7〕
三是多维证据阶段。进入 20 世纪晚期以来,随着电子技术和人工智能的发展和进步,
以文本、话语与行动信息,线下与线上的多维海量数据为证据的新阶段得以出现。如今,
计算机技术高度发展,自动化技术日益强大,可直接应用于数据识别和采集工作。以往学
者难以想象的海量数据,那些极为多样化的数据资料,包括文本的、话语的与行动的数
据,涵盖线上的与线下的数据,现在可以借助机器自主、高速地采集。如哈佛大学加里·
金教授等人做过 FACEBOOK、网络监控方面的研究 ,就是借助网络数据的分析。近年,
〔 8〕
《美国经济学评论》刊发的一文使用 1980—2020 年长达 40 年间 218 个国家和地区的 120
万次民众抗议数据,“跑”出了 5 种新的经验模型。作者们还整理了 1990 年以来发表在顶
级经济学和政治学期刊上的与 “抗议”相关的研究成果。显然,此数据采集和整理的工
作量极为惊人,如不借助计算机和人工智能,单靠人力是难以想象的。
从上可见,作为证据思维出现以来数据采集的阶段性变化,田野调查与人工智能都是
人类对于信息识别与测量及其采集技术的迭代发展和进步,即从人力人工走向智能化,从
粗疏走向精细化,从面对面、实地接触走向虚拟空间,时间、空间、效率和成本均被大大
压缩。显然,信息的识别、测量与采集技术之发展并未止步。可以预测,随着技术的继续
发展和进步,数据证据的采集还将更为高效、立体和多元化。
二、高品质数据及其多元化采集方法
高品质的数据证据应是一个有机的整体,能明确而系统地向读者传递信息,达到可
“自身说话”的目的。所谓高品质数据,我以为应合乎七个标准。一是系统性原则,而非
偶发性、碎片化;二是关联性原则,即与核心观点直接或间接相关;三是多面向原则,可
形成证据链,相互链合、交叉验证,而非孤证;四是真实性原则,而非虚构或半真半假;
五是细节化原则,准确而具体,而非粗疏与模糊;六是规范化原则,即按逻辑整理编码,
方便检索和引述,而非杂乱无序;七是代表性原则,即可推论,优缺点清晰。显然,一项
7 8 · ·

