Page 204 - 《社会》2022年第3期
P. 204
图形的逻辑力量:因果图的概念及其应用
果推断的内生性问题(endogeneity problems)的来源和解决思路。 胡安宁
(2012、2016)和陈云松(2012)专题引介了工具变量、倾向值匹配等经典
方法。 同时,因果推断的实证应用也在中国学者的研究中不断积累(如
梁 玉 成 ,2010; 陈 云 松 等 ,2013,2014; 刘 伟 峰 等 ,2016; 张 春 泥 、 谢 宇 ,
2017; 程诚,2017; 梁玉成、 陈金燕,2019;Chen and Volker,2016;Chen
and Williams,2016;Chen,et al.,2019)。 近年来,国内学者进一步探讨了
将大数据、机器学习等新技术引入因果推断的路径(陈云松等,2020;胡
安宁等,2021;陈云松,2022;Chen,et al.,2021),这方面的探索已与国际
社会学前沿同步( Edelmann,et al.,2020)。
然而, 现有框架下对因果情境的理解和相关方法的阐释仍依赖于
大量的代数推导,对研究社会科学的学者和读者来说不甚友好,客观上
限制了因果推断思维在学科中的接受度和影响力。 更兼现实因果情境
往往十分复杂, 即使是经过系统训练的统计学家和计量学者在表达时
也难免疏漏,甚至积误相因、延及后学。例如,就哪些变量应当作为控制
变量纳入模型这一问题, 当前计量课堂上给出的建议多是基于该变量
相对于解释变量发生的时间来判断, 若该变量处在解释变量之前则最
好予以控制,当此变量发生在解释变量之后,则不应作为控制变量纳入
1
模型。然而,这样笼统的说法是失当的。 如能有一套直观而严谨的因果
问题表达方式,对于实证社会科学的传播和发展无疑是莫大的幸事。
事实上,的确存在一套这样的表达系统,直接用类似流程图的形式
来 阐 明 因果 。 这 就 是 最 早 由 计 算 机 科 学 家 、 图 灵 奖 得 主 朱 迪·珀 尔
(Judea Pearl)提出的“因果图”(causal graph)。 在社会学领域,摩根与温
什普(Morgan and Winship,2014)合著的因果推断教材《反事实与因果推
2
断》, 重点采用因果图与代数表达相结合的方式讨论不同情境下的因
果推断问题。 我们认为, 基于因果图的非 参 因果 推断(non鄄parametric
causal inference) 框架能够为广大人文社科研究者提供另一种审视因果
推断问题的有益视角,襄助对因果问题感兴趣者深入具体情境、明析偏
差来源、澄清惯有误读、培养因果思维。因此,本文将结合中文社会学界
对因果问题的已有讨论,系统性地引介这一分析框架。
本文第二部分将全面介绍因果图的基本概念与形式, 并说明链状
1. 后文对此有更详细的探讨。
2. 此为该书第二版,相较第一版(Morgan and Winship,2007)明显增加了涉及因果图的内容。
· 197·