Page 205 - 《社会》2022年第3期
P. 205
社会·2022·3
(chain)、叉状(fork)和反叉状(inverted fork)三种因果图的基础构型。 在
第三部分,我们将区分不同构型通路对应的开启和阻断规则,并阐明在
因果图框架下因果推断的三大偏差来源(未控制混淆变量、过度控制中
介变量、错误控制碰撞变量)。在第四部分,本文尝试将因果图分析框架
与当前主流因果分析系统进行兼容:使用因果图阐释包括遗漏变量、样
本选择、自选择及联立性偏误在内的四种内生性问题;使用因果图呈现
多元回归与匹配、代理变量、实验、工具变量、面板模型等因果推断方法
的运行机制。 第五部分则基于因果图框架澄清一些因果分析中的常见
误读。
二、因果图的概念和要素
因果图最早由计算机科学家、图灵奖得主朱迪·珀尔(Judea Pearl)
提出,并在不同领域学者们的共同努力下逐步发展和完善,其中计算机
科 学 与 流 行 病 学 相 关 学 者 的 贡 献 最 为 突 出 (参 考 Greenland,et al.,
1999;Hernán and Robins,2020;Pearl,2009)。 社会学家摩根、温什普等人
(Elwert and Winship,2014;Morgan and Winship,2014)较早意识到因果图
在理解因果问题中的重要价值, 并致力于在社会科学领域推广这一方
法。 然而,迄今为止,因果图在社会科学领域获得的关注尚少(现有的一
些介绍性讨论分散在不同学科,包括 Marcus,et al.,2018;Montgomery,et al.,
2018;Rohrer,2018 等),也未曾引起国内社会学界的注意。
事实上,社会科学研究者对因果图背后的逻辑和动机并不陌生。因
果图通过节点、 线段和箭头三种元素的组合以图像化的方式直观呈现
不同变量间的关联, 在形式上与 20 世纪 90 年代流行的基于结构方程
模型的路径图(path diagram)类似(Spirtes,et al.,1998)。 此外,很多学者
习惯在日常讨论中用点线图辅助表达分析思路, 尽管这些图示往往不
呈现在正式的论文里,仍然是实证研究过程中的重要一环。 朱迪·珀尔
等学者则通过定义明确的规范和逻辑,将这些随手摹绘的“示意图”化
用为因果分析的利器。
(一)因果图的元素构成与基本构型
因果图由三项元素构成:节点、线段和箭头。 首先是代表特定变量
的节点,本文统一使用 T 表示解释变量(干预变量),Y 表示被解释变量
(效应),X 表示信息可被获取的相关变量,U 表示信息不可获取的相关
· 198·