Page 207 - 《社会》2022年第3期

P. 207

社会·2022·3

的统计推断形式。 4 这意味着，在因果图中各个变量没有特定类型或分
布的限定，可以是连续的、离散的、均质的、长尾的；同时，变量间的关
联也不存在特定的形式，在线性之外，也可能是幂率、二次、异质等其他
非线性相关。
再有，因果图也存在不同的细分类型，参考温什普等人的研究，本
文采用开环有向图（ directed acyclic graph，DAG）这种形式（Shrier and
Platt，2008）。所谓“有向”是指所有存在于两变量间的连线均以箭头指
明从因到果的方向；开环则是说任何一个以特定变量为“因”的变量，都
不会再指回到该变量，即因果图中不允许存在 T→Y→T 的形式。换言
之，任何变量不会同时成为自身的子代变量。这一规则背后的逻辑在
于，微观来看，任何“因”与“果”之间都存在先后次序，“因”必先于“果”
5
发生。这也意味着因果图无法直观地表现社会科学研究中常见的互为
6
因果问题（联立性偏误），如个体的身体健康程度和收入水平之间可能
存在相互促进的作用。但正如摩根和温什普（Morgan and Winship，2014：
80）所指出的，互为因果并不代表“因”与“果”真的同时发生，而是所使
用的实证材料无法区分变量发生的先后关系，其解决方式有赖于改善
实证材料、改进研究设计或改变问题假设。
进而言之，无论多么复杂的因果图，均由三种基本构型所组成。其
一为链状（ chain）构型，如图 2（a）所示，位于三个变量间的两处箭头线
方向均一致，变量 A 通过中介变量 B 充当了变量 C 的“因”，对应到图
1 左图中，X→T→C，T→C→Y，U→C→Y 均是典型的链状结构。其二为
叉状（fork）构型，如图 2（b）所示，即以同一个变量 A 为源头延伸出两条
箭头线，同时指向另两个变量 B 和 C，本文将其概括为“共因”结构。在
此情况下，作为另外两个变量共同之“因” 的变量 A 被称为混淆变量
（ confounder），在图 1 左图中，变量 X 对于 T 和 Y、变量 U 对于 C 和 Y 而
言均为混淆变量。其三为反叉状（inverted fork）构型，如图 2（c）所示，变
量 A 与 B 分别有箭头线指向变量 C，变量 C 即为 A 和 B 的“同果”，此

4. 关于因果图相较于路径图的优势，可参考摩根与温什普的著作（Morgan and Winship，
2014：84-90）。
5. 谢宇与邓肯曾讨论过“圣诞节前疯狂购物”看似先有“果”（购物）后有“因”（圣诞节），
但实质上“因”是人们对圣诞节即将到来的预期，在时间次序上仍然先于“果”（购物）。
6. 呈现时需要对同一变量指定角标以引入时间维度，详见后文。

· 200·

202 203 204 205 206 207 208 209 210 211 212