Page 219 - 《社会》2022年第3期
P. 219
社会·2022·3
可通过控制 X 和 Y 1 加以阻断。 12 需要再次强调,因果图能够帮助研究
者规划解决联立性问题的思路,但能否实现则取决于数据的质量。
图 6:联 立 性 偏 差 表 达
基于以上讨论, 表 2 汇总了传统因果分析中内生性问题与因果图
中偏差类型的对应情况。 遗漏变量与自选择偏差均对应着因果图中的
混淆偏差。 样本选择偏差及其特例非随机缺失值归属于因不当控制碰
撞变量而诱发的内生性选择偏差。 联立性偏差本质上是数据质量问题,
但在因果图中通过角标区分时间次序也能予以表达。 最后,对中介变量
的故意控制多出现在机制探讨中,因而通常不被视为偏差的来源,但当
研究者对变量角色的认知不甚明确时, 也有 可能导 致 过度 控制问 题
( Schisterman,et al.,2009;Finn,et al.,2005)。
(二)因果图框架下的计量方法
现有因果推断方法主要解 决 因存 在混淆 变量导 致 的混 淆 偏 差 问
题。 基于混淆变量能否被观测到( observable/unobservable)需要采取不同
的对策。 当混淆变量能够被观测到,消除偏差的方法就是在系统中控制
这些混淆变量,常用做法包括多元回归和匹配;当存在无法被控制的混
淆变量时,研究者面临着更为复杂的情境,需要根据情况选择寻找代理
变量、实验或准实验、工具变量、面板模型、断点回归、双重差分等方法
( Morgan and Winship,2014;Wooldridge,2002;陈云松、范晓光,2011)。
其中, 多元回归与匹配或倾向值匹配的方法均通过在系统中控制
已 知 的 潜 在 影 响 因 素 来 消 除 混 淆 偏 差 。 因 此 , 尽 管 摩 根 和 温 什 普
(Morgan and Winship,2014:128) 将这两种途径区分为控制直接影响自
变量分配的因素和对影响因变量的其他因素进行分层, 但两种方法的
12. 如追溯到更早的阶段,潜在路径仍都会经过 Y 1。 Y 1 是 T 0Y 0 的碰撞变量,但不干扰 T 1
与 Y 2 的因果推断。
· 212·