Page 223 - 《社会》2022年第3期
P. 223
社会·2022·3
基于的理由和导致的后果却明显不同。 当出现(b1)中的情况时,此时 B
是 T 和 Y 的碰撞变量,控制 B 会导致 T→B←Y 通路开启,造成 T 和 Y
之间的伪相关,影响对两者间真实因果关系的判断。 但是,这种影响的
方向和程度依赖于具体情境,无法一概而论。 而在( b2)情境中,B 作为
中介变量介导了一部分由 T 到 Y 的因果效应,控制变量 B 后会导致对
T 与 Y 之间真实因果效应的低估———在这一情况下“控制变量 B 将分
散自变量的回归系数”的说法才会成立。 研究者在聚焦于对具体机制的
探索时, 有时会刻意选择控制中介 变 量来 区 分 直 接 和间 接 因 果效 应
( Pearl,2012)。
此外,值得澄清的一点是,仅基于解释变量或被解释变量一边做出
的样本选择并不会导致偏差的产生。 图 8(a)中控制变量 B 的做法可被
视为对解释变量 T 进行了选择, 但由于这种选择与变量 Y 不产生直接
的关系而不会影响到 T 与 Y 之间的因果效应, 伍德里奇(Wooldridge,
2002:325)称此为外生性样本选择(exogenous sample selection)。 不妨用
一种理想化的极端情况进行说明:图 8(c)中分别以是否下雨和彩票中
奖为干预和效应, 而这两者本身是不存在任何关联的。 14 控制干预为
“下雨天”不会影响彩票中奖的概率;控制效应为“中奖”的条件下,当
天是否下雨也与具体的彩票获奖金额无关。 现实情况中,基于解释变量
或被解释变量的选择往往会对因果推断造成影响, 其本质在于这些选
择会以某种方式影响到另一边,而非真正的完全无关。
2. 控制干预前变量可能引起偏差
尽管流行观念认为当特定变量发生在解释变量之前时, 应当在系
统中加以控制以消除偏差,但这样的操作同样存在风险。 事实上,一些
碰撞变量同样可能发生在解释变量之前,如果不加甄别,会诱导内生性
选择偏差。 埃尔韦特与温什普(Elwert and Winship,2014)采用一项社会
网络案例加以说明。
图 8(d)希望探讨个体 j 在时间 1 的社会参与是否会影响到与其熟
识的个体 k 在时间 2(时间 1 之后)的社会参与程度。 其中 U 代表相关
个体特性如外向程度,这种特性显然会影响到个人交友情况,同时影响
到个人的社会参与情况;F i,j 代表两个体间存在社会关系, 这种关系发
生在观测时间 1 和 2 之前。 此时,即使假设 Y j1 与 Y k2 不具有直接的因果
14. 视彩票开奖为完全随机过程。
· 216·