Page 213 - 《社会》2022年第3期
P. 213
社会·2022·3
路满足以下条件时,则通路两端的变量之间不具有相关性:
(1)通路中存在一个被控制的混淆变量或中介变量(对应表 1 中“混
淆变量的消除偏差状态”和“过度控制的产生偏差状态”);
( 2)通路中存在未被控制的碰撞变量及其子变量(对应表 1 中“内
生性选择偏差的消除偏差状态”)。
此时称该通路被阻断,或实现了 D 分隔。 反之,当以上两条件均不
满足时,该通路为开启状态,两端的变量间存在相关性。由此可知,取决
于特定变量在某个通路中扮演的角色, 控制该变量对其所处的通路有
迥然不同的影响:当该变量为碰撞变量时,控制碰撞变量会开启原本被
阻断的通路;反之,控制并非碰撞变量的变量会关闭通路。
在因果推断过程中, 基于 D 分隔法则, 研究者需要阻断解释变量
和被解释变量间的所有非因果通路, 同时保障所有因果通路均为开启
状态。
本文参考格林兰等人(Greenland,et al.,1999)论文中一则因果图案
例并解释运用 D 分隔的具体分析过程。 9 如图 3 所示,假设 D 代表使用
社会关系,E 代表个体的收入,C 为个人魅力,A 为性格,B 为相貌颜值。
要测量使用社会关系是否影响到个体收入, 需要排除除了 D 直接到 E
的因果通路之外其他所有通路的干扰。 值得注意的是,此图中代表着个
人魅力的变量 C 本身是解释变量 D 与被解释变量 E 的混淆变量,又是
个体性格 A 和相貌 B 的碰撞变量, 而性格和相貌又与变量 D 和 E 相
关。 那么,要想测量出 D 和 E 之间的因果效应需要控制哪些变量呢? 首
先罗列 D 和 E 之间所有非因果 通路共 计 四条:(1)D←A→C←B→E,
( 2)D←A→C→E,(3)D←C←B→E,(4)D←C→E。 此时, 个体魅力 C
在通路 2、3、4 中分别为中介变量和混淆变量, 因而控制这一变量就能
够阻断这三条通路。 但问题在于,个体魅力又是通路 1 的碰撞变量,意
味着当控制个体魅力后反而会开启通路 1 并带来新的偏差。 因此,必须
寻找通路 1 中的中介变量或混淆变量来阻断该通路, 而个体性格 A 和
相貌 B 均满足该条件。 同时,由于变量 D 和 E 为直接因果关系,不存在
被过度控制阻断的可能。因此,就图 3 而言,需要同时控制变量 C 和 A,
9. 该因果图在格林兰等人的论文中被赋予了流行病学涵义,A 指空气污染水平、B 指个
体性别、C 为支气管反应、D 为抗组胺药物、E 为哮喘症状。 本文借用此因果图说明 D 分
隔的应用过程。
· 206·