Page 210 - 《社会》2022年第3期
P. 210

图形的逻辑力量:因果图的概念及其应用

                    第一,两变量间如果存在因果关联则能够带来相关性。当两变量之
                间存在因果关系时,“T 能够导致 Y”本身就意味着两者间存在相关性,
                而确定这一关系是因果推断的根本目标。 值得提及的是,因果图中两个
                变量间的因果关系可以直接用箭头线表示, 如图 1 左图中的 T→C 和
                C→Y;也可以是经中介变量传导的链状构型,如 T→C→Y 中,尽管间
                隔了变量 C,但 T 仍然是 Y 之“因”。 这在社会科学实证情境中也很常
                见,例如“学习能力→高考成绩→考入大学”之间,学生需要通过高考成
                绩进入大学,高考成绩在学业表现和考入大学之间充当了中介变量,但
                仍不妨碍较高的学习能力与考入较好的大学 之间具 有 清 晰 的 因果关
                联。然而,如果链状构型中存在中介变量,也存在产生偏差的可能,即对
                中介变量的过度控制( over鄄control)。这一情况指的是由于错误地控制了
                中介变量,阻断或削弱了变量间真实的因果效应。 表 1 中绘制了过度控
                制对应的因果图情况, 由于变量 A 与 C 之间的因果效应依赖 B 传导,
                控制变量 B 后即消除了 A 和 C 之间存在的关系,进而会错误估计 A 和
                C 之间不具有因果效应。
                    2. 混淆变量带来伪相关
                    第二,对应于叉状构型,当两变量间存在“共因”时,则在统计学上
                体现相关关系。 也就是说,尽管图 2(b)中 B、C 两变量之间不存在因果
                关系, 但由于同时受到混淆变量 A 的影响而表现出统计学相关性。 典
                型案例为俗语“一打雷就下雨”,从气象成因的角度,打雷并非下雨的原
                因;但如果记录打雷和下雨同时出现的频率,则呈现高度的相关。 这种
                相关性之所以存在,在于打雷和下雨具有相同的原因(如湿度达到一定
                水平形成积雨云等)。 对于希望确定变量间因果关系的实证社会科学研
                究来说,如不加分辨和处理,此类相关关系可能误导研究者得出两变量
                之间存在因果关系的结论,因而被称为伪相关(spurious association)。 这
                是因果推断中最常见的一种偏差来源。 此时,如表 1 所示,如果控制混
                淆变量 A,则 B、C 两变量间的相关性被消除。 其原因在于,既然变量 A
                是导致 B、C 之间存在相关性的原因, 那么将变量A 的信息引入系统
                后 , 相 当 于 将 样 本 按 照 变 量 A 的 取 值 划 分 为 特 定 数 量 的 小 组 , 对
                变 量 B、C 关系的探索发生于各小组内部。 此时,变量 A 的因素被消除,
                B、C 之间的伪相关将不复存在, 这也是定量研究中加入控制变量的原
                因所在。


                                                                          · 203·
   205   206   207   208   209   210   211   212   213   214   215