Page 215 - 《社会》2022年第3期
P. 215

社会·2022·3

           解这些问题。
               1. 遗漏变量偏差
               遗漏变量偏差指的是回归模型中存在本该被控制却未被控制的变
           量,与因果图中因混淆变量造成伪相关的情况相对应。 陈云松、范晓光
          ( 2010)曾在研究中举例,在探讨找关系和职场成功间的因果效应时,因
           未控制个体口才导致推断存在偏差。 基于因果图的框架不难发现,“个
           体口才”充当了混淆变量的角色。 如图 4(a)所示,根据经验推断,一个
           人的口才会影响其对社会关系的应用情况;同时,口才作为能力的一个
           维度,也会影响到个体是否能在职场上取得成功,这就形成了典型的叉
           状构型。 此时,即使假设找关系与职场成功之间不存在因果关系,但如
           果不控制混淆变量“个人口才”,也会因未能阻断解释变量和被解释变
           量之间的伪相关而得出“找关系能够影响职场成功”的错误结论。
               2. 自选择偏差
               自选择偏差同样归结于因果推断中的叉状构型。 自选择指的是个
           体因自身原因选择某些行为或参与到特定项目中, 即干预变量并非随
           机分配的。 伍德里奇( Wooldridge,2002:255)使用两个案例来说明自选
           择问题:在探讨个体饮酒行为对收入的作用时,伍德里奇强调可能存在
           一些个体特征,既决定了个体是否饮酒,又影响到个体的收入水平;其
           二为参与培训项目对学生成绩的影响, 学生能否参与培训项目与其家
           庭背景因素(如父母受教育程度、家庭收入水平等)有很大关系,而家庭
           背景又会影响到学生成绩。 这两个案例同样是因果图中典型的叉状构
           型。 陈云松、范晓光( 2010)在研究中强调自选择中被遗漏变量的非观测
           因素特征, 恰与文初变量标志定义相关。 仍使用 X 表示能够被观测到
           的变量,U 表示难以观测但同时影响解释变量和被解释变量的因素。 尽
           管面临的都是混淆变量干扰的问题,但相较于图 4(b),图 4(c)图中的
           伪相关更难消除。 因而,相较于一般的遗漏变量问题,自选择带来的偏
           差通常更难解决。
               3. 样本选择偏差与非随机缺失值
               样本选择偏差是相对更为复杂的一种情形。 陈云松、范晓光(2010)
           的研究将其解释为“因变量的观察仅仅局 限 于 某 个 有 限 的 非 随 机 样
           本”,即样本能否被观察到取决于其解释变量的取值,在计量教材中有
           时也被称为内生性样本选择 (endogenous sample selection)(Wooldridge,


           · 208·
   210   211   212   213   214   215   216   217   218   219   220