Page 201 - 《社会》2017年第1期
P. 201
社会· 2017 · 1
“总结”成为一个数值,即倾向值。那么,又何必对这些混淆变量进行
“挑选”呢?这一问题的答案在于,如果混淆变量过多,其彼此之间会产
生虚假关联( 犉犪狀 , 犲狋犪犾. , 2014 ),此时,未经挑选的模型所估计出来的
倾向值可能会有很高的均方误( 犿犲犪狀狊 狇 狌犪狉犲犲狉狉狅狉 ),从而带来倾向值
估计上的问题。正因为如此,一般而言,对于存在大量混淆变量的情
形,我们仍需要采用某种手段确定哪些混淆变量值得放进倾向值模型,
这也是模型选择的题中之意。
在考察了模型形式的不确定性之后,我们接下来讨论如何处理系
数的不确定性。在倾向值方法中,系数不确定性涉及两个模型:预测倾
向值得分的倾向值模型与计算处理效应的结果模型。这是因为在表达
式( 2 )中,我们估计的 γ 和 β 都有各自的置信区间,因此,参数的不确定
性需要将这两个系数的置信区间同时考虑在内。这一分析过程主要是
犼
通过 对 倾 向 值 模 型 和 结 果 模 型 的 似 然 方 程 进 行 联 合 估 计 ( 狅犻狀狋
犲狊狋犻犿犪狋犻狅狀 )实现的。顾名思义,联合估计要求我们同时估计 γ 和 β 。
这就要求我们写出包含 γ 和 β 的似然方程,并将其合并起来。假设决
定处理效应的过程与决定结果变量的过程独立,预测倾向值的逻辑斯
蒂回归模型的似然方程就可以表示为:
(
(
∏ i =1[ ex pγ U ) X i 1- ex pγ U ) 1 -X i ( 6 )
( ]
( ]
1+ex pγ U ) [
n
L X = 1+ex pγ U )
其中, 犡 是一个二分的处理变量,其他参数的含义参见上文。同理,我
们也能够写出计算处理效应的结果模型的似然方程。如果 犢 是一个
连续型变量,我们可以假设其服从正态分布。如果其为二分型变量,我
们假设 犢 服从“伯努利分布”。此时,似然方程可以写成:
( Y - β X ) 2
烄 n 1 e - i 2 i ,如果 Y ~ N ( X , σ )
2
∏ i =1 2 σ β
槡π
σ 2
(
(
1+ex pγ U ) [
( ]
∏ i =1[ ( ] 1- 1+ex pγ U )
L Y烅 n ex pγ U ) Y i ex pγ U ) 1 -Y i , ( 7 )
( X )
如果 Y ~ Bernoulli ( ex p β )
( X )
烆 1+ex p β
由于我们之前已经假设了两个似然方程彼此独立,因此,联合似然
方程二者的乘积为:
( 8 )
L= L X ×L Y
联合估计之所以能够处理系数估计的不确定性,是因为在联合估
· 1 9 4 ·