Page 205 - 《社会》2017年第1期
P. 205
社会· 2017 · 1
狓1 ~犖 ( 0 , 1 )
狓2 ~犖 ( 0 , 2 )
狓3 ~犖 ( 2 , 1 )
狓4 ~犖 ( 2 , 2 )
狓5 ~犖 ( 1 , 0.8 )
狓6 ~犖 ( -1 , 3 )
狓7 ,…, 狓12 ~犅狅 ( κ ),其中 κ 是一个介于 0.1 到 0.9 之间的随机数。
狓13 ~犘狅犻狊狊狅狀 ( λ =0.1 )
狓14 ~犘狅犻狊狊狅狀 ( λ =0.5 )
狓15 ~犘狅犻狊狊狅狀 ( λ =1 )
狓16 ~犘狅犻狊狊狅狀 ( λ =3 )
狓17 ~犘狅犻狊狊狅狀 ( λ =5 )
狓18 ~犘狅犻狊狊狅狀 ( λ =10 )
基于以上设定,我们产生了一个样本量为 2000 的模拟数据。由
于 狓1 到 狓18 都是用来估算倾向值的混淆变量,我们需要进一步设定倾
向值与处理变量的值。这里的倾向值通过逻辑斯蒂函数生成,其中每
个混淆变量的系数都服从介于 -0.1 到 0.1 之间的均匀分布。假设所
有混淆变量构成了一个 2000×8 的矩阵 犡 ,而系数 β 则是一个 18×1
犲狓 狆β 犡 )
(
的向量,则倾向值等于 。由于倾向值代表了个体接受处理
(
1+犲狓 狆β 犡 )
变量影响的概率,且处理变量是二分变量,因此,处理变量向量 犜 服从
犲狓 狆β 犡 )
(
以 为发生概率的“伯努利分布”。基于这些信息, 犜 也可以
1+犲狓 狆β 犡 )
(
被模拟 出 来。最 后,我 们 生成 因变 量 犢 (这里 的 犢 是 2000×1 的 向
量)。严格来讲,所有混淆变量 犡 和处理变量 犜 都会对 犢 产生影响,所
以我们在这里将 犢 写成 犡 和 犜 的线性函数。将 犜 与 犡 合并,得到一
个 2000×19 的矩阵 犣 。设这一矩阵的 19×1 系数向量为 γ ,则 犢=
γ 犣 。在不失一般性的前提下,可以假设 γ 服从均匀分布,且取值范围
在 -1 到 1 之间。在模拟出 γ 之后,我们就能够得到 犢 的取值。至此,
我们的模拟数据已经完成,其中包括因变量 犢 、自变量 犜 、倾向值得分
和 18 个混淆变量。
基于上述的模拟数据,我们首先利用“贝叶斯模型平均法”考察模
· 1 9 8 ·