Page 205 - 《社会》2017年第1期

P. 205

社会· ２０１７ · １

狓１～犖（０，１）
狓２～犖（０，２）
狓３～犖（２，１）
狓４～犖（２，２）
狓５～犖（１，０．８）
狓６～犖（－１，３）
狓７，…，狓１２～犅狅（ κ ），其中 κ 是一个介于０．１到０．９之间的随机数。
狓１３～犘狅犻狊狊狅狀（ λ ＝０．１）
狓１４～犘狅犻狊狊狅狀（ λ ＝０．５）
狓１５～犘狅犻狊狊狅狀（ λ ＝１）
狓１６～犘狅犻狊狊狅狀（ λ ＝３）
狓１７～犘狅犻狊狊狅狀（ λ ＝５）
狓１８～犘狅犻狊狊狅狀（ λ ＝１０）
基于以上设定，我们产生了一个样本量为２０００的模拟数据。由
于狓１到狓１８都是用来估算倾向值的混淆变量，我们需要进一步设定倾
向值与处理变量的值。这里的倾向值通过逻辑斯蒂函数生成，其中每
个混淆变量的系数都服从介于－０．１到０．１之间的均匀分布。假设所
有混淆变量构成了一个２０００×８的矩阵犡，而系数 β 则是一个１８×１
犲狓狆β 犡）
（
的向量，则倾向值等于。由于倾向值代表了个体接受处理
（
１＋犲狓狆β 犡）
变量影响的概率，且处理变量是二分变量，因此，处理变量向量犜服从
犲狓狆β 犡）
（
以为发生概率的“伯努利分布”。基于这些信息，犜也可以
１＋犲狓狆β 犡）
（
被模拟出来。最后，我们生成因变量犢（这里的犢是２０００×１的向
量）。严格来讲，所有混淆变量犡和处理变量犜都会对犢产生影响，所
以我们在这里将犢写成犡和犜的线性函数。将犜与犡合并，得到一
个２０００×１９的矩阵犣。设这一矩阵的１９×１系数向量为 γ ，则犢＝
γ 犣。在不失一般性的前提下，可以假设 γ 服从均匀分布，且取值范围
在－１到１之间。在模拟出 γ 之后，我们就能够得到犢的取值。至此，
我们的模拟数据已经完成，其中包括因变量犢、自变量犜、倾向值得分
和１８个混淆变量。
基于上述的模拟数据，我们首先利用“贝叶斯模型平均法”考察模

· １９８ ·

200 201 202 203 204 205 206 207 208 209 210