Page 211 - 《社会》2017年第1期
P. 211
社会· 2017 · 1
验数据中是否也能够成立呢?下面的分析将对这一问题进行探索。
六、基于经验数据的示例
这里的经验分析利用“中国综合社会调查” 2010 年的数据,讨论的
问题是高等教育是否对个人的自评健康产生积极的促进效果(胡安宁,
2014 ; 犎狌 , 2014 )。由于高等教育的接受过程本身涉及样本的选择性,
因此,在分析教育和健康关系的时候,需要通过特定的统计手段对个体
接受高等教育的概率差异进行控制。但是,究竟哪些因素会影响个体
进入大学的概率呢?这一问题很难通过现有理论进行回答。经济学家
通常会将父母的教育水平作为工具变量来分析子女教育成就的社会效
果( 犎犲犮犽犿犪狀犪狀犱犔犻 , 2004 )。除了父母的教育成就之外,父母还会体现
出其他的社会特征,例如职业、政治身份和单位性质。那么,我们在估
计子女进大学概率的时候有没有必要在考虑父母教育水平之外还考虑
这些社会特征呢?这一问题并没有固定的答案。通常,研究者可能根
据自身的研究习惯和理论取向对混淆变量进行取舍,从而引起模型形
式的不确定性问题。
在这里,我们首先拟合一个模型,利用性别、民族和父母的教育水
平来计算倾向值得分。之后,我们采用“贝叶斯平均法”来考察模型形
式的不确定性(参见表 3 )。通过表 3 可以发现,除了父母的教育水平
之外,父母的很多其他社会特征也会对子女的教育成就产生影响,例
如,父母的单位性质和父亲的政治身份,这些变量的不为零概率都达到
了 1 。相比较而言,母亲的政治身份对于子女教育成就的影响不是很
大,民族变量亦如此。基于这些变量,贝叶斯平均过程返回了 3 个备选
模型,其中备选模型 1 具有极高的后验概率( 0.81 )。与模型 1 相比,模
型 2 的后验概率为 0.14 ,而模型 3 的后验概率仅为 0.05 。综合这些信
息,我们应当采用模型 1 所指示的混淆变量来估计倾向值得分。
当我们按照模型 1 中所指示的混淆变量来计算倾向值得分的时
候,所得到的结果和上述基于性别、民族和父母教育水平的模型所得到
的倾向值得分有何差异呢?为了回答这一问题,我们描绘了二者之间
的散点图(见图 4 ),可以发现,基本上二者之间还是呈现正向关系的。
但这两个模型估计出的倾向值并不是完全一致(没有均匀分布于 45 度
线上)。相反,我们可以看到,数据点的分布状况具有比较大的离散性
· 2 0 4 ·