Page 151 - 《社会》2025年第4期
P. 151
社会·2025·4
换不同,这一方法有两个优势。首先,上述方法剔除了年龄、受教育程度
以及其他影响婚姻状态的因素的干扰。 如果简单地以 1990 年的婚姻状
态结构替换之后年份的婚姻状态结构进行分解, 我们会忽略不同时期
的年龄结构、受教育程度等因素也在发生变化。 在个体数据可及和复杂
因果关系存在的情况下, 上述方法尤其适用于估计婚姻状态变化对生
育水平变化的贡献。
图 3:婚 姻 状 态 对 生 育 水 平 贡 献 的 条 件 分 解 思 路 图
其次, 基于反事实样本构建模型便于估计各种复杂的生育测算指
标(例如总和生育率)以及分地区(城乡和省份)估计值。 考虑到上述方
法是通过在个体层面生成过去一年生育子女数的反事实估计值, 对于
特定群体的贡献程度, 研究者只需对过去一年生育子女数的反事实估
计值进行计算即可。 总和生育率的分解是年龄组别生育率分解结果的
加总。 3
需要指出的是, 本文分解结果具有因果性识别的假设是除了控制
变量之外,不存在其他干扰变量同时影响解释变量和结果变量。 由于人
口普查的变量比较有限,在不追求因果解释的前提下,婚姻状态的分解
结果可以解释为剔除年龄和受教育程度等控制变量( c)的干扰效应后
婚姻状态对生育水平变化的贡献。
为了验证分析结果的稳健性, 本文通过 bootstrapping 方法进行 200
次数据模拟分析,通过可放回再抽样的方式构建模拟数据集,进而计算
200 次分析结果的标准差(Sudharsanan and Bijlsma,2018)。 较小的标准
差意味着上述分析得出的结果具有稳健性。
(四)回归模型设定
为了进一步分析经济社会发展水平的影响, 本文以省级层面婚姻
3.由于年龄组结构变化不对总和生育率产生影响,因此总和生育率分解时,解释方程和
结果方程中并不控制年龄类别。
· 144·

