Page 113 - 《社会》2022年第2期
P. 113
社会·2022·2
传统回归模型中的交互作用并无差别, 但研究者需要注意以下三个重
要问题。 第一,倾向值模型是否可以准确预测干预变量的个体选择倾向
值(Xie,et al.,2012)。 也就是说,倾向值模型设定是否受到缺失变量的
影响。一方面,倾向值模型会受到未观测混淆变量的影响,另一方面,背
景因素变量与干预变量之间的非线性关 系 也 会影 响 模型预 测 的准 确
性,因此,倾向值模型的估计是基于“可忽略性假设”。 本文分析中加入
个体、家庭、学校等控制变量,旨在更接近满足“可忽略性假设”。 第二,
研究者需要注意倾向值与干预变量之间交互作用的线性假设在理论上
是否成立( Haimueller,et al.,2019)。 如果线性关系假设成立,传统的线
性回归模型就可以分析该交互作用, 即在模型中加入干预变量和倾向
值的交互项;如果交互作用是非线性关系,可以使用非参数化或半参数
9
化方法对非线性关系进行曲线拟合。 !第三,干预变量和倾向值的样本
分布情况会影响交互作用的实际效用( Haimueller,et al.,2019)。 对于观
测到的每个倾向值,都应满足附近有足够多的临近观测数据点,即倾向
值是连续的。 此外,对于观测到的倾向值,对应的干预变量应该有相应
的差异性,即满足干预组和控制组同时出现,也就是所谓的共同支持区
域( Common Support Area)。
基 于 谢 宇 等 和 哈 缪 尔 勒 等 关 于 效 应 异 质 性 的 研 究 ( Xie,et al.,
2012;Haimueller,et al.,2019;Zhou and Xie,2020),本文使用非线性效应
异 质 性 估 计 方 法———“交 互 核 密 度 平 滑 估 计 法 ”(Interactive Kernel
Smoothing)———对课外补习的非线性效应异质性进行估计。 10 !核密度平
滑估计基于以下半参数交互回归模型:
y i=f(p i)+g(p i)d i+着 (2)
其中,y i 为个体学生的学习成绩,d i 代表学生是否参加课外补习,p i 表
示学生参加课外 补习的倾 向 值 。 f( p i)和 g( p i)为平滑函数 方 程,并且
g(p i)可以估计课外补习在不同倾向值下的边际效应。 11 !该核密度回归
9. 关于干预变量和倾向值之间的非线性关系, 可以使用参数化的回归分析方法估计,
即在回归分析中加入干预变量与倾向值高次幂项的交互项。在稳健性分析中,回归分析
中高次幂项交互作用分析结果与半参数化估计方法的结果一致。
10.“交互核密 度平滑 估 计 法 ”使 用哈 缪 尔 勒 等(Haimueller,et al.,2019)研 究 中 发 表 的
Stata 用户编辑命令 interflex。
11. 我们可以将标准线性交互回归模型视为公式 2 的一种特殊情况,即 f(p i)=u+浊p i ,同
时 g(p i)=a+茁p i 。 将这些方程带入公式 2,即为 y i =滋+浊p i +ad i +茁d ip i +着。
· 106·