Page 83 - 《社会》2022年第2期
P. 83
社会·2022·2
其一,补习样本的负向情绪得分显著低于未补习样本。 平均意义上
看,未参加补习的学生似乎表现出了更多的负向情绪。 不过,由于暂未
考虑到学生的家庭背景、上一学年的负向情绪以及学业表现,而这些因
素既可能影响到学生当期的补习参与决策,又可能与当期的负向情绪密切
相关,因此简单的负向情绪组间均值比较结果有待进一步的澄清。
其二, 从控制变量的分布来看, 补习学生更多来自较高的社会阶
层,拥有较少的兄弟姐妹、更多来自城市、有更高的认知能力得分和语
数外期中考试成绩,拥有更好的家庭经济条件和物质性文化资本。 比较
而言, 未参加补习的学生更多来自较低阶层的家庭, 有较多的兄弟姐
妹,更多来自农村,认知能力测试和期中考试的表现也相对欠佳,家庭
经济条件和物质性文化资本相对较差。
其三,迁移流动状况的组间比较值得注意。 在参加补习的学生中,
“本地入学比例”反而略低于未参加补习的学生样本,且这两组学生的
“跨省流动比例”并无显著差异。 这一结果可能与筛选样本的标准有关。
本文的研究样本只包含那 些 在 所 有 控制 变 量 上都 拥 有 观 测 值 的受 访
者。 我们发现,变量(特别是学生户口类型)存在缺失的受访者更多地来
自流动人口较多的地区。 13 因此,那些处于迁移流动状态的受访者可能
因缺失值未能进入研究样本。 考虑到这一点,在后文的回归分析中我们
控制了“学生的迁移流动状态”“学生家庭所在的地区类型”“学生所在
区县”等变量,以免发生样本选择偏误。 14
! ! (二)总效应的因果识别:课外补习是否“致郁”?
为了进一步考察原因变量(课外补习参与)对结果变量(情绪健康)
的因果效应以及因果效应的组间(阶层)异质性,研究从描述性统计转
向回归分析。
表 2 展示了在不同的分析方法和模型设定条件下, 总效应的系数
( 接上页) 严格按照“变量介绍”中对控制变量的处理方式建立统计模型。 完整的描述性统计
结果可联系作者索取。
13. CEPS 项目文档提到,全国补充样本是“从全国拥有大量流动 人口 的 120 个县(区)
中抽取 10 个县(区)”而得到的。 详见 http://ceps.ruc.edu.cn/xmwd/cysj.htm。
14. 我们还对此进行了稳健性检验。 例如,纳入不同的样本来源(全国核心样本、上海样
本、全国补充样本)作为额外的控制变量,而不再控制学生户口类型(回归分析的样本量
上升为 8 153 人,占全样本的 75.8%)。 原文的分析结果依旧保持稳健,且由于样本量上
升,估计精度也随之上升。
· 76 ·