Page 228 - 《社会》2016年第6期
P. 228
社会分层与健康不平等的性别差异
2. 自变量
性别是一个二分变量,“女性”编码为 0 ,“男性”编码为 1 。
教育是一个连续变量,即“读了多少年的书”,成人的教育水平并不随
时间而变化,我们采用被访者最后一次进入调查时所报告的教育水平。
收入是前一年被访者人均家庭收入。考虑到通货膨胀因素, 犆犎犖犛
将各观察年度的家庭年收入换算为 2010 年的收入水平,以便于各年份
间的纵向比较。家庭年收入属于时间的协变量 ( 狋犻犿犲犮狅狏狉犻犪狀狋 )。为了
避免极值影响,在分析中我们对家庭收入取自然对数。
3. 年龄、世代和其他控制变量
我们取第一次进入调查时年龄在 24 岁以上的样本。这个时期,人
们多已完成大学教育,可以有效避免健康选择对教育的影响( 犠犻犾犾狊狅狀 ,
犲狋犪犾. , 2007 )。在后面的成 长 曲线 模型分 析中 对年 龄做 了中心化 处
理,即向样本均值集中( 犮犲狀狋犲狉犲犱犪狋 犵 狉犪狀犱犿犲犪狀 , 48.1 岁),以便于对结
果中截距参数的解释( 犛犻狀 犵 犲狉犪狀犱 犠犻犾犾犲狋狋 , 2002 : 113 )。我们也对年龄
做了平方处理,以估计年龄对健康的二次曲线影响。但年龄平方项对
健康变化影响并不显著,故没有包含在后面的分析模型中。
在生命历程的分析中,出生世代是一个很重要的概念。囿于篇幅,
本文无法详细解析世代的影响,但我们将世代作为控制变量。世代是
一个连续变量,根据被访者的出生年月,将被访者分为 7 个跨度 10 年
的出生世代。考虑到“大跃进”及其后的“三年自然灾害”可能导致的健
康后果,参考前人的研究,我们将 1951 — 1955 年和 1956 — 1960 年分为
不同的出生世代群( 犆犺犲狀 , 犲狋犪犾. , 2010 )。
婚姻状况被认为对健康有较大影响。我们将“已婚”编码为 1 ,“其
他情况(未婚、离异、丧偶)”为 0 。城乡二元化也被认为是影响健康的
重要因素,我们将户籍作为控制变量,“城市户口”编码为 1 ,“农村户
口”为 0 。此外,鉴于国内巨大的地区差异,我们将地区也作为控制变
量,分为东北地区(辽宁和黑龙江)、东部沿海地区(山东和江苏)、中原
地区(河南、河北和湖南)和南部山区(广西和贵州),以经济发展相对落
后的南部山区为参照组。
(三)统计分析模型
我们使用成长曲线模型( 犌狉狅狑狋犺犆狌狉狏犲犕狅犱犲犾狊 )检验个体健康的
变化趋势化因社会经济因素而导致的系统性差异。使用的统计软件是
· 2 2 1 ·