Page 173 - 《社会》2016年第4期
P. 173
社会· 2016 · 4
就笔者所知,除了 犠犞犛 之外,包含幸福感测量且时间跨度最长的
全国代表性 数 据 只 有 中 国 社 会 综 合 调 查 ( 犆犌犛犛 )。 6 从 2003 年 至 今,
犆犌犛犛 每隔一年或两年收集数据,总样本量从 600 个左右到超过 10000
个不等,每一次调查都涵盖绝大多数省份。迄今对公众开放的共有 8
轮( 2003 年、 2005 年、 2006 年、 2008 年、 2010 年、 2011 年、 2012 年 和
2013 年),正 好 横 跨 10 年,适 合 检 验 “幸 福 感 悖 论”。美 中 不 足 的 是
犆犌犛犛2003 只涵盖了城市样本,降低了其与后面年份的可比性。但如
前所述,检验“幸福感悖论”倚重长期数据,跨度越长越好,否则发现的
可能只是短期效应。所以,本文的分析策略是先考察 2003 — 2013 年的
关系,然后剔除 犆犌犛犛2003 ,观察核心结论是否依然稳健。
除了时间跨度外,第二个需要考虑的问题是集合层面的分析单位。
犆犌犛犛 采用的是多阶分层 犘犘犛 随机抽样,初级抽样单位是县、县级市和
区,在每个初级抽样单位之下再随机抽取若干街道作为二级抽样单位
( 犅犻犪狀犪狀犱犔犻 , 2012 )。因此,若能以区县作为分析单位就可以具备较
好的代表性。遗憾的是,除了 犆犌犛犛2005 外,其余年份的数据均未提供
真实的区县编码,因而无法串联区县级经济发展数据。 7 我们因此采用
次优的方法:以省份作为分析单位。下文的集合层面分析将涉及两个
核心变量:人均地区生产总值和平均幸福感水平。前者来自统计年鉴,
不受抽样影响,而平均幸福感则由各省中个人的幸福感得分汇总而来,
有可能会受影响。因此,在生成省级幸福感时,我们对每个省份都进行
了加权,权重基于相应年份各省在性别和教育两个维度的边际分布计
算而成,数据来源于 2004 年、 2006 年、 2007 年、 2009 年、 2011 年、 2012
年、 2013 年和 2014 年的《中国统计年鉴》。
此外,在进行个人层面分析时,笔者使用个人权重对每一年的数据
都进行了加权,以使其能更准确地代表全国人。对于在分析所涉及变
量上有任何一个缺失的个案整条删除,最后共得到 65270 个个案用于
分析。使用样本提供的个体加权计算显示,样本被访者的平均年龄是
46 岁,男性占 48% ,城市居民占 62% 。
6. 原始数据及抽样设计方案详见 犆犌犛犛 官方网站: 犺狋狋 狆 :// 狑狑狑.犮犺犻狀犪 犵 狊狊.狅狉 犵 。
7.犆犌犛犛 官方已经发表声明,为了保护被访者的个人隐私,不会公开调查抽中的县(区)、乡镇
街道及村/居委会的名称、地理位置以及行政编码。详见“关于 犆犌犛犛 数据地理信息披露的说
明”( 犺狋狋 狆 :// 狑狑狑.犮犺犻狀犪 犵 狊狊.狅狉 犵 / 犻狀犱犲狓. 狆 犺 狆 ? 狉=犻狀犱犲狓 / 犪狉狋犪犫狅狌狋牔犪犻犱=17 )。
· 1 6 6 ·