Page 173 - 《社会》2016年第4期

P. 173

社会· ２０１６ · ４

就笔者所知，除了犠犞犛之外，包含幸福感测量且时间跨度最长的
全国代表性数据只有中国社会综合调查（犆犌犛犛）。６从２００３年至今，
犆犌犛犛每隔一年或两年收集数据，总样本量从６００个左右到超过１００００
个不等，每一次调查都涵盖绝大多数省份。迄今对公众开放的共有８
轮（２００３年、２００５年、２００６年、２００８年、２０１０年、２０１１年、２０１２年和
２０１３年），正好横跨１０年，适合检验 “幸福感悖论”。美中不足的是
犆犌犛犛２００３只涵盖了城市样本，降低了其与后面年份的可比性。但如
前所述，检验“幸福感悖论”倚重长期数据，跨度越长越好，否则发现的
可能只是短期效应。所以，本文的分析策略是先考察２００３ — ２０１３年的
关系，然后剔除犆犌犛犛２００３，观察核心结论是否依然稳健。
除了时间跨度外，第二个需要考虑的问题是集合层面的分析单位。
犆犌犛犛采用的是多阶分层犘犘犛随机抽样，初级抽样单位是县、县级市和
区，在每个初级抽样单位之下再随机抽取若干街道作为二级抽样单位
（犅犻犪狀犪狀犱犔犻，２０１２）。因此，若能以区县作为分析单位就可以具备较
好的代表性。遗憾的是，除了犆犌犛犛２００５外，其余年份的数据均未提供
真实的区县编码，因而无法串联区县级经济发展数据。７我们因此采用
次优的方法：以省份作为分析单位。下文的集合层面分析将涉及两个
核心变量：人均地区生产总值和平均幸福感水平。前者来自统计年鉴，
不受抽样影响，而平均幸福感则由各省中个人的幸福感得分汇总而来，
有可能会受影响。因此，在生成省级幸福感时，我们对每个省份都进行
了加权，权重基于相应年份各省在性别和教育两个维度的边际分布计
算而成，数据来源于２００４年、２００６年、２００７年、２００９年、２０１１年、２０１２
年、２０１３年和２０１４年的《中国统计年鉴》。
此外，在进行个人层面分析时，笔者使用个人权重对每一年的数据
都进行了加权，以使其能更准确地代表全国人。对于在分析所涉及变
量上有任何一个缺失的个案整条删除，最后共得到６５２７０个个案用于
分析。使用样本提供的个体加权计算显示，样本被访者的平均年龄是
４６岁，男性占４８％，城市居民占６２％。

６．原始数据及抽样设计方案详见犆犌犛犛官方网站：犺狋狋狆：／／狑狑狑．犮犺犻狀犪犵狊狊．狅狉犵。
７．犆犌犛犛官方已经发表声明，为了保护被访者的个人隐私，不会公开调查抽中的县（区）、乡镇
街道及村／居委会的名称、地理位置以及行政编码。详见“关于犆犌犛犛数据地理信息披露的说
明”（犺狋狋狆：／／狑狑狑．犮犺犻狀犪犵狊狊．狅狉犵／犻狀犱犲狓．狆犺狆？狉＝犻狀犱犲狓／犪狉狋犪犫狅狌狋牔犪犻犱＝１７）。

· １６６ ·

168 169 170 171 172 173 174 175 176 177 178