Page 233 - 《社会》2020年第1期
P. 233
社会 · 2020 · 1
在稳健性检验模型中使用 狉狅犫狌狊狋 稳健标准误 , 利用怀特检验处理
可能存在的异方差问题 。 γ 是不随时间变化但影响离婚行为的特
犻
征 , 11是年度固定效应 , ν 是区域的固定效应 , ε 是误差项 。
δ
犻
犻
犻
( 二 ) 数据来源
研究数据来自于国家卫计委流动人口管理司进行的全国流动人口
动态监测调查 。 该调查采取分层 、 多阶段 、 与规模成比例的 犘犘犛 抽样
方法 , 覆盖全国 31 个省市自治区 。 调查对象为在流入地居住一个月以
上 、 没有本地户口的跨区县流动人口 。 从 2010 年预调研开始 , 目前已
经完成 2010 至 2016 年的 7 轮调查 , 每年调查在县区层面随机轮转 。
各地市负责编制被选中的社区 / 村的 100 名合格对象名单 , 调查人员随
机抽取 20 人进行访谈 , 每户只抽取一名 15 ~ 59 岁的流动人口 。 每年
抽取样本 15 万左右 。 本研究使用调查进入成熟阶段的 2013 、 2014 和
2015 年数据 。
根据前文的研究设计 , 在数据选择上依据以下原则 : 剔除省内流
动 , 只保留跨省流动人口 ; 年龄设置为 20 ~ 50 岁 ; 婚姻状态为有婚姻经
历 , 包括初婚 、 离婚和再婚 ; 剔除流入本地前在其他地区有务工经历的
群体 , 以避免离婚后的迁移选择性 ; 只保留流入本地务工的时间早于初
婚时间 , 以保证整个婚姻过程在流入地完成 ; 数据中不包括西藏自治
区 ; 将 2013 、 2014 和 2015 年三年的截面调查数据样本合并 , 构建混合
面板数据 。 最后 , 本研究获得有效样本 48864 个 。 考虑到流动人口的
离婚时间可能早于迁入当前区域的时间 , 本研究对样本进行了筛选 , 图
3 描述了 48864 个有效样本在各省的分布结构 。 卡方检验结果表明 ,
本研究所筛选的 48864 个有效样本和所有跨省流动人口 ( 240306 个 )
在各省的分布基本保持一致 , 没有显著差异 。
1982 年 、 1990 年 、 2000 年和 2010 年离婚率数据分别来自第三 、 第
四 、 第五和第六次全国人口普查数据 。 2010 — 2016 年离婚率数据来自
历年 《 中国民政统计年鉴 》。 各省 2015 年人均 犌犇犘 、 利用外资规模 、 互
联网普及率和人口出生率等数据来自 2016 年 《 中国统计年鉴 》。 各省
2015 年市场化指数根据王小鲁 、 樊纲撰写的 《 中国分省份市场化指数
报告 ( 2016 )》 整理 。 样本及查询所得数据的统计描述详见表 1 。
11. 比如被访者的文化程度 、 民族等因素 。
2
6
· 2 ·