Page 233 - 《社会》2020年第1期
P. 233

社会 · 2020 · 1

       在稳健性检验模型中使用 狉狅犫狌狊狋 稳健标准误 , 利用怀特检验处理
   可能存在的异方差问题 。 γ 是不随时间变化但影响离婚行为的特
                            犻
   征 , 11是年度固定效应 , ν 是区域的固定效应 , ε 是误差项 。
        δ
         犻
                                               犻
                           犻
       ( 二 ) 数据来源
       研究数据来自于国家卫计委流动人口管理司进行的全国流动人口
   动态监测调查 。 该调查采取分层 、 多阶段 、 与规模成比例的 犘犘犛 抽样
   方法 , 覆盖全国 31 个省市自治区 。 调查对象为在流入地居住一个月以
   上 、 没有本地户口的跨区县流动人口 。 从 2010 年预调研开始 , 目前已
   经完成 2010 至 2016 年的 7 轮调查 , 每年调查在县区层面随机轮转 。
   各地市负责编制被选中的社区 / 村的 100 名合格对象名单 , 调查人员随
   机抽取 20 人进行访谈 , 每户只抽取一名 15 ~ 59 岁的流动人口 。 每年
   抽取样本 15 万左右 。 本研究使用调查进入成熟阶段的 2013 、 2014 和
   2015 年数据 。
       根据前文的研究设计 , 在数据选择上依据以下原则 : 剔除省内流
   动 , 只保留跨省流动人口 ; 年龄设置为 20 ~ 50 岁 ; 婚姻状态为有婚姻经
   历 , 包括初婚 、 离婚和再婚 ; 剔除流入本地前在其他地区有务工经历的
   群体 , 以避免离婚后的迁移选择性 ; 只保留流入本地务工的时间早于初
   婚时间 , 以保证整个婚姻过程在流入地完成 ; 数据中不包括西藏自治
   区 ; 将 2013 、 2014 和 2015 年三年的截面调查数据样本合并 , 构建混合
   面板数据 。 最后 , 本研究获得有效样本 48864 个 。 考虑到流动人口的
   离婚时间可能早于迁入当前区域的时间 , 本研究对样本进行了筛选 , 图
   3 描述了 48864 个有效样本在各省的分布结构 。 卡方检验结果表明 ,
   本研究所筛选的 48864 个有效样本和所有跨省流动人口 ( 240306 个 )
   在各省的分布基本保持一致 , 没有显著差异 。
       1982 年 、 1990 年 、 2000 年和 2010 年离婚率数据分别来自第三 、 第
   四 、 第五和第六次全国人口普查数据 。 2010 — 2016 年离婚率数据来自
   历年 《 中国民政统计年鉴 》。 各省 2015 年人均 犌犇犘 、 利用外资规模 、 互
   联网普及率和人口出生率等数据来自 2016 年 《 中国统计年鉴 》。 各省
   2015 年市场化指数根据王小鲁 、 樊纲撰写的 《 中国分省份市场化指数
   报告 ( 2016 )》 整理 。 样本及查询所得数据的统计描述详见表 1 。


   11. 比如被访者的文化程度 、 民族等因素 。


      2
       6
    ·  2 ·
   228   229   230   231   232   233   234   235   236   237   238