Page 123 - 《社会》2018年第3期
P. 123
社会· 2018 · 3
使用的 5 年的调查数据中包括样本获得非农户口的原因以及具体时
间。
进一步来讲,本文选取的是合并后数据库中年龄在 18 岁及以上、
目前居住在城市且从事非农工作的居民样本。最终,进入分析的“农转
非”居民样本 3724 个,城市出身的居民样本 6930 个,农村出身目前流
动到城市且依然是农业户口(即流动人口)的样本 4049 个。后两类样
本在计量分析中将作为参照组,以更好地反映出户口转变对收入的
影响。
(二)变量处理
1. 因变量
本研究拟设置模型的因变量有三个。第一个因变量为“是否‘农转
非’”,这是一个二分类变量,纳入模型的是 18 岁及以上农业户口出身、
目前居住在城市且从事非农工作的样本(即上述的“农转非”居民样本
和流动人口样本)。根据 犆犌犛犛 对样本非农户口获得的具体途径的询
问可以区分出是否“农转非”,将选择了“农转非”具体途径的样本归为
“农转非”,编码为 1 (剔除了非农户口获得时间上的缺失值和奇异值样
本 5 );将未选择“农转非”具体途径的样本归为“流动人口”,编码为 0 。
第二个因变量为“农转非”途径。这也是一个二分类变量,我们将
问卷选项中的“升学”“参军”“招工”“转干”和“购房”等途径归为选择性
“农转非”,编码为 1 ;将“征地”“随家属转户”和“户口改革” 6 等途径归
为政策性“农转非”,编码为 0 。此外, 犆犌犛犛 数据中没有明确给出“其
他”选项的具体内容,无从判断,由于数据中选择“其他”选项的比例很
小( 4.09% ),本研究将其作为“缺失值”进行处理。
第三个因变量是个人年总收入。这是一个连续变量,用于分析户
口的收入回报。在 犆犌犛犛 问卷中,除 犆犌犛犛2008 外均直接问及受访者
5. 奇异值样本包括非农户口获得时间早于或等于出生年份以及不符合实际情况(“农转非”时
间早于 1955 年)的样本。值得说明的是,诚如我们在文献综述部分所言,本研究将 1955 年作
为城乡二元户籍制度的起点。实际上,正是 1955 年政府出台的《关于建立经常户口登记制度
的指示》和《关于城乡划分标准的规定》这两份文件从制度上为城乡二元的户籍管理制度奠定
了基础。
6. 本研究将正在逐步推行的居民户籍制度改革也归为政策性“农转非”,原因在于当前的改革
尚在起步阶段且只有少数地方实行,在本文使用的数据中涉及居民户口改革的样本较少。
· 1 1 6 ·