Page 141 - 《社会》2020年第3期
P. 141
社会 · 2020 · 3
偏差 。 25 同时也难以像以往诸多相关研究那样使用一般空间滞后 /
误差回归模型或者不考虑空间效应的一般负二项分布回归模型进
行建模 , 否则存在误导性 , 统计效度难以保证 。 26
图 5 : 北京市乡镇 / 街道层面养老床位数空间自相关散点图
鉴于数据的上述特点 , 不能使用简单 犛犔犕 和 犛犈犕 进行空间回
归分析 , 本研究采用基于贝叶斯方法的带有空间结构随机效应
( 狊 狆 犪狋犻犪犾犾 狔 狊狋狉狌犮狋狌狉犲犱狉犪狀犱狅犿犲犳犳犲犮狋 ) 的零膨胀负二项分布模型 ( 犜 狔狆 犲
0犣犐犖犅 ) 27 建模 , 具体以 犚犐犖犔犃 包实现 。 犚犐犖犔犃 是基于潜高斯模型
( 接上页 )“ 床位数 +1 ” 然后取对数 、 犜狌犽犲 狔 变换等处理方式 , 仍然不能解决变量高比例取值接
近于零的问题 。 目前相关的主题空间应用分析多以全局或局域空间自相关系数直接进行计
算 , 方法上鲜见对此问题的交代和处理 。
25. 从空间自相关散点图 ( 图 5 ) 和养老床位分布 ( 图 1 ) 来看 , 该数据存在严重的异质性问题 ,
这是空间数据存在的常见问题 。 正如达谟弗 ( 犇犪狉犿狅犳犪犾 , 2015 : 74 ) 总结的 , 非正态 、 异方差问
题会造成偏离正态性前提 ( 尤其是小样本及空间权重矩阵稠密情况下 ), 莫兰 犐 指数此时缺乏
功效 。 此外 , 莫兰 犐 指数也不能区辨空间依赖关系属于空间滞后效应还是空间误差效应 。 实
际上 , 莫兰 犐 指数只是对养老资源空间分布特征的直接刻画 , 并未控制人口等相关因素 , 为了
获得对空间效应较纯粹的估计并分别评价相关影响因素的作用 , 有必要进行空间回归分析 。
26. 对于该数据 , 如果使用一般空间滞后或空间误差模型估计 , 公办养老资源相关模型输出
的 ρ 和 λ 系数不显著 ( 狆 < 0.05 ), 民办养老资源则均显著为正 , 分别为 0.1820 ( 狆 < 0.05 ) 和 0.
1774 ( 狆 < 0.1 ), 以此计算存在严重偏差 。
27. 零膨胀模型 犜 狔狆 犲0 和 犜 狔狆 犲1 的区别在于 , 数据中零值属于结构零值 ( 狊狋狉狌犮狋狌狉犪犾狅狉
“ 狋狉狌犲 ” 狕犲狉狅 ) 还是抽样零值 ( 狊犪犿 狆 犾犻狀 犵 狅狉 “ 犳犪犾狊犲 ” 狕犲狉狅 )。 本研究假定采集数据齐备 , 理论上更
适合第一种模型 。 需要说明的是 , 对于零膨胀模型 , 犐犖犔犃 并不输出相同协变量的零膨胀模型
部分结果 。 参见 犺狋狋 狆 狊 :// 犵 狉狅狌 狆 狊. 犵 狅狅 犵 犾犲.犮狅犿 / 犳狅狉狌犿 / # ! 狋狅 狆 犻犮 / 狉犻狀犾犪犱犻狊犮狌狊狊犻狅狀 犵 狉狅狌 狆 /( 转下页 )
4
· 3 ·
1