Page 236 - 《社会》2020年第4期
P. 236
文件治理中的政策采纳及其影响因素研究
备再次采纳该政策的风险 , 因此 , 采纳之后的年份的观测值在本研究中
将被剔除 。
2. 关键自变量
中央政府注意力指数 该变量测量不同年份中央政府对农村工作
的注意力 , 以反映外部的行政压力 , 为连续变量 。 本研究通过对历年政
府工作报告 6 进行主题模型 7 分析来生成不同年份中央政府对农村工
作的注意力指数 。 之所以选择政府工作报告 , 是因为每年的政府工作
报告作为具有施政纲领性质的政策性文本 , 其内容所涉及的政府工作
目标及其实施方案是中国政府每年工作的行动纲领 ( 邓雪琳 , 2015 )。
具体计算步骤为 :( 1 ) 使用 犚 语言对所有政策报告进行分词并删除常
) 等指标确定对于历年的中央
用停用词 ; 8 ( 2 ) 结合 “ 混乱度 ”( 犘犲狉 狆 犾犲狓犻狋 狔
政府工作报告这一文本集合而言的最优主题数量 ( 犅犾犲犻 , 犲狋犪犾. , 2003 ;
黄荣贵 , 2017 );( 3 ) 在此基础上 , 使用主题模型对上述文本集合进行分
析 , 根据主题模型的分析结果 , 归纳出与农村 、 农业 、 农民等相关的主
题 , 然后计算上述主题在不同年份的政府工作报告中的分布概率 , 并以
此概率作为中央政府对农村工作的注意力指数 。
政策是否有中央财政资助 此变量衡量外部的经济激励 , 本文依
据 “ 中央财政 ”“ 中央资金投入 ”“ 中央直接补贴 ” 等相关关键词依次识别
各项农村政策是否有中央财政资助 , 若有中央财政资助 , 该变量赋值为
1 , 若无 , 赋值为 0 。 同时 , 部分中央政府的农村政策在包含中央财政资
助的同时 , 也会要求地方政府拿出一部分财政资金进行配套 , 为更准确
6. 国务院历年政府工作报告可以分为工作回顾 、 目标任务和主要工作内容三大部分 , 其中 , 目
标任务和主要工作内容为新一年的政府行动纲领和工作要点 , 工作回顾则是对政府之前工作
的回顾和总结 。 考虑到中央政府注意力指数主要反映政府新一年对各种议题的重视程度 , 为
保证该指数的准确性和科学性 , 在实际处理时 , 我们首先删除政府工作报告文本中工作回顾
的部分 , 然后对文本进行主题模型分析 。
7. 主题模型作为典型的无监督模型 , 简要来说是对特定文字隐含的主题进行建模的方法 。 在
主题模型中 , 主题由一组词汇的统计分布所定义 , 构成同一主题的词汇更有可能出现在同一
文本中 , 模型结果将估计出每个主题所对应的关键词及概率 ( 犅犾犲犻 , 犲狋犪犾. , 2003 ), 同时 , 也可
以估计出每一个文本所对应的各主题的概率 。 研究者可以根据不同主题或主题组合在每个
文本中的具体概率来量化比较文本的主要特征 。
8. 中文停用词主要包括类似 “ 的 ”“ 吗 ”“ 呀 ” 等无实际意义的词汇和标点符号 , 本文使用的中文
文本分析中是应用较为广泛的哈工大停用词表以及四川大学机器智能实验室停用词库生成
本文的停用词表 。
9
2
· 2 ·