Page 58 - 《党政研究》2024年么6期
P. 58

教育培训的梳理和对政策文本的阐释等,实践分析则主要围绕干部教育培训的具体工作进
             行探索。干部教育培训作为中国共产党百年来的成功秘诀,随着不同时期党的时代任务的
             变化而变化 。学界从建党初期 、延安时期 、解放战争时期 、新中国成立初期 、
                                                                                                        〔 6〕
                          〔 2〕
                                                                                  〔 5〕
                                                〔 3〕
                                                              〔 4〕
             改革开放以来 、进入新时代后 对干部教育培训工作进行了梳理。针对全国干部教育培
                                               〔 8〕
                            〔 7〕
             训规划,阐释了前 7 个全国规划的特点 、政策内容 、十八大以来 3 个全国规划文本的
                                                                     〔 10〕
                                                      〔 9〕
             内涵 。从不同角度对干部教育培训的具体工作进行了探索。一是教育培训机构。党校、
                  〔 11〕
             干部学院和行政学院是干部教育培训开展的主体 ,各行业系统党校,比如高校党校作
                                                                 〔 12〕
             为高等教育领域干部教育培训的重要阵地,起到补充作用 。二是教育培训方式。组织
                                                                           〔 13〕
             调训、干部选学、网络培训 、结构化研讨 等多样化的方式构成灵活、立体的培训体
                                           〔 14〕
                                                            〔 15〕
             系。三是教育培训意义。干部教育培训发挥着组织塑造的功能,集中体现在思想淬炼、能
             力提升、共识凝聚、阶梯培养四个方面 。
                                                      〔 16〕
                  总体来看,干部教育培训的相关研究起步较晚,学科体系仍处于不断丰富和完善的过
             程之中。本文着眼于 8 个全国干部教育培训规划,利用 LDA 主题模型梳理发展脉络和趋
             势,总结不同时期的发展特征。在理论层面上,有利于揭示全国干部教育培训规划背后的
             深层逻辑与战略意图。一方面,主题提取与聚类分析使得研究更具客观性和连贯性,能够
             弥补学界对全国规划整体性研究的不足;另一方面,基于量化的科学研究方法提供新思
             路,有助于构建更加精细的理论框架,深入挖掘规划文本,减少主观偏差。在实践层面
             上,通过全国干部教育培训规划分析干部教育培训具体工作,呈现其在各个时期的优化完
             善过程,能够加强当前干部教育培训实践的针对性与时代性,并为未来发展和持续优化提
             供经验和支持。同时,基于对规划的梳理,可以进一步强化全国规划对干部教育培训工作
             的实践指导,推动新时代干部教育培训的创新发展。

                 二、研究设计

                  (一)LDA 主题模型
                  潜在狄利克雷分布模型 ( The latent Dirichlet allocation model,LDA)是用于离散数据
             集合 (如文本语料库)的生成概率模型,能够识别大规模文档集或语料库中潜在隐藏的
             主题信息 ,包括词语、主题与文档 。LDA 主题模型通过挖掘和分析文本内部的潜在
                       〔 17〕
                                                     〔 18〕
             主题,能够更加准确理解文本内涵和精髓,强化政策文本分析的细粒度和精确度 ,使
                                                                                                    〔 19〕
             得分析结果更加全面、细致,提高深入挖掘文本内容开展语义分析的精准度和效率 。
                                                                                                    〔 20〕
                  自然语言处理中的主题可被视为词项的概率分布,LDA 主题模型假设每篇文本都至少
             包括一个主题,主题由一系列特征词组成,是对文本主要内容的阐释。作为非监督学习,
             LDA 主题模型在分析主题内容前首先需要确定模型生成的主题数量 ,具体步骤包括:
                                                                                      〔 21〕
             使用主题模型模拟文档的生成过程,再通过参数估计得到主题数量,最终基于训练形成 K
             个主题 。本文采用困惑度作为确定主题数量的标准,困惑度越低,主题数量越准确,
                     〔 22〕
             且较低的困惑度意味着模型对新文本有较好的预测作用 。困惑度计算公式如下,其中,
                                                                        〔 23〕
             D 的含义是语料库中的测试集,M 是文档数量,N 表示每篇文档 d 中的单词数,w 表示
                                                                                                     d
                                                                  d
             文档 d 中的词,p ( w )则是文档中词产生的概率。
                                    d

                  (二)主题强度
                  主题强度指在一定时间段中主题的热度和受关注程度 。在不同时期,主题强度可
                                                                           〔 24〕
             能逐渐升温或逐渐淡化甚至衰落,抑或表现为周期性波动。面对大规模文本信息,主题强
                                                                                                       7 ·  ·
                                                                                                      5
   53   54   55   56   57   58   59   60   61   62   63