Page 28 - 《社会》2017年第2期
P. 28
罚似然图模型与社会网络测量
表征事件的社会网络数据通常具有时序特征,例如本文所采用的
两个示例数据均包含时序信息。就时序数据而言,用罚似然图模型去
拟合实际上是对观测进行了静态的测量,从而损失了大量时序信息,无
法拟合社会网络的变迁。折衷的办法是设定一个时间间隔,将事件分
成不同的时间片段再予以测量,但该方法的缺点是时间周期完全由人
工选择,因此推论将完全依赖于所选择的时间周期,无法保证结果的一
致性。目前来看,采用罚似然图模型对时序网络的分析主要集中于对
,
离散时段数据的探测( 犣犺狅狌 , 犲狋犪犾. , 2010 ; 犓狅犾犪狉犪狀犱犡犻狀 犵2011 ),对连
续时段数据探测的相关研究非常少,威特和阿布鲁( 犠犻狋犪狀犱犃犫犫狉狌狕狕狅 ,
2015 )对一个变动比较缓慢的网络结构进行了分析。除此之外,时序数
据往往伴随着样本的变动(加入/离开),这些问题对罚似然图模型来说
都是比较艰巨的挑战。
最后,随着 犚 语言的发展和成熟,有相当多罚似然图模型均提供
了相应的 犚 软件包,据笔者的不完全收集,已有 200 个左右的 犚 包。
本文在此仅列举部分,并对其特点进行简单归纳,以方便读者学习(见
表 3 )。不同于常规的统计学模型,由于超参数的存在,尤其是潜变量
罚似然模型中存在两个超参数,对最优的拟合模型的寻找和判定往往
比较困难,需要研究者的努力和耐心。
表 3 :罚似然图模型相关 犚 包
名称 作者 特点
非常高效率的 犵 犾犪狊狊狅 优化算法,被很多扩展
犵 犾犪狊狊狅 ( 犉狉犻犲犱犿犪狀 , 犲狋犪犾. , 2014 ) 模型 犚 包所调用
提供多种拟合方法及模型评估系数,适用多
犺狌 犵 犲 ( 犣犺犪狅 , 犲狋犪犾. , 2015 )
种类型变量及较大规模网络
狊犻犿狅狀犲 ( 犆犺犻 狇 狌犲狋 , 犲狋犪犾. , 2016 ) 潜结构及多组图模型估计
犑犌犔 ( 犇犪狀犪犺犲狉 , 犲狋犪犾. , 2014 ) 多组图模型
犐狊犻狀 犵 犉犻狋 ( 狏犪狀犅狅狉犽狌犾狅犪狀犱犈 狆 狊犽犪犿 狆 , 2014 ) 针对二进制数据
犵 犾犪狊狊狅犿犻狓 ( 犔狅狋狊犻犪狀犱犠犻狋 , 2013 ) 针对混合数据结构,时间序列模型
必须要提醒的是,尽管罚似然图模型解决的是高维问题,但不同的
模型和优化求解算法均有特定的数据前提,有的模型并不适合特定的
情形,有的模型只适合中小型网络规模,还有的受限于网络稀疏度。实
际应用中针对各种数据场景选择合适的模型和优化求解算法仍需十分
小心。
· 2 1 ·