Page 24 - 《社会》2017年第2期
P. 24
罚似然图模型与社会网络测量
( , ( , ( , ),
π 1犖 1 μ 1 ), π 2犖 2 μ 2 ),… π 犽 犖 犽 μ 犽
∑ 1 ∑ 2 ∑ 犽
其中 犖 ( μ , ∑ )为多元正态分布,均值为 μ ,方差协方差矩阵为 ∑ ,
为混合比例。该问题类似于有限混合聚类模型,但在图模型中,需
π 犽
根据样本数据和给定的稀疏度约束来估计潜在的网络结构。罗茨和维
特( 犔狅狋狊犻犪狀犱 犠犻狋 , 2013 )在 有 限 混 合 聚 类 模 型 的 基 础 上 提 出 了
犵 犾犪狊狊狅犿犻狓 模型。与有限混合聚类模型一样, 犾犪狊狊狅犿犻狓 也是一个探索
犵
性分析的模型,需指定分类的数目,并在事后根据对数似然值或 犲犅犐犆
值评估不同模型拟合的效果。
仍以 犇犌犌 数据为例,假设 犇犌犌 数据来自不同类别的事件(子总
体),则采用 犾犪狊狊狅犿犻狓 模型拟合的结果如图 6 所示(程序中分别拟合了
犵
二分类和三分类模型,其中二分类模型的拟合指标优于三分类模型)。
可以看到,在图 6 ( 1 )中,仍然保留了与图 1 相一致的结构,有两个较大
的连接子群和编号 16 、 17 、 18 这个游离的子群。在图 6 ( 2 )中,大致也
呈现为两个子群,但是网络密度大于图 1 的 犾犪狊狊狅 基本模型。对照观
犵
测值的聚类结果(见表 2 ),图 6 ( 2 )的事件中包括 犲8 和 犲9 这两次参与
人数最多的活动,以及 犲11 、 犲13 和 犲14 这三次由特定小规模群体参与
的活动,因此可以认为图 6 ( 1 )表示的是日常事件网络,而图 6 ( 2 )表示
的则是特殊活动网络。
图 6 : 犇犌犌 数据的两个子网络
· 1 7 ·