Page 14 - 《社会》2017年第2期

P. 14

罚似然图模型与社会网络测量

到该网络的关系测度。
一般采用最大似然法来估计精度矩阵 ∑ －１。用犛表示犡的经验
协方差矩阵，高斯对数最大似然的公式表达如下：
犾狅犵ｄｅｔ Θ－狋狉犪犮犲（犛 Θ ）（１）
其中 Θ 表示逆协方差矩阵，即 Θ＝∑ －１。使公式（１）最大化可得
︵－１
最大似然估计 Θ＝犛。但是就大规模观测数据来说，存在两个基本
特征。一是高维性，社会网络数据通常包含大量的节点（变量），用矩阵
表示即变量数狆大于观测数狀，在此情况下，经验协方差矩阵犛为奇异
矩阵，并不可逆，从而无法估计 Θ 矩阵。即使狆≈狀，并且犛不为奇异
矩阵， Θ 的最大似然估计也会由于过高的方差而失去效力。二是稀疏
性，用图模型表示的社会网络数据存在大量的两两条件独立变量，即
Θ 中存在很多零元素；而根据使公式（１）最大化估计得到的 Θ 一般来
说不存在值为０的元素。基于这两个性质，样本协方差矩阵不可逆，估
计逆协方差矩阵时存在不稳定、计算成本高、不精确等问题。
（二）罚似然估计法
１．罚似然估计法
近几十年来，统计学家针对高维稀疏数据提出了很多解决方案，其
中蒂施莱尼（犜犻犫狊犺犻狉犪狀犻，１９９６）所提出的罚似然回归法成为主流方法，
并被其他研究者进一步扩展和引入到高斯图模型中（犕犲犻狀狊犺犪狌狊犲狀犪狀犱
犅ü犺犾犿犪狀狀，２００６；犢狌犪狀犪狀犱犔犻狀，２００７；犘犲狀犵犲狋犪犾．，２００９）。罚似然法是
，
在线性回归公式中引入一个约束项（狉犲犵狌犾犪狉犻狕犲狉）或惩罚项（犲狀犪犾狋狔
狆
狋犲狉犿） Θ ，并由一个非负的优化参数（狋狌狀犻狀犵狆犪狉犪犿犲狋犲狉） λ 来控制。当 λ
足够大时， Θ 的一些元素的值将等于０，也就是说 λ 值越大，所估计的
逆协方差矩阵越稀疏。即使在狆＞狀的情形下，公式仍能够求解，其表
达式如下：
｛｝（２）
犿犪狓犻犿犻狕犲 Θ 犾狅犵ｄｅｔ Θ－狋狉犪犮犲（犛 Θ ）－λ‖Θ‖ １
罚则，１表示对矩阵 Θ 的所有元素的绝对值求
其中， ‖Θ‖ １为犾１
１．除了公式（２）提到的一范数（犾１），罚则范数的选择还包括零范数（犾０）、二范数（犾２）（岭回
归）、核范数（狀狌犮犾犲犪狉狀狅狉犿），以及混合一范数和二范数的弹性网回归（犈犾犪狊狋犻犮犖犲狋）（犣狅狌犪狀犱
犎犪狊狋犻犲，２００５），等等。更确切地说，本文所指的罚则模型是基于范数的罚则图模型（犾犪狊狊狅图
模型），包括融合了犾１范数和其他范数的扩展模型，本文后续所介绍的某些模型会采用弹性
网或多种罚则范数来处理。
· ７ ·

9 10 11 12 13 14 15 16 17 18 19