Page 11 - 《社会》2017年第2期
P. 11
社会· 2017 · 2
在社会网络分析方法中,有很多对双模数据进行分析的方法,既有
直接对双模网络的关联模式进行分析的方法,也有将双模网络变为单
模网络的降模法。就行为观测数据而言,研究者通常只关心列模(成员
模)的网络关联模式,行模(事件模)则作为协变量来考虑。将二进制双
模数据进行一个简单的矩阵映射,就可得到一个单模矩阵,又称共生矩
阵( 犮狅狅犮犮狌狉狉犲狀犮犲犿犪狋狉犻狓 )。这个单模矩阵 既可 以是 表示 列模的数 据
( 犘 ×犘 , 犿 ×犿 ),也可以是表示行模的数据( 犘×犘 , 狀×狀 ),数据
犜
犜
的选择取决于研究者的需要。单模矩阵的数值则表示参与者两两之间
共同出现的频次,因此该矩阵可视为有权网。从计算的角度来说,使用
矩阵映射进行降模可以得到参与者的行为频次信息,非常简单高效。
但是,对于带权值的发生矩阵,降模映射则不太适用。其最大的缺
点在于降模之后所得到的是一个密集矩阵。在原双模网络中,若节点
的中心度为 犱 的话,则降模之后变为[ 犱× ( 犱-1 )]/ 2 ,从而放大了网
,
络密度,并在某种程度上扭曲了网络结构( 犔犪狋犪 狆狔犲狋犪犾. , 2008 )。因
此,通常来说还需进一步处理,将其转换为二进制作为社会网络关系的
量度。然而这种二值化量度的困扰在于如何确定阈值。若采用一个单
一阈值对矩阵权值进行转换,则其潜在假设是参与者有相同的分布。
例如,在网络社区中,网络成员之间的发帖数和回复数存在非常大的变
差。假设成员 狓 与 狕 共有 3 次回复,成员 狔 与 狕 共有 5 次回复,但 狓
的总回帖量是 3 次,而 狔 的总回帖量是 100 次。我们该如何判定或比
较 狓狕 和 狕 这两对关系呢?显而易见,基于单一阈值的二值化网络
狔
测度难以处理此类情形。在此基础上,可以考虑相对比例,例如 3 / 3 与
5 / 100 。巴拉 特 等 人 ( 犅犪狉狉犪狋 , 犲狋犪犾. , 2004 ; 犅犪狉狋犺 犾犲犿 狔 犲狋犪犾. , 2005 ;
,
犖犲狑犿犪狀 , 2004 )提出了改进型的加权方案,但其着重于探测网络的社
区结构,而非节点间的关系测度。
除了降模映射法,典型的处理方式还包括直接计算列模的相关系
数矩阵并作为社会网络测量。相关系数法的优点在于能够控制不同参
与者的活跃程度,但缺点是无法识别虚假相关,同时相关系数矩阵作为
一个稠密矩阵 也 不 太 适 合 对 大 规 模 网 络 进 行 测 量。有 学 者 ( 犚犪犲犱犲狉
犪狀犱犆犺犪狑犾犪 , 2011 ; 犣狑犲犻 犵犪狀犱犓犪狌犳犿犪狀狀 , 2011 )将双模数据视为“购物
篮”问题,采用数据挖掘手段来发现列模之间的关联模式,然而其可信
度和解释力不太能够得到保证。
· 4 ·