Page 10 - 《社会》2017年第2期
P. 10
罚似然图模型与社会网络测量
一、导言
随着互联网和智能设备愈来愈多地介入人们的日常生活以及大数
据概念的提出,在社会科学研究领域,研究者们面对着一个新的非常巨
大的数据源。不同于传统的问卷调查数据,这种新的数据来自各类智能
设备的记录:手机信号塔所记录的在某个范围内的人群聚集状况,摄像
头所捕捉到的人们在各个场所的出现,人们在互联网使用过程中所留下
的轨迹或积累的信息等,例如微博的评论或转发、网络论坛上的发帖和
回帖。也有一些数据早已进入研究者的视野,由于信息化手段的丰富多
样,研究者们无需再大费周章专门进行数据录入或转换,例如人们的日
常消费记录、学术文献的作者信息和引文信息、公司间的联动交易信息,
等等。对于上述数据,研究者们往往关注其中的共现关系并探讨其潜在
的社会机制。例如,在同一个论坛的帖子里进行讨论的用户可能对某一
话题具有共同的兴趣,在科学文献作品中科学家之间合作关系的形成,
图书购买记录背后所蕴含的共同的政治态度和价值观,等等。
一般来说,对上述数据的分析大多采用社会网络分析方法进行。
从数据分析的角度来看,这类互动数据可以用一个发生矩阵( 犻狀犮犻犱犲狀犮犲
犿犪狋狉犻狓 )来表示,例如一个 狀×犿 的二进制矩阵 犘 :
狏 1 狏 2 狏 3 狏 4 狏 5
犲 1 1 1 0 0 0
熿 燄
犲 2 3 0 1 0 0
犲 3 1 0 0 3 0
P=
犲 4 0 4 0 1 0
犲 5 0 0 1 0 2
犲 6 0 0 0 0 3 燅
燀
其中矩阵的行表示某个场所或事件,例如微博的博文、学术文章或者
购物清单等,矩阵的列则表示参与该事件的基本单位或成员,例如转发微
博的用户、文章作者或者消费者所购买的商品的名称。若 狆 犻 犼=1 则表示第
犼 个成员参与了第犻 次事件,反之则表示没有参与。矩阵 犘 也可以采用权
值的方式表示,即矩阵元素的取值表示参与的权值,例如回帖或转发的次
数、所购买的商品数量、停留的时长等。在社会网络分析方法中,将上述社
会网络结构称为双模网络,也称双重网络( 犫犻 狆 犪狉狋犻狋犲 )或“隶属网”。
· 3 ·