Page 10 - 《社会》2017年第2期
P. 10

罚似然图模型与社会网络测量



       一、导言

       随着互联网和智能设备愈来愈多地介入人们的日常生活以及大数
   据概念的提出,在社会科学研究领域,研究者们面对着一个新的非常巨
   大的数据源。不同于传统的问卷调查数据,这种新的数据来自各类智能
   设备的记录:手机信号塔所记录的在某个范围内的人群聚集状况,摄像
   头所捕捉到的人们在各个场所的出现,人们在互联网使用过程中所留下
   的轨迹或积累的信息等,例如微博的评论或转发、网络论坛上的发帖和
   回帖。也有一些数据早已进入研究者的视野,由于信息化手段的丰富多
   样,研究者们无需再大费周章专门进行数据录入或转换,例如人们的日
   常消费记录、学术文献的作者信息和引文信息、公司间的联动交易信息,
   等等。对于上述数据,研究者们往往关注其中的共现关系并探讨其潜在
   的社会机制。例如,在同一个论坛的帖子里进行讨论的用户可能对某一
   话题具有共同的兴趣,在科学文献作品中科学家之间合作关系的形成,
   图书购买记录背后所蕴含的共同的政治态度和价值观,等等。
       一般来说,对上述数据的分析大多采用社会网络分析方法进行。
   从数据分析的角度来看,这类互动数据可以用一个发生矩阵( 犻狀犮犻犱犲狀犮犲
   犿犪狋狉犻狓 )来表示,例如一个 狀×犿 的二进制矩阵 犘 :
                            狏 1 狏 2 狏 3 狏 4 狏 5
                         犲 1   1 1 0 0 0
                           熿                  燄
                         犲 2   3 0 1 0 0
                         犲 3   1 0 0 3 0
                     P=
                         犲 4   0 4 0 1 0
                         犲 5   0 0 1 0 2
                         犲 6   0 0 0 0 3      燅
                           燀
      其中矩阵的行表示某个场所或事件,例如微博的博文、学术文章或者
   购物清单等,矩阵的列则表示参与该事件的基本单位或成员,例如转发微
   博的用户、文章作者或者消费者所购买的商品的名称。若                        狆 犻 犼=1 则表示第
  犼  个成员参与了第犻 次事件,反之则表示没有参与。矩阵 犘 也可以采用权
   值的方式表示,即矩阵元素的取值表示参与的权值,例如回帖或转发的次
   数、所购买的商品数量、停留的时长等。在社会网络分析方法中,将上述社
   会网络结构称为双模网络,也称双重网络( 犫犻 狆 犪狉狋犻狋犲 )或“隶属网”。

                                                            · 3 ·
   5   6   7   8   9   10   11   12   13   14   15