Page 193 - 《社会》2015年第4期
P. 193

社会· 2015 · 4

   人计划”(前三批)人数最多的生命科学领域的学者作为高端归国者的
   样本。“千人计划”并未统一公布每年入选的名单(陆道坤等, 2010 )。
   本研究使用的初始名单是笔者对网上信息整理所得,并通过不同来源
   进行对比,以保证名单的完整性和准确性。整理后的名单包括各学科
   千人总计 247 人。通过搜索获得“千人计划”学者的引入单位、原工作
   单位、具体研究领域、全职回国还是部分回国等信息,然后对数据进行
   清洗,将样本限定为生命科学领域全职回国的中国籍学者。
       接下来,通过科学网( 犠犲犫狅犳犛犮犻犲狀犮犲 )数据库查找“千人计划”学者
   样本在 犛犆犐 引文目录中的所有文章( 犪狉狋犻犮犾犲狊 )。华裔作者在外文期刊
   发表文章时常出现重名或中英文姓名拼写不符的情况。为提高检索精
   度,我们进行以下操作:通过个人主页上的文章列表获取学者发表文章
   时的准确姓名拼法;根据该姓名进行检索,若该学者发表的文章数过
   少,不便于分析,则放弃该样本;若出现同名作者,则根据研究领域进行
   筛选;若依然无法区分同名作者,则根据作者所属机构进行筛选;如果
   依然无法区分同名作者,就放弃该样本。
       经过两轮数据清洗,最终获得 2008 — 2010 年生命科学领域全职回
   国的学者样本 19 人。我们下载他们截至 2013 年 12 月发表的所有文
   章信息:文章标题、期刊、作者、关键词、摘要、施引和被引情况,并分为
   1980 — 2007 年和 2011 — 2013 年两个时间段的数据。时间的区分主要
   是基于事件研究( 犲狏犲狀狋狊狋狌犱 狔      )方法,“千人计划”学者全职回国为研究
   中的事件。在这一事件前后,假定“千人计划”学者本身并无重大变化,
   这样可以排除其他因素的影响,重点考察回国这一事件对“千人计划”
   学者学术社会资本的影响。研究未纳入 2008 — 2010 年的数据是为了
   尽量减少文章发表的迟滞效应。需要注意的是,两个时间段并未完全
   相等,但因为考察的是具体事件的影响,所以并不一定要求时间窗口要
   一样。我们使用 犘犪 犼 犲犽 软件将其整理为合作者矩阵。这样,我们就获
   得了“千人计划”学者归国前和归国后的两个论文合作网络。
       (二)研究方法
       在本文,笔者使用社会网络分析方法进行研究。聚集系数可以用来
   测量千人的合作者间的紧密程度,聚集系数越高的“千人计划”学者,联
                                                          ,
   系两个学术圈的能力可能更强。千人犻 的聚集系数如下( 犔犪狋犪 狆狔2008 ):


    · 1 8 6 ·
   188   189   190   191   192   193   194   195   196   197   198