Page 233 - 《社会》2017年第4期
P. 233

社会· 2017 · 4


       三、数据、方法与实证结果

       (一)数据与变量编码
       1. 数据来源
       本文使 用 了 皮 尤 “互 联 网 与 美 国 生 活 项 目”( 犘犲狑犐狀狋犲狉狀犲狋犪狀犱
   犃犿犲狉犻犮犪狀犔犻犳犲犘狉狅 犼 犲犮狋 ) 2012 年 1 月发布的调查数据。 4 该调查采用随机
   数码拨号( 犚犪狀犱狅犿犇犻 犵 犻狋犇犻犪犾 ,简称 犚犇犇 )抽样方法在全美进行了电话
   调查(包含固定电话和手机)。样本总数为 2253 个,本文使用了其中 1
   047 个社交网络使用者样本。由于部分变量存在缺失情况,本文使用

   多 变 量 链 式 方 程 插 补 法 ( 犿狌犾狋犻狏犪狉犻犪狋犲犻犿 狆 狌狋犪狋犻狅狀 狌狊犻狀 犵 犮犺犪犻狀犲犱
   犲 狇 狌犪狋犻狅狀狊 , 犕犐犆犈 )对纳入分析的缺失变量进行处理。具体方式是根据
   贝叶斯方法,利用不含缺失值的分析变量建立 10 个完整数据集,然后
   进行不断的重复抽样,直至实现缺失值填补的最优拟合。 5 根据原数据
   库提供的人口权数,我们对样本进行了加权处理。
       2. 因变量
       由于样本为个体抽样数据且非动态监测数据,借鉴前述一些网络
   数据研究的做法———这些研究通常将用户观点分为正、反以及中间派
   三类,随着时间的推移,中间派逐步消失,正反两派的内部链接逐步变
   得更为 密 集 以 反 映 极 化 情 况 ( 犌犪犻狀犲狊犪狀犱 犕狅狀犱犪犽 , 2009 ; 犌犻犾犫犲狉狋 , 犲狋
  犪犾. , 2009 : 1-10 ; 犆狅狀狅狏犲狉 , 犲狋犪犾. , 2011 )———从群体极化的微观表现
   考虑,本文将群体极化分为两个维度:( 1 )群体性。表现为社交网络用
   户与网络中“朋友”观点的一致性程度。( 2 )积极性。表现为受访者自
   评受到链接群体影响后,是否变得更为积极表达。根据乐媛、杨伯淑
   ( 2010 )对在线论坛政治极化的研究,网民发帖积极性越高,且论坛意见
   的同质化程度越高,则在线论坛中的群体极化程度也越高。因此,群体


   4. 该数据的具 体 情 况 可 参 见 皮 尤 项 目 网 站: 犺狋狋 狆 : ∥狆 犲狑犻狀狋犲狉狀犲狋.狅狉 犵 / 犛犺犪狉犲犱犆狅狀狋犲狀狋 / 犇犪狋犪
   犛犲狋狊 / 2012 / 犉犲犫狉狌犪狉 狔 2012 — 犛犲犪狉犮犺犛狅犮犻犪犾犖犲狋狑狅狉犽犻狀 犵 犛犻狋犲狊犪狀犱犘狅犾犻狋犻犮狊.犪狊 狆 狓 。
   5. 我们进行了两次多重插补。第一次插补是针对全体的互联网用户样本( 犖=2253 ),主要存
   在部分人口学特征变量的缺失,具体缺失情况为:年龄( 2.35% )、教育( 0.8% )、收入( 14% )、
   婚姻( 1.0% )、族群( 2.8% )。第二次是选取了全体互联网用户的社交网络用户子样本( 犖=
   1047 ),针对社交网络使用行为各项的插补,具体缺失情况为:社交网络使用( 0.67% )、政治性
   使用( 0.30% )、“朋友”的政治性使用( 2.77% )、与“朋友”观点保持一致( 9.4% )、更积极地参
   与政治讨论( 0.57% )、成为分享自己观点者的粉丝( 0.27% )、对不同观点保持沉默( 0.38% )、
   政治性使用的重要性(因子分析各项目, 0.57% )。
    · 2 2 6 ·
   228   229   230   231   232   233   234   235   236   237   238