Page 63 - 《社会》2017年第2期
P. 63
社会· 2017 · 2
情对该股票的负面冲击。不过,现有的研究既少且仅仅关注某支股票
的个体行情,未能展示代表社会舆情的微博与股市总体走势的宏观层
次关联。
我们强调的是,和领域专业、受众较少且用户同质性单一的单个网
站或 犅犅犛 论坛不同,微博社交平台具有前者远远不及的开放、实时、影
响面广、使用者异质性强等重要特征,因此,微博舆情更适合作为全社
会心态的间接测度。微博中带有明确利空和利好导向的股市热议,从
逻辑角度更可能对真实的股市走势产生影响。此外,恰恰因为微博在
一定程度上能对社会总体舆情有所代表,因此,用微博舆情和股市总体
走势进行关联是值得重点关注的研究领域。
(二)股市术语与舆情信号
现有文献对舆论的看涨或看跌情绪主要是通过帖子的字面含义来
界定并计算,可利用人工判断或辅助以计算机学习的方式来进行(金雪
军等, 2013 )。本文主要利用微博中股市术语的市场信号来构建社会舆
情指数。股市术语指的是股票市场的专有名词。无论是微博还是其他
媒体,凡是和股市有关的讨论,都必然大量使用这些术语。重要的是,
不少股市术语本身带有明显的行情判断信号。我们认为,对于在微博
上被海量热议和大量提及的股市术语,用词频统计的方法可以构建整
个微博中关于股市走势的总体判断。
一个显而易见的问题在于,某个词汇带有明显利好和利空信号,并
不意味着这个词汇所在的语句和帖子本身具有完全相同的信号。例
如,“现在可以建仓”和“现在不能建仓”,虽然都使用“建仓”这个关键
词,但含义显然完全相反。因此,词频似乎不能代表舆情的指向。此
外,即便是用人工解读来取代词频统计似乎也不能解决这个问题。由
于互联网的匿名性和虚假信息惩戒机制的缺乏,理论上人们无法可靠
地判断发布者本身是否带有其他目的。例如,试图出售手头股票的发
布者,可能会散布虚假的利好信息,也因此同样一则消息会有截然相反
的市场预期解读。因此,字面含义明确的关键词,其在宏观层次上的统
计量(例如,词频加总)是否仍然能构成表达同样信号的指标?
根据微博传播的特点,我们提出分析层次、语法结构、测量方法和
文献证据等四个方面的理由。这些理由使我们可以利用被海量热议且
信号明确的股市术语词频构建舆情信心的指标。
· 5 6 ·