Page 69 - 《社会》2017年第2期
P. 69
社会· 2017 · 2
了传播中的放大和波动效应,暗示舆情对股市可能所具有的重要影响
力还是体现了股市对舆情的影响,需要我们在研究中进一步判明。
表 1 :股市热词的新浪微指数描述
利空术语 震荡期 平稳期 利好术语 震荡期 平稳期
股灾 6594 ( 11883 ) 180 ( 597 ) 救市 12918 ( 28125 ) 683 ( 355 )
爆仓 1776 ( 1954 ) 1251 ( 965 ) 抄底 5666 ( 6280 ) 3275 ( 2932 )
跌停 12180 ( 18785 ) 2305 ( 5737 ) 牛市 14923 ( 7743 ) 6057 ( 6610 )
暴跌 14320 ( 15977 ) 5155 ( 6607 ) 涨停 2697 ( 1579 ) 813 ( 454 )
停牌 5846 ( 12953 ) 1101 ( 737 ) 多头 3467 ( 2403 ) 3237 ( 1552 )
熊市 3658 ( 4645 ) 1427 ( 666 ) 利多 4606 ( 4268 ) 5630 ( 3294 )
空头 4520 ( 7055 ) 1527 ( 779 ) 反弹 25582 ( 12842 ) 30133 ( 9441 )
利空 2013 ( 2141 ) 2023 ( 1574 ) 回档 98 ( 77 ) 124 ( 110 )
割肉 371 ( 1029 ) 83 ( 47 ) 增仓 154 ( 245 ) 63 ( 77 )
逼空 218 ( 193 ) 169 ( 119 ) 护盘 3370 ( 8475 ) 133 ( 116 )
抛售 811 ( 645 ) 1102 ( 495 ) 开户 3020 ( 1413 ) 3724 ( 2904 )
离场 3698 ( 2643 ) 3758 ( 1906 ) 改革牛 2518 ( 4366 ) 902 ( 929 )
崩盘 3318 ( 3113 ) 1664 ( 835 ) 慢牛 3201 ( 1722 ) 1315 ( 737 )
跳水 8699 ( 12057 ) 5062 ( 1884 )
打压 6485 ( 8310 ) 4876 ( 2339 )
洗盘 1007 ( 627 ) 750 ( 442 )
阴跌 153 ( 141 ) 88 ( 79 )
套牢 1658 ( 2484 ) 231 ( 491 )
接下来,我们从这 31 个热词的词频时间序列中提取出一个潜在的
“共性”信息,也即将 31 个变量通过线性变换的“降维”,筛选出最重要的
成分———“微博信心指数”。我们使用经典的“主成分分析法”,分别对利
好热词和利空热词各自生成总得分。我们利用特征值大于 1 的主成分
(检验结果表明利好热词和利空热词各有 4 个特征值大于 1 的成分)和各
自解释贡献率,计算出利好热词和利空热词的因子得分然后相减,这样
就构造出基于股市热词的股市“微博信心指数”,计算公式如下:
犿 犿
∑ β 1 犼 犳 1 犼 ∑ β 2 犼 犳 2 犼
犐狀犱犲狓 =犛犮狅狉犲1-犛犮狅狉犲2= 犼=1 - 犼=1
犘 犮狌犿1 犘 犮狌犿2
其中, 犛犮狅狉犲1 为利好因子得分, 犛犮狅狉犲2 为利空因子得分, 为各主成
犳
分的预测因子值, β 为其解释贡献率, 犿 表示的是特征值大于 1 的因
子数量, 犘 是累积贡献率。 6 最后,我们在图 3 中绘制了“微博股市信心
6. 限于篇幅,相关特征值、累计贡献率和 犓犕犗 、 犛犕犆 检验统计量不再列出,感兴趣的读者可
以向作者索取。
· 6 2 ·