[论文解读] Twitter Sentiment Analysis Applied to Finance: A Case Study in the Retail Industry
本研究将推特情绪分析应用于预测零售行业的股票收益与波动率,使用来自推特和传统新闻源的情绪与传播量指标作为外生变量。研究发现,推特情绪显著格兰杰因果于股票收益与波动率,其在收益预测方面优于传统新闻来源,尤其在游戏驿站(GameStop)和艾伯兹克罗布尼奇(Abercrombie & Fitch)等公司中表现突出。
This paper presents a financial analysis over Twitter sentiment analytics extracted from listed retail brands. We investigate whether there is statistically-significant information between the Twitter sentiment and volume, and stock returns and volatility. Traditional newswires are also considered as a proxy for the market sentiment for comparative purpose. The results suggest that social media is indeed a valuable source in the analysis of the financial dynamics in the retail sector even when compared to mainstream news such as the Wall Street Journal and Dow Jones Newswires.
研究动机与目标
- 探究推特情绪与传播量是否包含关于零售行业股票收益与波动率的统计显著信息。
- 比较推特情绪分析与传统新闻源作为市场情绪代理的预测能力。
- 评估社交媒体与主流新闻在预测零售股金融动态方面的相对贡献。
- 评估情绪极性(正面/负面)与推文传播量在预测次日收益与波动率中的作用。
- 确定推特情绪是否能作为金融指标的前瞻性信息,尤其与既有的新闻来源相比。
提出的方法
- 采用先前研究中的情感分析方法,结合词典法与支持向量机(SVM)的混合方法,对推文进行正向、负向与中性分类。
- 收集了包括耐克(Nike)、劳氏(Home Depot)、美泰(Mattel)、游戏驿站(GameStop)和艾伯兹克罗布尼奇(Abercrombie & Fitch)在内的上市零售公司推特情绪(G(t), B(t))与传播量(V(t)) 数据。
- 通过OptiRisk Systems获取RavenPack新闻分析系统提供的传统新闻情绪数据,作为市场情绪的对比代理。
- 应用格兰杰因果检验,评估推特情绪与传播量是否能预测未来的股票收益与波动率,使用滞后变量。
- 构建多重回归模型,使用滞后情绪(G(t-1), B(t-1))、传播量(V(t-1))与前期波动率(VOL(t-1), VOL(t-2))来预测次日波动率(VOL(t))。
- 使用统计显著性检验(p值)与误差减少指标,比较推特与新闻分析在预测准确性上的表现。
实验结果
研究问题
- RQ1推特情绪是否在零售行业中格兰杰因果于股票收益与波动率?
- RQ2推特情绪在预测股票收益与波动率方面的预测能力,与传统新闻源相比如何?
- RQ3在正面、负面或传播量等推特情绪指标中,哪一项与金融指标具有最强的预测关系?
- RQ4推特情绪与特定零售公司次日股票收益或波动率之间是否存在统计显著关系?
- RQ5推特情绪是否可作为市场情绪的互补或更优代理,相较于主流金融新闻?
主要发现
- 推特情绪在股票收益上的格兰杰因果性显著强于传统新闻源,尤其在游戏驿站(GME.N)与艾伯兹克罗布尼奇(ANF.N)中表现突出,p值分别为0.001***与0.004***。
- 正面情绪(G(t))在耐克(NKE.N)与游戏驿站(GME.N)的超额对数收益预测中具有显著格兰杰因果性,回归模型中p值分别为0.010**与0.001***。
- 推特情绪提升了波动率预测表现:对于游戏驿站,推特分析使预测误差降低14.99%,优于新闻分析带来的2.21%误差增加。
- 正面推文数量是多个公司1步前瞻波动率的显著预测因子(p < 0.05),而负面推文数量则无统计显著性。
- 对于劳氏(HD.N),推特情绪使预测误差降低1.10%,而新闻分析使误差降低2.46%,表明在此情况下推特具有更强的预测能力。
- 在波动率建模中,推特情绪(尤其是正面情绪)对预测有显著贡献,格兰杰因果p值分别为0.004***(劳氏)与0.031**(耐克)。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。