Skip to main content
QUICK REVIEW

[论文解读] Market Trend Prediction using Sentiment Analysis: Lessons Learned and Paths Forward

Andrius Mudinas, Dell Zhang|arXiv (Cornell University)|Mar 13, 2019
Stock Market Forecasting Methods参考文献 33被引用 39
一句话总结

本论文测试情感态度与情感是否来自金融新闻和社交媒体的格兰杰因果关系导致股票价格变动,以及添加情感特征是否提升市场趋势预测;总体上态度通常不导致价格变动,情感在某些股票上偶尔会起作用,情感特征带来混合、取决于数据来源的改进。

ABSTRACT

Financial market forecasting is one of the most attractive practical applications of sentiment analysis. In this paper, we investigate the potential of using sentiment \emph{attitudes} (positive vs negative) and also sentiment \emph{emotions} (joy, sadness, etc.) extracted from financial news or tweets to help predict stock price movements. Our extensive experiments using the \emph{Granger-causality} test have revealed that (i) in general sentiment attitudes do not seem to Granger-cause stock price changes; and (ii) while on some specific occasions sentiment emotions do seem to Granger-cause stock price changes, the exhibited pattern is not universal and must be looked at on a case by case basis. Furthermore, it has been observed that at least for certain stocks, integrating sentiment emotions as additional features into the machine learning based market trend prediction model could improve its accuracy.

研究动机与目标

  • 在金融领域澄清情感的构成,通过区分情感态度与情感情绪。
  • 在多数据源之间测试情感信号与股票价格变动的格兰杰因果关系。
  • 评估将情感态度与情感情绪纳入是否能在技术指标基线之上提升机器学习市场趋势预测。
  • 评估数据源与时间粒度如何影响情感与价格之间的关系。
  • 为未来基于情感的市场预测研究提供指引与方向。

提出的方法

  • 收集并预处理三类数据源:金融时报文章、Reddit WorldNews Channel 标题,以及带有股票代码的股票推文数据。
  • 将情感定义为态度(积极/消极)和情感(八个Plutchik维度),并使用领域特定词典进行提取。
  • 应用滞后一天或两天的格兰杰因果检验以确定情感与价格变动之间的方向性。
  • 使用十五个技术指标建立基线市场趋势模型,并比较 SVM 与 LSTM 的表现。
  • 在基线模型中加入情感态度和情感特征,评估在股票与货币的预测准确度上的影响。

实验结果

研究问题

  • RQ1市场情感(态度与情感)是否对股票价格变动具有格兰杰因果关系?
  • RQ2股票价格变动是否对市场情感具有格兰杰因果关系?
  • RQ3情感态度及/或情感情绪是否能在技术指标基线之外提升市场趋势预测?
  • RQ4数据源(FT、RWNC、Twitter)与时间粒度如何影响情感在预测中的有效性?

主要发现

  • 情感态度在所有数据集中很少对股票价格变动具有格兰杰因果关系。
  • 股票价格变动更常对情感态度具有格兰杰因果关系,特别是在时间情感建模时。
  • 情感情绪对某些个别股票显示出预测能力,但结果因股票和数据期而异。
  • 将来自标题的情感信号纳入通常不会提升预测;当有改进时,取决于股票和数据源(例如一些 FT 新闻案例)。
  • 推文的结果混合,在短期牛市中预测价值有限。
  • 总体而言,情感信号的有用性因案而异且取决于数据源;尚未确立普遍的预测能力。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。