Skip to main content
QUICK REVIEW

[論文レビュー] Graph-Based Learning for Stock Movement Prediction with Textual and Relational Data

Qinkai Chen, Christian-Yann Robert|arXiv (Cornell University)|Jul 22, 2021
Stock Market Forecasting Methods被引用数 6
ひとこと要約

本稿では、株価予測の精度を向上させるために、金融ニュースのテキスト的センチメントと複数の関係的グラフ(例:セクター、相関、サプライチェーン)を統合的にモデル化するグラフベースの深層学習フレームワーク、Multi-Graph Recurrent Network (MGRN) を提案する。再帰的アーキテクチャを用いて複数のソースからの関係的データと時間的ダイナミクスを統合することで、MGRN は第10百分位で63.3%の精度を達成し、精度およびトレーディングシミュレーションの両面でベンチマークを上回り、金融予測における多関係的モデリングの価値を示している。

ABSTRACT

Predicting stock prices from textual information is a challenging task due to the uncertainty of the market and the difficulty understanding the natural language from a machine's perspective. Previous researches focus mostly on sentiment extraction based on single news. However, the stocks on the financial market can be highly correlated, one news regarding one stock can quickly impact the prices of other stocks. To take this effect into account, we propose a new stock movement prediction framework: Multi-Graph Recurrent Network for Stock Forecasting (MGRN). This architecture allows to combine the textual sentiment from financial news and multiple relational information extracted from other financial data. Through an accuracy test and a trading simulation on the stocks in the STOXX Europe 600 index, we demonstrate a better performance from our model than other benchmarks.

研究の動機と目的

  • 株価を独立した個体として扱い、相関または関連する株式からの相互影響効果を無視する従来のモデルの限界を解消すること。
  • 事前に定義された1つの関係的グラフしか使用しない、またはニュースの時間的ダイナミクスを無視する既存のモデルとのギャップを埋めること。
  • 多様な金融データソースから得られる無制限の関係的グラフを統合可能なスケーラブルなフレームワークを構築すること。
  • 統一されたグラフベースのアーキテクチャを用いて、テキスト的センチメントと関係的情報を同時にモデル化することで、株価変動予測の精度を向上させること。

提案手法

  • 個々の金融ニュースを固定長のベクトルに埋め込むために、Universal Sentence Encoder を採用する。
  • 価格相関(Corr)、GICS セクター階層(Sector)、サプライチェーン関係(Supply)といった、異なるデータソースから複数の関係的グラフを構築する。
  • 多スレッドのグラフ畳み込みネットワーク(GCN)を適用し、各グラフ内のノード(銘柄)間で関係的情報を集約し、接続された銘柄間でのメッセージ伝達を可能にする。
  • グラフ埋め込み特徴量と、ニュースシーケンスの時間的パターンをモデル化するための双方向LSTM(Bi-LSTM)を統合する。
  • 市場調整後のリターンに基づく株価変動分類(上昇/下落)のためのバイナリクロスエントロピー損失を用いて、エンドツーエンドのMGRNモデルを訓練する。
  • 複数のグラフからの出力を重み付き統合戦略で統合することで、モデルが同時に多様な関係的信号から学習できるようにする。

実験結果

リサーチクエスチョン

  • RQ1セクター、相関、サプライチェーンなどの複数の関係的グラフを統合することで、単一グラフまたは無グラフのベースラインを上回る株価変動予測が可能になるか?
  • RQ2ニュースシーケンスに時間的ダイナミクスを組み込むことで、ニュースを独立事象として扱う場合と比較して、予測性能がどのように向上するか?
  • RQ3多様なソースからの関係的情報が、ノイズが多いまたは誤った単一ソースのグラフに起因する予測誤差を低減するか?
  • RQ4分類精度および実世界のトレーディングシミュレーションの両面で、MGRNモデルは既存の最先端モデルをどの程度上回るか?

主な発見

  • MGRN は第10百分位(q=10)で63.3%の精度を達成し、次に優れたモデル(MAN-SF で59.9%)およびバニラRNN(58.0%)を大きく上回った。
  • 3つのグラフ(Corr, Sector, Supply)を併用することで、単一グラフを使用する場合と比較して、q=10で5%の精度向上、q=20で3.5%の向上が得られ、マルチグラフ統合の利点を実証した。
  • トレーディングシミュレーションにおいて、MGRN はすべてのベンチマークを上回り、年間リターン(q=2で74.0%)とシャープレシオの両方で最高を記録した。ブルームバーグセンチメントスコアをも上回る性能を示した。
  • Tullow Oil(TLW LN)の事例研究では、MGRN-Sector が内部取引のプラスニュース後、-7.7%のリターンを正しく予測した一方、バニラRNNは失敗した。これは、セクターグラフを通じて関連銘柄(例:Glencore)から伝搬されたネガティブシグナルが影響したためである。
  • GICSの細分化レベル3(業界レベル)のセクターグラフが最良のパフォーマンスを示し、q=10で58.0%の精度を達成した。粗いまたは細かい粒度のものよりも優れた性能を示した。
  • 供給チェーンのような個々のグラフは、不正確な場合に性能を低下させる可能性があるが、他のグラフと組み合わせることで誤差伝搬を緩和でき、マルチグラフ学習のロバスト性を実証した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。