Skip to main content
QUICK REVIEW

[論文レビュー] The Wall Street Neophyte: A Zero-Shot Analysis of ChatGPT Over MultiModal Stock Movement Prediction Challenges

Qianqian Xie, Weiguang Han|arXiv (Cornell University)|Apr 10, 2023
Stock Market Forecasting Methods被引用数 23
ひとこと要約

本論文は、3つのデータセットにまたがる価格特徴とツイートを用いたゼロショットのマルチモーダル株価変動予測タスクでChatGPTを評価し、強力なベースラインと比較し、プロンプト戦略と説明性の分析を行う。

ABSTRACT

Recently, large language models (LLMs) like ChatGPT have demonstrated remarkable performance across a variety of natural language processing tasks. However, their effectiveness in the financial domain, specifically in predicting stock market movements, remains to be explored. In this paper, we conduct an extensive zero-shot analysis of ChatGPT's capabilities in multimodal stock movement prediction, on three tweets and historical stock price datasets. Our findings indicate that ChatGPT is a "Wall Street Neophyte" with limited success in predicting stock movements, as it underperforms not only state-of-the-art methods but also traditional methods like linear regression using price features. Despite the potential of Chain-of-Thought prompting strategies and the inclusion of tweets, ChatGPT's performance remains subpar. Furthermore, we observe limitations in its explainability and stability, suggesting the need for more specialized training or fine-tuning. This research provides insights into ChatGPT's capabilities and serves as a foundation for future work aimed at improving financial market analysis and prediction by leveraging social media sentiment and historical stock data.

研究の動機と目的

  • 過去の価格特徴量とツイートを使用したマルチモーダル株価変動予測におけるChatGPTのゼロショット性能を評価する。
  • Chain-of-Thoughtを含むプロンプト設計を含むプロンプト戦略が予測精度に与える影響を評価する。
  • ツイート情報を組み込むことが予測を改善するか、あるいはこの金融文脈におけるモデルの説明性の振る舞いに影響を与えるかを調査する。

提案手法

  • 日 T までの価格特徴量とツイートを使用して、株価変動予測を上昇/下落の2値分類問題として定式化する。
  • 標準化前処理を用いて、BIGDATA22、ACL18、CIKM18 の3つのベンチマークデータセットで評価する。
  • 複数のプロンプトを試す:バニラのゼロショットおよびChain-of-Thought(CoT)プロンプティング、ツイートを含むCoTを含む。
  • ChatGPTを、LR、RF、LSTM系、DTML、StockNet、SLOT などのベースライン群と比較する。
  • ACCとMCCを評価指標として、データセット全体で予測性能を評価する。

実験結果

リサーチクエスチョン

  • RQ1RQ1: 過去の特徴とツイートを用いたマルチモーダル株価変動予測におけるゼロショット設定でのChatGPTの性能はどうか?
  • RQ2RQ2: Chain-of-Thoughtを含むプロンプト設計はこのタスクにおけるChatGPTの性能を改善できるか?
  • RQ3RQ3: ツイート情報の組み込みはChatGPTの予測を助けるか、それともノイズを増やすか?

主な発見

方法BIGDATA22 ACCBIGDATA22 MCCACL18 ACCACL18 MCCCIKM18 ACCCIKM18 MCC
LR53.070.020052.200.044252.50-0.0425
RF47.10-0.111451.940.034853.570.0119
LSTM50.690.012752.750.063953.310.0216
ALSTM48.69-0.025451.820.042952.54-0.0077
Adv-ALSTM50.360.012053.110.068553.690.0217
DTML51.650.065158.120.180653.860.0049
ALSTM-W48.28-0.011653.320.075453.640.0315
ALSTM-D49.160.009052.980.068150.40-0.0449
StockNet52.99-0.016353.60-0.024852.35-0.0161
SLOT54.810.095258.720.206555.860.0899
ChatGPT_zs53.13-0.025150.380.004955.430.0111
ChatGPT_cot48.440.006451.340.019948.280.0210
ChatGPT_zs w/o tweets50.680.000751.670.037748.83-0.0011
ChatGPT_cot w/o tweets48.16-0.043050.110.004748.970.0082
  • ChatGPTは一般に最先端技術や従来手法と比べて劣り、いくつかのデータセットで限定的な利得にとどまる。
  • Chain-of-Thoughtプロンプトは限定的な改善をもたらし、専門モデルとの差を埋めるには至らない。
  • ツイートを含めると、多くのデータセットでChatGPTの性能が向上し、多モーダル株予測におけるテキストデータの価値が浮き彫りになる。
  • ChatGPTはCoTプロンプトを通じて説明を提供できるが、マルチモーダル情報の融合による予測制約を完全には解消できない。
  • データセット間で性能は異なる(例えばChatGPT_zsはCIKM18でACC 55.43%を達成、MCC 0.0111; ACL18では低い結果)。
  • アブレーションではツイートは一般に結果向上に寄与するが、必ずしも普遍的ではなく、データセットによってツイートを除去すると時には害したり有利になったりする。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。