[論文レビュー] Feature Engineering for Mid-Price Prediction Forecasting with Deep Learning
本稿では、限界注文書(LOB)データから導出された新しい一連の手作業で設計された経済統計特徴量を提案し、中央価格の変動予測を向上させる。マルチオブジェクティブなオンライン学習フレームワークを用いて、価格の方向と変動までの時間(注文書イベント数)を同時に予測し、LSTM、CNN、MLPといった深層学習モデルを用いて、流動的・非流動的株式において優れた性能を達成した。
Mid-price movement prediction based on limit order book (LOB) data is a challenging task due to the complexity and dynamics of the LOB. So far, there have been very limited attempts for extracting relevant features based on LOB data. In this paper, we address this problem by designing a new set of handcrafted features and performing an extensive experimental evaluation on both liquid and illiquid stocks. More specifically, we implement a new set of econometrical features that capture statistical properties of the underlying securities for the task of mid-price prediction. Moreover, we develop a new experimental protocol for online learning that treats the task as a multi-objective optimization problem and predicts i) the direction of the next price movement and ii) the number of order book events that occur until the change takes place. In order to predict the mid-price movement, the features are fed into nine different deep learning models based on multi-layer perceptrons (MLP), convolutional neural networks (CNN) and long short-term memory (LSTM) neural networks. The performance of the proposed method is then evaluated on liquid and illiquid stocks, which are based on TotalView-ITCH US and Nordic stocks, respectively. For some stocks, results suggest that the correct choice of a feature set and a model can lead to the successful prediction of how long it takes to have a stock price movement.
研究の動機と目的
- 限界注文書(LOB)データを用いた中央価格予測のための有効な特徴工学の不足に対処すること。
- 基礎証券の統計的性質を捉える包括的な経済統計特徴量の設計。
- 次回の価格変動の方向と変化までの注文明細イベント数を同時に予測するマルチオブジェクティブなオンライン学習プロトコルの開発。
- 流動的・非流動的株式を含む多様な市場状況において、提案された特徴量セットとモデルアーキテクチャの評価。
- 適切な特徴量と深層学習モデルの組み合わせが、価格変動のタイミングを成功裏に予測できることを示すこと。
提案手法
- 指値差配、深さ、注文フローの不均衡といった、LOBデータの統計的性質に基づいた新しい手作業特徴量の設計。
- 中央価格予測を統合的予測タスクとして扱うマルチオブジェクティブ学習フレームワークの実装:次回の価格変動の方向と変化までのイベント数の両方を予測。
- 設計された特徴量を、マルチレイヤーパーセプトロン(MLP)、畳み込みニューラルネットワーク(CNN)、長期短期記憶(LSTM)ネットワークを含む9種類の深層学習モデルに供給。
- リアルタイム予測シナリオをシミュレートするためにオンライン学習プロトコルを用いてモデルを訓練および評価。
- 流動的株式のテストにはTotalView-ITCH USデータ、非流動的株式のテストにはNordic取引所データを用い、多様な市場状況の検証を確保。
- マルチオブジェクティブ予測に特化したモデル評価指標を用い、価格変化の方向とタイミングの両方における正確性に焦点を当てる。
実験結果
リサーチクエスチョン
- RQ1LOBデータから導出された手作業特徴量が、中央価格変動予測を効果的に改善できるか?
- RQ2価格変動の方向と変動までの時間を同時に予測するマルチオブジェクティブ学習アプローチは、単一タスクモデルを上回る性能を示すか?
- RQ3提案された特徴量セットを入力とした場合、MLP、CNN、LSTMといった異なる深層学習アーキテクチャの性能はどのように異なるか?
- RQ4提案された特徴量とモデルは、流動的・非流動的株式の両方で一般化できる程度に高い汎用性を示すか?
- RQ5提案された特徴量工学と深層学習パイプラインを用いることで、価格変動のタイミングを信頼性高く予測できるか?
主な発見
- 提案された特徴量セットは、原始的なLOBデータを用いたベースライン手法と比較して、中央価格予測性能を顕著に向上させた。
- 特定の銘柄では、最適な特徴量と深層学習モデルの組み合わせにより、価格変動が発生するまでの注文明細イベント数の予測に成功した。
- LSTMベースのモデルは、LOBデータ内の時間的依存性を捉える能力が高く、特に変動のタイミング予測において優れた性能を示した。
- マルチオブジェクティブ学習フレームワークは、単一タスクベースラインと比較して、方向とタイミングの両方の予測精度を向上させた。
- 本手法は流動的・非流動的両方の株式において堅牢であったため、異なる市場状況においても一般化可能であることが示された。
- 結果から、高度な深層学習モデルでさえも、中央価格予測の高精度を達成するには特徴工学が極めて重要な要因であることが示唆された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。