[論文レビュー] A Comparative Analysis of Forecasting Financial Time Series Using ARIMA, LSTM, and BiLSTM
この論文は金融時系列予測において ARIMA、LSTM、BiLSTM を比較し、BiLSTM が一般的に最良の予測精度を提供する一方で、LSTM より学習は遅い。
Machine and deep learning-based algorithms are the emerging approaches in addressing prediction problems in time series. These techniques have been shown to produce more accurate results than conventional regression-based modeling. It has been reported that artificial Recurrent Neural Networks (RNN) with memory, such as Long Short-Term Memory (LSTM), are superior compared to Autoregressive Integrated Moving Average (ARIMA) with a large margin. The LSTM-based models incorporate additional "gates" for the purpose of memorizing longer sequences of input data. The major question is that whether the gates incorporated in the LSTM architecture already offers a good prediction and whether additional training of data would be necessary to further improve the prediction. Bidirectional LSTMs (BiLSTMs) enable additional training by traversing the input data twice (i.e., 1) left-to-right, and 2) right-to-left). The research question of interest is then whether BiLSTM, with additional training capability, outperforms regular unidirectional LSTM. This paper reports a behavioral analysis and comparison of BiLSTM and LSTM models. The objective is to explore to what extend additional layers of training of data would be beneficial to tune the involved parameters. The results show that additional training of data and thus BiLSTM-based modeling offers better predictions than regular LSTM-based models. More specifically, it was observed that BiLSTM models provide better predictions compared to ARIMA and LSTM models. It was also observed that BiLSTM models reach the equilibrium much slower than LSTM-based models.
研究の動機と目的
- 金融予測において、従来の ARIMA と現代的な学習手法を比較評価する必要性を喚起する。
- 双方向学習(BiLSTM)が一方向 LSTM より予測精度を向上させるかを検証する。
- 金融データに対する LSTM 対 BiLSTM の学習挙動とトレーニングダイナミクスを分析する。
提案手法
- 複数のソース(Nikkei 225、IXIC、HSI、GSPC、DJI、IBM)からの金融時系列を予測するために ARIMA、LSTM、BiLSTM を用いる。
- 全モデルの特徴量としてAdjusted Close のみを入力とする。
- 70/30 の訓練/テスト分割でロールイング(再訓練)予測を適用し RMSE を測定する。
- 同一パイプライン内で LSTM と BiLSTM の切替を可能にする単一のコードベースを実装する。
- 基準として ARIMA/LSTM に対する RMSE およびパーセンテージ削減で性能を評価する。
実験結果
リサーチクエスチョン
- RQ1過去から未来へ、そして未来から過去へという両方向からの学習は、標準の一方向学習と比較して予測精度を改善するか。
- RQ2LSTM と BiLSTM は入力データの扱いとトレーニングダイナミクスにおいてどのように異なるか。
- RQ3金融時系列の学習中、どのアーキテクチャがより早く収束するか。
主な発見
| 銘柄 | ARIMA_RMSE | LSTM_RMSE | BiLSTM_RMSE | LSTM_over_ARIMA | BiLSTM_over_LSTM | BiLSTM_over_ARIMA |
|---|---|---|---|---|---|---|
| N225monthly | 766.45 | 102.49 | 23.13 | -77.43 | -96.98 | -86.66 |
| IXIC.daily | 34.61 | 2.01 | 1.75 | -12.93 | -94.94 | -94.19 |
| IXIC.weekly | 72.53 | 7.95 | 11.53 | 45.03 | -84.10 | -89.03 |
| IXIC.monthly | 135.60 | 27.05 | 8.49 | -68.61 | -93.37 | -80.00 |
| HSI.monthly | 1306.95 | 172.58 | 121.71 | -29.47 | -90.68 | -86.79 |
| GSPC.daily | 14.83 | 1.74 | 0.62 | -64.36 | -95.81 | -88.26 |
| GSPC.monthly | 55.30 | 5.74 | 4.63 | -19.33 | -91.62 | -89.62 |
| DJI.daily | 139.85 | 14.11 | 3.16 | -77.60 | -97.77 | -89.91 |
| DJI.weekly | 287.60 | 26.61 | 23.05 | -13.37 | -91.98 | -90.74 |
| DJI.monthly | 516.97 | 69.53 | 23.69 | -65.59 | -95.41 | -86.50 |
| IBM.daily | 1.70 | 0.22 | 0.15 | -31.18 | -91.11 | -87.05 |
| Average | 302.96 | 39.09 | 20.17 | -37.78 | -93.11 | -88.07 |
- BiLSTM は、テストデータセット全般において RMSE で LSTM および ARIMA を上回ることが多く、LSTM に対して平均 37.78% の RMSE 削減を達成し、ARIMA に対してはそれ以上。
- BiLSTM は ARIMA に対して平均 93.11%、LSTM に対して平均 37.78% RMSE を低減する。
- BiLSTM はより多くのデータバッチでの訓練を必要とし、LSTM よりも収束が遅くなる傾向がある(初期には損失が高いが、改善を続ける)。
- 平均的に、BiLSTM の RMSE は 20.17(LSTM は 39.09)で、対象データセットでの値。
- BiLSTM は双方向学習のため、LSTM(41–42)より小さめのバッチサイズ(71–75)を使用する傾向がある。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。