[논문 리뷰] A Comparative Analysis of Forecasting Financial Time Series Using ARIMA, LSTM, and BiLSTM
논문은 ARIMA, LSTM, BiLSTM를 금융 시계열 예측에 비교하고 BiLSTM이 일반적으로 최상의 예측 정확도를 제공하지만 LSTM보다 훈련은 더 느리다.
Machine and deep learning-based algorithms are the emerging approaches in addressing prediction problems in time series. These techniques have been shown to produce more accurate results than conventional regression-based modeling. It has been reported that artificial Recurrent Neural Networks (RNN) with memory, such as Long Short-Term Memory (LSTM), are superior compared to Autoregressive Integrated Moving Average (ARIMA) with a large margin. The LSTM-based models incorporate additional "gates" for the purpose of memorizing longer sequences of input data. The major question is that whether the gates incorporated in the LSTM architecture already offers a good prediction and whether additional training of data would be necessary to further improve the prediction. Bidirectional LSTMs (BiLSTMs) enable additional training by traversing the input data twice (i.e., 1) left-to-right, and 2) right-to-left). The research question of interest is then whether BiLSTM, with additional training capability, outperforms regular unidirectional LSTM. This paper reports a behavioral analysis and comparison of BiLSTM and LSTM models. The objective is to explore to what extend additional layers of training of data would be beneficial to tune the involved parameters. The results show that additional training of data and thus BiLSTM-based modeling offers better predictions than regular LSTM-based models. More specifically, it was observed that BiLSTM models provide better predictions compared to ARIMA and LSTM models. It was also observed that BiLSTM models reach the equilibrium much slower than LSTM-based models.
연구 동기 및 목표
- 금융 예측에서 기존 ARIMA와 비교하여 현대적 학습 접근법의 평가 필요성을 제시한다.
- Bidirectional training (BiLSTM)가 단방향 LSTM보다 예측 정확도를 향상시키는지 조사한다.
- 금융 데이터에서 LSTM와 BiLSTM의 학습 동작 및 학습 역학을 분석한다.
제안 방법
- 다수 소스의 금융 시계열을 예측하기 위해 ARIMA, LSTM, BiLSTM를 사용합니다.
- 모든 모델의 특성으로 조정 종가(Adjusted Close)만 피처로 사용합니다.
- 70/30 학습/테스트 분할로 롤링(재훈련) 예측을 적용하고 RMSE를 측정합니다.
- 동일 파이프라인에서 LSTM과 BiLSTM 간 전환을 가능하게 하는 단일 코드 베이스를 구현합니다.
- RMSE 및 ARIMA/LSTM 베이스라인 대비 감소율로 성능을 평가합니다.
실험 결과
연구 질문
- RQ1과거→미래와 미래→과거 두 방향에서의 학습이 표준 단방향 학습보다 예측을 향상시키는가?
- RQ2LSTM과 BiLSTM이 입력 데이터 처리 및 학습 역학에서 어떻게 다른가?
- RQ3금융 시계열 학습에서 어느 아키텍처가 수렴 속도가 더 빠른가?
주요 결과
| 종목 | ARIMA_RMSE | LSTM_RMSE | BiLSTM_RMSE | ARIMA 대비 LSTM 감소율 | LSTM 대비 BiLSTM 감소율 | ARIMA 대비 BiLSTM 감소율 |
|---|---|---|---|---|---|---|
| N225monthly | 766.45 | 102.49 | 23.13 | -77.43 | -96.98 | -86.66 |
| IXIC.daily | 34.61 | 2.01 | 1.75 | -12.93 | -94.94 | -94.19 |
| IXIC.weekly | 72.53 | 7.95 | 11.53 | 45.03 | -84.10 | -89.03 |
| IXIC.monthly | 135.60 | 27.05 | 8.49 | -68.61 | -93.37 | -80.00 |
| HSI.monthly | 1306.95 | 172.58 | 121.71 | -29.47 | -90.68 | -86.79 |
| GSPC.daily | 14.83 | 1.74 | 0.62 | -64.36 | -95.81 | -88.26 |
| GSPC.monthly | 55.30 | 5.74 | 4.63 | -19.33 | -91.62 | -89.62 |
| DJI.daily | 139.85 | 14.11 | 3.16 | -77.60 | -97.77 | -89.91 |
| DJI.weekly | 287.60 | 26.61 | 23.05 | -13.37 | -91.98 | -90.74 |
| DJI.monthly | 516.97 | 69.53 | 23.69 | -65.59 | -95.41 | -86.50 |
| IBM.daily | 1.70 | 0.22 | 0.15 | -31.18 | -91.11 | -87.05 |
| Average | 302.96 | 39.09 | 20.17 | -37.78 | -93.11 | -88.07 |
- BiLSTM은 테스트 데이터셋 전반에서 RMSE가 일반적으로 LSTM 및 ARIMA보다 더 우수하며, LSTM 대비 평균 RMSE를 37.78% 감소시키고 ARIMA 대비 더 큰 감소를 보인다.
- BiLSTM은 ARIMA 대비 평균 93.11%, LSTM 대비 평균 37.78%의 RMSE 감소를 달성한다.
- BiLSTM은 더 많은 데이터 배치로 학습이 필요하고 LSTM보다 더 느리게 수렴하는 경향이 있다(초기 손실은 더 높지만 계속 개선된다).
- 평균적으로 BiLSTM의 RMSE는 20.17로, 분석 대상 데이터 세트에서 LSTM의 39.09에 비해 더 낮다.
- BiLSTM은 양방향 학습으로 인해 LSTM보다 더 작은 배치 크기를 사용하는 경향이 있다(71–75).
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.