Skip to main content
QUICK REVIEW

[논문 리뷰] Stock Price Correlation Coefficient Prediction with ARIMA-LSTM Hybrid Model

Hyeong Kyu Choi|arXiv (Cornell University)|2018. 08. 05.
Stock Market Forecasting Methods인용 수 48
한 줄 요약

이 논문은 미래 주가 쌍 간 상관계수 예측을 위한 ARIMA-LSTM 하이브리드를 제안하며, 전통적 모델에 비해 여러 기간 및 자산 세트에서 예측 성능이 우수함을 보여준다. ARIMA는 선형성을 다루고, LSTM은 비선형 잔차를 포착하며, walk-forward 테스트로 평가된다.

ABSTRACT

Predicting the price correlation of two assets for future time periods is important in portfolio optimization. We apply LSTM recurrent neural networks (RNN) in predicting the stock price correlation coefficient of two individual stocks. RNNs are competent in understanding temporal dependencies. The use of LSTM cells further enhances its long term predictive properties. To encompass both linearity and nonlinearity in the model, we adopt the ARIMA model as well. The ARIMA model filters linear tendencies in the data and passes on the residual value to the LSTM model. The ARIMA LSTM hybrid model is tested against other traditional predictive financial models such as the full historical model, constant correlation model, single index model and the multi group model. In our empirical study, the predictive ability of the ARIMA-LSTM model turned out superior to all other financial models by a significant scale. Our work implies that it is worth considering the ARIMA LSTM model to forecast correlation coefficient for portfolio optimization.

연구 동기 및 목표

  • 포트폴리오 최적화를 정확한 미래 주가 간 상관 관계 예측으로 촉진한다.
  • 선형(ARIMA) 및 비선형(LSTM) 시계열 모델링을 결합하여 상관 데이터의 추세와 복잡한 패턴을 포착한다.
  • 표준 모델과의 예측 성능을 평가하고 시간 기간 및 자산 하위 집합에 걸친 강건성을 평가한다.
  • Walk-forward 평가 프레임워크와 다수의 지표(MSE, RMSE, MAE)를 사용하여 일반화를 검토한다.

제안 방법

  • 상관 시계열의 선형 성분을 모델링하고 필터링하기 위해 ARIMA를 사용하고 잔차를 얻는다.
  • ARIMA 잔차에 대해 LSTM을 학습시켜 비선형 동역학을 포착한다.
  • LSTM 학습을 위한 24단계 입력 구조를 20단계 시퀀스로 구성한다.
  • 개발 기간과 두 개의 테스트 기간에 걸친 walk-forward 최적화를 사용해 MSE, RMSE, MAE를 비교한다.
  • Full Historical, Constant Correlation, Single-Index, Multi-Group 모델과 ARIMA-LSTM을 비교한다.

실험 결과

연구 질문

  • RQ1ARIMA-LSTM 하이브리드가 전통 모델보다 주가 쌍 상관계수의 예측 오차(MSE/MAE/RMSE)를 더 낮게 만드는가?
  • RQ2개발, Test1, Test2 등 서로 다른 기간과 자산 하위 집합에서 ARIMA-LSTM 모델의 성능은 어떤가?
  • RQ3S&P 500 내에서 주식 선택의 변화에 대해 ARIMA-LSTM 접근법은 강건한가?
  • RQ4하이브리드 모델이 포트폴리오 최적화를 위한 전통적 상관 예측기 대비 상대적 개선은 어느 정도인가?

주요 결과

  • ARIMA-LSTM은 모든 데이터 세트에서 가장 낮은 예측 오차를 보였으며 Development에서 MSE는 0.1786, Test1에서 0.1889, Test2에서 0.2154이다.
  • ARIMA-LSTM 모델은 개발 및 테스트 기간에서 MSE, RMSE, MAE에서 모든 벤치마크 모델(Full Historical, Constant Correlation, Single-Index, Multi-Group)을 능가한다.
  • Development, Test1, Test2에서 Constant Correlation 모델은 비하이브리드 모델 중 최선이지만 모든 지표에서 ARIMA-LSTM에 뒤처진다.
  • 10개의 무작위 자산 세트에 대한 강건성 검증은 MSE 값이 0.1447에서 0.2353까지 나타나 자산 전반에서 안정적인 성능을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.