Skip to main content
QUICK REVIEW

[논문 리뷰] Financial Time-Series Forecasting: Towards Synergizing Performance And Interpretability Within a Hybrid Machine Learning Approach

Shun Liu, Kexin Wu|arXiv (Cornell University)|2023. 12. 31.
Stock Market Forecasting Methods인용 수 34
한 줄 요약

논문은 비트코인 가격 예측을 위한 하이브리드 ML 기법을 비교하고 선형, 트리, LSTM 모델 중 Lasso 회귀가 최고의 MAE를 보이며 높은 예측 점수를 내는 것으로 나타난다.

ABSTRACT

In the realm of cryptocurrency, the prediction of Bitcoin prices has garnered substantial attention due to its potential impact on financial markets and investment strategies. This paper propose a comparative study on hybrid machine learning algorithms and leverage on enhancing model interpretability. Specifically, linear regression(OLS, LASSO), long-short term memory(LSTM), decision tree regressors are introduced. Through the grounded experiments, we observe linear regressor achieves the best performance among candidate models. For the interpretability, we carry out a systematic overview on the preprocessing techniques of time-series statistics, including decomposition, auto-correlational function, exponential triple forecasting, which aim to excavate latent relations and complex patterns appeared in the financial time-series forecasting. We believe this work may derive more attention and inspire more researches in the realm of time-series analysis and its realistic applications.

연구 동기 및 목표

  • 암호화폐 시장 내에서 정확한 비트코인 가격 예측의 동기 부여.
  • 전통 통계 방법과 기계 학습을 결합한 하이브리드 ML 접근 방식 평가.
  • 전처리 및 모델 선택 분석을 통한 모델 해석 가능성 향상.
  • 시계열 예측에서 예측 성능과 설명가능성의 균형을 맞추는 모델 식별.

제안 방법

  • 정규화 및 롤링 특징 통계를 사용한 비트코인 가격 데이터 전처리.
  • 다양한 모델 비교: 이동평균을 이용한 선형 회귀, Lasso 회귀, 결정 트리 및 Long-Short Term Memory (LSTM).
  • 교차 검증 및 백테스팅으로 MAE와 점수를 지표로 성능 평가.
  • 하이퍼파라미터(T 재깅?) 그리드 서치를 통한 트리 깊이, 리프당 최소 샘플 수 등 튜닝.
  • 각 모델에 대한 질적 해석 가능성 인사이트 보고(의사 결정 트리, 선형 대 규제 회귀).

실험 결과

연구 질문

  • RQ1이 설정에서 비트코인 종가 예측에 가장 높은 예측 정확도를 제공하는 회귀 또는 학습 모델은 무엇인가?
  • RQ2정규화(Lasso)가 시계열 예측에서 기본 선형 회귀보다 개선되는가?
  • RQ3트리 기반 및 신경망 모델이 성능과 해석가능성 측면에서 비트코인 가격 예측에 대해 어떻게 비교되는가?

주요 결과

방법MAE(Val)점수
Naive Linear Regression96.200.9998
Lasso Regression91.800.9997
Decision Tree135.020.9988
  • Lasso Regression은 비교된 모델 중 최상의 MAE(91.80)를 달성한다.
  • Naive Linear Regression은 점수 0.9998로 가장 높은 일관성을 보인다.
  • Decision Tree는 MAE가 더 나쁘고 점수도 다소 낮다(135.02, 0.9988).
  • LSTM 모델은 이 설정에서 수렴이 좋지 않아 이 작업에 대한 데이터 또는 모델의 한계를 시사한다.
  • 이동 평균 특징과 함께하는 선형 회귀는 여전히 경쟁력이 있으며 데이터의 시간적 선형성을 강조한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.