Skip to main content
QUICK REVIEW

[논문 리뷰] Feature Engineering for Mid-Price Prediction Forecasting with Deep Learning

Adamantios Ntakaris, Giorgio Mirone|arXiv (Cornell University)|2019. 04. 10.
Stock Market Forecasting Methods참고 문헌 31인용 수 2
한 줄 요약

이 논문은 한정된 주문서(LOB) 데이터에서 유도된 수작업으로 구성된 경제계량학적 특징의 새로운 세트를 제안하여 중간가격 변동 예측을 향상시킨다. 다목적 온라인 학습 프레임워크를 사용하여 가격 방향과 이동까지의 시간을 동시에 예측하며, 순환 신경망(LSTM), 컨볼루션 신경망(CNN), 다층 퍼셉트론(MLP)과 같은 딥러닝 모델을 통해 유동성 있는 주식과 유동성이 낮은 주식 모두에서 뛰어난 성능을 달성한다.

ABSTRACT

Mid-price movement prediction based on limit order book (LOB) data is a challenging task due to the complexity and dynamics of the LOB. So far, there have been very limited attempts for extracting relevant features based on LOB data. In this paper, we address this problem by designing a new set of handcrafted features and performing an extensive experimental evaluation on both liquid and illiquid stocks. More specifically, we implement a new set of econometrical features that capture statistical properties of the underlying securities for the task of mid-price prediction. Moreover, we develop a new experimental protocol for online learning that treats the task as a multi-objective optimization problem and predicts i) the direction of the next price movement and ii) the number of order book events that occur until the change takes place. In order to predict the mid-price movement, the features are fed into nine different deep learning models based on multi-layer perceptrons (MLP), convolutional neural networks (CNN) and long short-term memory (LSTM) neural networks. The performance of the proposed method is then evaluated on liquid and illiquid stocks, which are based on TotalView-ITCH US and Nordic stocks, respectively. For some stocks, results suggest that the correct choice of a feature set and a model can lead to the successful prediction of how long it takes to have a stock price movement.

연구 동기 및 목표

  • 한정된 주문서(LOB) 데이터를 활용한 중간가격 예측을 위한 효과적인 특징 공학의 부족을 해결하기 위해.
  • 기초 자산의 통계적 성질을 반영하는 포괄적인 경제계량학적 특징 세트를 설계하기 위해.
  • 가격 이동 방향과 변화까지의 주문서 이벤트 수를 동시에 예측하는 다목적 온라인 학습 프rotocol를 개발하기 위해.
  • 다양한 시장 조건, 특히 유동성 있는 주식과 유동성이 낮은 주식을 포함하여 제안된 특징 세트와 모델 아키텍처의 성능을 평가하기 위해.
  • 적절한 특징 조합과 딥러닝 모델 조합이 가격 이동 시점 예측에 성공적으로 활용될 수 있음을 입증하기 위해.

제안 방법

  • 입찰-매도 스프레드, 깊이, 주문 흐름 불균형과 같은 LOB 데이터의 통계적 성질에 기반한 새로운 수작업 경제계량학적 특징 세트를 설계하기 위해.
  • 중간가격 예측을 통합 예측 과제로 간주하는 다목적 학습 프레임워크를 구현하여, 다음 가격 이동의 방향과 변화까지의 이벤트 수를 동시에 예측하기 위해.
  • 공학된 특징을 다층 퍼셉트론(MLP), 컨볼루션 신경망(CNN), 장기 순환 신경망(LSTM)을 포함한 아홉 가지 딥러닝 모델에 입력하기 위해.
  • 실시간 예측 시나리오를 시뮬레이션하기 위해 온라인 학습 프rotocol를 사용하여 모델을 훈련하고 평가하기 위해.
  • 유동성 있는 주식에 대한 TotalView-ITCH 미국 데이터와 유동성이 낮은 주식에 대한 노르딕 거래소 데이터를 활용하여 다양한 시장 조건 테스트를 보장하기 위해.
  • 다목적 예측에 특화된 모델 평가 지표를 적용하여 가격 변화의 방향성과 시점 예측 정확도에 중점을 두기 위해.

실험 결과

연구 질문

  • RQ1LOB 데이터에서 유도된 수작업 경제계량학적 특징이 중간가격 이동 예측에 효과적으로 기여할 수 있는가?
  • RQ2가격 방향과 이동까지의 시간을 동시에 예측하는 다목적 학습 접근법이 단일 과제 모델보다 우월한가?
  • RQ3제안된 특징 세트를 사용할 때, 다양한 딥러닝 아키텍처(MPL, CNN, LSTM)의 성능은 어떻게 되는가?
  • RQ4제안된 특징과 모델이 유동성 있는 주식과 유동성이 낮은 주식 모두에 일반화되는 정도는 어느 정도인가?
  • RQ5제안된 특징 공학 기반의 딥러닝 파이프라인을 통해 가격 이동 시점은 신뢰성 있게 예측할 수 있는가?

주요 결과

  • 제안된 특징 세트는 원시 LOB 데이터를 사용하는 기준 모델 대비 중간가격 예측 성능을 크게 향상시켰다.
  • 일부 주식에 대해서는 최적의 특징 조합과 딥러닝 모델 조합이 가격 이동 발생까지의 주문서 이벤트 수를 성공적으로 예측했다.
  • LSTM 기반 모델은 특히 이동 시점 예측에 있어 LOB 데이터의 시간적 의존성을 잘 포착하여 뛰어난 성능을 보였다.
  • 다목적 학습 프레임워크는 단일 과제 기반 모델 대비 방향성과 시점 예측 정확도를 모두 향상시켰다.
  • 이 방법은 유동성 있는 주식과 유동성이 낮은 주식 모두에서 뛰어난 강건성을 보이며 다양한 시장 조건에서의 일반화 능력을 입증했다.
  • 결과적으로, 고급 딥러닝 모델을 사용하더라도 특징 공학이 중간가격 예측 성능 향상에 있어 핵심 요소임을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.