[논문 리뷰] Deep Limit Order Book Forecasting
본 논문은 주문대기장(limit order book)의 미소구조를 DeepLOB를 이용한 중가 변화 예측 가능성과 연결하고, LOBFrame 프레임워크를 공개하며, 표준 지표를 넘어서는 예측의 실무적 평가를 제안한다.
We exploit cutting-edge deep learning methodologies to explore the predictability of high-frequency Limit Order Book mid-price changes for a heterogeneous set of stocks traded on the NASDAQ exchange. In so doing, we release `LOBFrame', an open-source code base to efficiently process large-scale Limit Order Book data and quantitatively assess state-of-the-art deep learning models' forecasting capabilities. Our results are twofold. We demonstrate that the stocks' microstructural characteristics influence the efficacy of deep learning methods and that their high forecasting power does not necessarily correspond to actionable trading signals. We argue that traditional machine learning metrics fail to adequately assess the quality of forecasts in the Limit Order Book context. As an alternative, we propose an innovative operational framework that evaluates predictions' practicality by focusing on the probability of accurately forecasting complete transactions. This work offers academics and practitioners an avenue to make informed and robust decisions on the application of deep learning techniques, their scope and limitations, effectively exploiting emergent statistical properties of the Limit Order Book.
연구 동기 및 목표
- 주가의 미시구조 속성을 서로 다른 수평선에 걸친 중가 움직임의 예측 가능성과 연결한다.
- 이종 주식 집합에 대해 NASDAQ LOB 데이터에서 최첨단 딥러닝 예측(DeepLOB)을 평가한다.
- 재현성 및 강건성을 향상시키기 위한 오픈 소스 데이터 처리 및 예측 벤치마크(LOBFrame)를 제공한다.
- 높은 예측력과 실행 가능한 트레이딩 신호 간의 차이를 논의하고, 운영적 평가 프레임워크를 제안한다.
제안 방법
- LOB 및 mid-price 지표를 정의하고 15개 NASDAQ 주식에 걸친 미시구조 특징을 형식화한다.
- LOB 예측을 위해 DeepLOB 아키텍처(CNN은 공간 간 레벨 다이나믹스에, LSTM은 시간적 의존성에)를 채택한다.
- 대규모 LOB 데이터 처리, 모델 학습, 검증 및 트레이딩-시뮬레이션 평가를 위한 오픈 소스 파이프라인인 LOBFrame을 개발하고 공개한다.
- 비정상성(non-stationarity)을 다루고 데이터 누수를 피하기 위해 5일 특성별 z-점수 정규화를 사용한다.
- HΔτ ∈ {10, 50, 100}의 수평선에서 3-클래스 체계(Down, Stable, Up)를 기준 시세 단위 θ에 따라 중가 움직임에 라벨링한다.
- 세 가지 수평선과 다양한 미시구조의 tick 특성을 가진 다중 주식 그룹에 걸쳐 예측을 평가한다.
실험 결과
연구 질문
- RQ1미시구조적 주식 특성이 딥러닝 LOB 예측 모델의 성능에 어떻게 영향을 미치는가?
- RQ2DeepLOB의 높은 예측력이 실제로 실행 가능한 트레이딩 신호로 전환될 수 있는가?
- RQ3표준화된 LOB 데이터 처리 및 평가 프레임워크가 LOB 예측 연구의 재현성과 강건성을 향상시키는가?
- RQ4수평선(horizons)과 tick-size 체제가 중가 움직임의 예측 가능성에 어떤 역할을 하는가?
주요 결과
- DeepLOB의 예측 성능은 최첨단이지만 미시구조적 주식 속성에 따라 달라진다.
- 모델의 높은 예측력은 반드시 실행 가능한 트레이딩 신호로 이어지지 않는다.
- 전통적 ML 지표는 LOB 맥락에서 예측 품질을 포착하지 못할 수 있어 대안적 성능 프레임워크를 촉진한다.
- LOBFrame은 데이터 처리, 모델 학습, 검증 및 평가를 위한 다용도 오픈 소스 파이프라인을 제공한다.
- LOB 예측의 시뮬레이션-현실 격차를 양적으로 평가하는 실용적 접근법을 제시한다.
- 2017–2019년에 걸쳐 수평선과 주식 그룹(스몰-틱, 미디엄-틱, 라지-틱) 간의 클래스 분포의 이질성을 보여준다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.