Skip to main content
QUICK REVIEW

[논문 리뷰] Extracting information from the signature of a financial data stream

Lajos Gergely Gyurk 'o, Terry Lyons|arXiv (Cornell University)|2013. 07. 27.
Complex Systems and Time Series Analysis인용 수 21
한 줄 요약

이 논문은 금융 데이터 스트림의 서명(rough path theory에서 유도됨)을 사용하여 고주기 시장 행동을 분류하기 위한 비모수적 특징 추출 방법을 제안한다. 저차원의 서명 계수를 계산함으로써, 다양한 거래 실행 알고리즘으로 인한 시장 영향의 정확한 분류와 이질적 행동의 탐지가 가능해지며, 구매 주문에 대해 최대 89.9%의 검증 외 분류 정확도를 달성하고 핵심 지표에 대해 0.93 이상의 높은 AUC 스코어를 기록한다.

ABSTRACT

Market events such as order placement and order cancellation are examples of the complex and substantial flow of data that surrounds a modern financial engineer. New mathematical techniques, developed to describe the interactions of complex oscillatory systems (known as the theory of rough paths) provides new tools for analysing and describing these data streams and extracting the vital information. In this paper we illustrate how a very small number of coefficients obtained from the signature of financial data can be sufficient to classify this data for subtle underlying features and make useful predictions. This paper presents financial examples in which we learn from data and then proceed to classify fresh streams. The classification is based on features of streams that are specified through the coordinates of the signature of the path. At a mathematical level the signature is a faithful transform of a multidimensional time series. (Ben Hambly and Terry Lyons \cite{uniqueSig}), Hao Ni and Terry Lyons \cite{NiLyons} introduced the possibility of its use to understand financial data and pointed to the potential this approach has for machine learning and prediction. We evaluate and refine these theoretical suggestions against practical examples of interest and present a few motivating experiments which demonstrate information the signature can easily capture in a non-parametric way avoiding traditional statistical modelling of the data. In the first experiment we identify atypical market behaviour across standard 30-minute time buckets sampled from the WTI crude oil future market (NYMEX). The second and third experiments aim to characterise the market "impact" of and distinguish between parent orders generated by two different trade execution algorithms on the FTSE 100 Index futures market listed on NYSE Liffe.

연구 동기 및 목표

  • . 고주기 금융 데이터 스트림으로부터 의미 있는 특징을 추출하기 위한 비모수적 방법을 개발한다.
  • . 전통적인 통계 모델링을 피하기 위해 데이터 경로의 서명을 바탕으로 시장 행동을 분류한다.
  • . 서로 다른 거래 실행 알고리즘으로 인한 시장 영향의 미세한 차이를 서명이 얼마나 잘 포착하는지 평가한다.
  • . 이종 시장 행동 탐지 및 알고리즘 분류와 같은 실제 금융 응용 분야에서 서명의 유용성을 입증한다.
  • . 실제 시장 데이터에 기반한 서명 기반 기계학습의 강인성과 예측 능력을 검증한다.

제안 방법

  • . 다차원 금융 시계열에 수학적 서명 변환을 적용하여 가격 및 거래량 경로의 반복 적분을 캡처한다.
  • . 기계학습을 위한 저차원 특징으로서, 최대 3–4차까지의 절단된 서명 계수를 사용한다.
  • . 분류에 가장 관련성이 높은 서명 항목을 식별하기 위해 LASSO 감소를 적용한 선형 회귀를 활용한다.
  • . 시간을 정규화하여 시간 척도 변화에 대해 불변성을 확보하고, 재매개변수화 하에 서명의 불변성을 유지한다.
  • . 학습 데이터의 75%를 사용해 분류기를 훈련하고, 나머지 25%를 검증 외 데이터로 사용하며, Kolmogorov-Smirnov 거리, AUC, 분류 비율을 평가 지표로 사용한다.
  • . 레이블을 무작위로 섞고 훈련 세트 크기를 변화시켜 아블레이션 및 강인성 검증을 수행하여 통계적 유의성을 검증한다.

실험 결과

연구 질문

  • RQ1. 표준 통계 지표로는 감지되지 않는 미세한 시장 역학을 금융 데이터 스트림의 서명이 효과적으로 포착할 수 있는가?
  • RQ2. 서명 기반 특징이 두 가지 다른 거래 실행 알고리즘 간의 시장 영향 차이를 얼마나 잘 분류할 수 있는가?
  • RQ3. 훈련 데이터가 제한되었을 경우 서명 방법의 예측 정확도는 유지되며, 훈련 세트 크기가 증가함에 따라 성능은 어떻게 변화하는가?
  • RQ4. 사전에 비모수적 가정 없이 표준화된 시간 간격 내에서 이질적 시장 행동을 서명 방법이 탐지할 수 있는가?
  • RQ5. 어떤 특정 서명 항목(다중 색인)이 알고리즘 행동을 가장 잘 예측하는가? 그리고 그 항목들은 시장 측면에서 무엇을 의미하는가?

주요 결과

  • . 서명 기반 방법은 구매 주문에 대해 검증 외 분류 정확도 87.9%와 매도 주문에 대해 70.9%를 기록했으며, 학습 세트에서 구매 주문에 대해 AUC 스코어가 0.94 초과였다.
  • . 학습 세트에서 구매 주문에 대해 Kolmogorov-Smirnov 거리는 0.763에 도달했으며, 무작위화된 레이블에서의 기준값 0.263보다 유의미하게 높았다.
  • . 구매 주문 분류에 대해 56개의 관련 서명 항목을 식별했으며, 상위 계수들은 리드-래그 및 누적 거래량 역학과 관련이 있었다.
  • . 훈련 세트에 200개 미만의 스트림이 포함되었을 경우 성능이 저하되어 신뢰할 수 있는 추정을 위한 임계값이 존재함을 시사했다.
  • . 상위 15개 서명 항목에는 (1,6,4,1) 및 (1,1,6,4)와 같은 다중 색인이 포함되었으며, 이들의 계수는 거래량과 가격 타이밍 패턴에 민감함을 나타냈다.
  • . 이 방법은 강인성을 입증했다: 조잡하고 실제 세계의 데이터조차도 서명이 알고리즘 간의 차이를 높은 통계적 신뢰도로 포착할 수 있었다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.