Skip to main content
QUICK REVIEW

[논문 리뷰] AutoGluon-TimeSeries: AutoML for Probabilistic Time Series Forecasting

Oleksandr Shchur, Caner Türkmen|arXiv (Cornell University)|2023. 08. 10.
Forecasting Techniques and Applications인용 수 20
한 줄 요약

AutoGluon-TimeSeries (AG–TS)는 확률적 시계열 예측을 위한 오픈 소스 AutoML 라이브러리로, 통계적, 딥러닝 및 표형 예측기를 포함한 다양한 모델의 앙상블을 구성하여 최소 코드(3줄)로 정확한 포인트 및 분위수 예측을 제공합니다.

ABSTRACT

We introduce AutoGluon-TimeSeries - an open-source AutoML library for probabilistic time series forecasting. Focused on ease of use and robustness, AutoGluon-TimeSeries enables users to generate accurate point and quantile forecasts with just 3 lines of Python code. Built on the design philosophy of AutoGluon, AutoGluon-TimeSeries leverages ensembles of diverse forecasting models to deliver high accuracy within a short training time. AutoGluon-TimeSeries combines both conventional statistical models, machine-learning based forecasting approaches, and ensembling techniques. In our evaluation on 29 benchmark datasets, AutoGluon-TimeSeries demonstrates strong empirical performance, outperforming a range of forecasting methods in terms of both point and quantile forecast accuracy, and often even improving upon the best-in-hindsight combination of prior methods.

연구 동기 및 목표

  • 사용하기 쉬운 AutoML 도구를 제공하여 확률적 시계열 예측을 민주화한다.
  • 정확도와 견고성을 향상시키기 위해 통계적, DL, 표형 모델 등 다양한 예측 모델을 앙상블로 결합한다.
  • 정적/시간 변화 공변량을 지원하는 포인트 및 분위수 예측 모두를 가능하게 한다.
  • 경쟁력 있는 정확도와 효율성을 입증하기 위해 광범위한 벤치마크 데이터셋에서 성능을 평가한다.

제안 방법

  • TimeSeriesDataFrame은 정적 및 시간에 따라 변하는 공변량을 갖는 단변량 시계열 모음을 저장한다.
  • TimeSeriesPredictor는 예측 길이, 분위수 수준, 평가 지표를 포함한 예측 작업을 정의하며; 교차 검증과 선택적 하이퍼파라미터 최적화를 지원한다.
  • 적합 절차는 데이터를 전처리하고, 여러 모델을 학습 평가하며, 필요 시 하이퍼파라미터를 조정하고, 순방향 선택을 통해 앙상블을 구축한다(확률적 예측을 위한 Vincentization).
  • 세 가지 모델 패밀리: 지역적 고전 모델들(예: ARIMA, Theta, ETS)을 시계열별로; 글로벌 모델들(딥러닝: DeepAR, PatchTST, TFT; 표형은 AutoGluon–Tabular + MLForecast를 통해); 그리고 최종 예측을 생성하기 위한 앙상블.
  • 예측 출력은 수평선에 대한 평균(포인트) 및 분위수 예측을 포함하며, 식별자(ID), 타임스탬프, 예측값이 있는 긴 형식의 DataFrame에 저장된다.

실험 결과

연구 질문

  • RQ1AutoGluon–TimeSeries가 다양한 단변량 시계열 데이터셋에서 경쟁력 있는 포인트 및 확률 예측을 제공할 수 있는가?
  • RQ2현실적인 시간 예산 하에서 앙상블 기반 AutoML 접근법이 개별 모델 및 다른 AutoML 예측 프레임워크를 능가하는가?
  • RQ3다양한 모델 가족(통계, 딥러닝, 표형) 및 앙상블의 포함이 예측 정확도와 실행 시간에 미치는 영향은 무엇인가?
  • RQ4프리셋과 시간 예산 제약이 최종 사용자에 대한 정확도와 실용성에 어떤 영향을 미치는가?

주요 결과

FrameworkWinsLossesTiesFailuresChampionAverage rankAverage rescaled errorWin rate vs. baseline
AutoGluon (MASE)---0192.080.073100.0%
StatEnsemble6200333.120.23882.8 %
AutoPyTorch (MASE)4250024.120.25793.1%
AutoETS4250014.640.37475.9 %
AutoTheta4230204.920.42772.4 %
DeepAR4240125.080.43493.1 %
AutoARIMA4220315.920.61279.3 %
TFT2270016.120.63575.9 %
Table 3 (points) - as listed above
  • AG–TS는 29개 벤치마크 데이터셋에서 포인트 예측(MASE)과 확률 예측(wQL) 모두에 대해 평균적으로 경쟁 프레임워크를 능가한다.
  • Forward selection으로 구성된 다양한 모델의 앙상블은 강한 정확도를 달성하며, 종종 최적의 과거 결합을 능가한다.
  • 세 가지 모델 패밀리(통계, 딥러닝, 표형)가 성능에 의미있게 기여하며, 제거 연구에서도 모두 유용함이 나타나고, 특히 앙상블이 중요하다.
  • AG–TS는 모든 데이터셋에서 4시간 예산 내에 학습 및 예측을 완료하는 등 실용적인 실행 시간을 유지하며, 평균 실행 시간은 약 33분이다.
  • AutoPyTorch와 비교하여 AG–TS는 단순한 설정으로 경쟁력 있는 성능을 제공하고 대형 데이터셋에서 종종 더 빠른 결과를 얻지만, AutoPyTorch는 더 많은 튜닝과 시간이 필요할 수 있다.
  • 구성 요소를 제거한 연구에서 앙상블이나 어떤 모델 패밀리도 제거하면 성능이 저하되어, 통합된 AutoML 접근법의 중요성을 강조한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.