Skip to main content
QUICK REVIEW

[論文レビュー] Darts: User-Friendly Modern Machine Learning for Time Series

Julia Herzen, Francesco Lässig|arXiv (Cornell University)|Oct 7, 2021
Forecasting Techniques and Applications参考文献 16被引用数 57
ひとこと要約

Darts は、古典的な時系列予測と機械学習ベースの時系列予測を共通の fit/predict API の下で統合し、マルチシリーズ学習、共変量、確率的予測、アンサンブル手法をサポートするユーザーフレンドリーな Python ライブラリです。

ABSTRACT

We present Darts, a Python machine learning library for time series, with a focus on forecasting. Darts offers a variety of models, from classics such as ARIMA to state-of-the-art deep neural networks. The emphasis of the library is on offering modern machine learning functionalities, such as supporting multidimensional series, meta-learning on multiple series, training on large datasets, incorporating external data, ensembling models, and providing a rich support for probabilistic forecasting. At the same time, great care goes into the API design to make it user-friendly and easy to use. For instance, all models can be used using fit()/predict(), similar to scikit-learn.

研究の動機と目的

  • 現代の ML ベースの時系列予測を民主化するために、古典的手法と ML アプローチを単一の使いやすい API の下に統合する。
  • 時系列のコレクションでの学習と高次元データの取り扱いを可能にする。
  • 予測の質を向上させるために、過去および未来の共変量を用いた確率的予測をサポートする。
  • 実務家を支援するために、バックテスト、ハイパーパラメータ探索、アンサンブルモデリングのツールを提供する。

提案手法

  • 不変で形状と時系列インデックスが正しく保証される TimeSeries コンテナを導入する。
  • さまざまなモデルに適用可能な fit(series) と predict(n) を備えた統一的な高レベル API を提供する。
  • 大規模データセットに対して遅延ローディングを利用した複数時系列の学習を可能にする。
  • 予測を条件付けるために過去および未来の共変量をサポートする。
  • TimeSeries 内でモンテカルロ・サンプルを格納し、複数の分布をサポートすることで確率的予測を提供する。
  • 統一 API の下で使用できるモデルの幅を拡張する(古典的な ARIMA、指数平滑化、Theta、Prophet、FFT、DeepAR のような RNN、N-BEATS、TCN、TFT、回帰ラッパー)。
  • データ前処理パイプライン、バックテスト、ハイパーパラメータ探索、ダイナミックタイムワーピング、アンサンブルモデリング、カルマンフィルター、ガウス過程、データセットモジュールなどの追加機能を含む。

実験結果

リサーチクエスチョン

  • RQ1単一の統一 API が古典的モデルと ML ベースの時系列モデルの両方を効果的にサポートできるか。
  • RQ2大規模な時系列コレクションで学習したモデルが個別の系列について正確な予測を行えるか。
  • RQ3共変量(過去および未来)を取り入れることが予測精度に与える影響は。
  • RQ4多次元時系列のための柔軟でノンパラメトリックな方法で確率的予測を実装できるか。
  • RQ5使いやすい API の利点と機能が ML ベースの予測の採用を促進する上での限界は何か。

主な発見

  • Darts は多様なモデルに対して一貫した fit/predict インターフェイスを用いて学習と予測を可能にする。
  • 遅延データ読み込みやシーケンススライシング機能を用いた複数時系列・大規模データセットでの学習をサポートする。
  • モンテカルロサンプルを格納し、17 種類の分布を標準でサポートすることで確率的予測を提供する。
  • 過去と未来の共変量を区別し、スライシング時の整合性を自動的に処理する。
  • 統一 API の下で ARIMA、指数平滑化、Theta、Prophet、FFT、RNNs、N-BEATS、TCN、TFT などのモデルを使用可能である。
  • バックテスト、ハイパーパラメータ探索、パイプライン、前処理、アンサンブルモデリングなどの追加ツールを含む。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。