Skip to main content
QUICK REVIEW

[論文レビュー] aeon: a Python toolkit for learning from time series

Matthew Middlehurst, Ali Ismail-Fawaz|arXiv (Cornell University)|Jun 20, 2024
Computational Physics and Python Applications被引用数 9
ひとこと要約

aeon は、scikit-learn 風の API と最小限のコア依存関係を備えた、予測、分類、外生回帰、クラスタリング、および実験モジュールを提供する、時系列機械学習のための統一的な Python 3 ライブラリです。

ABSTRACT

aeon is a unified Python 3 library for all machine learning tasks involving time series. The package contains modules for time series forecasting, classification, extrinsic regression and clustering, as well as a variety of utilities, transformations and distance measures designed for time series data. aeon also has a number of experimental modules for tasks such as anomaly detection, similarity search and segmentation. aeon follows the scikit-learn API as much as possible to help new users and enable easy integration of aeon estimators with useful tools such as model selection and pipelines. It provides a broad library of time series algorithms, including efficient implementations of the very latest advances in research. Using a system of optional dependencies, aeon integrates a wide variety of packages into a single interface while keeping the core framework with minimal dependencies. The package is distributed under the 3-Clause BSD license and is available at https://github.com/ aeon-toolkit/aeon. This version was submitted to the JMLR journal on 02 Nov 2023 for v0.5.0 of aeon. At the time of this preprint aeon has released v0.9.0, and has had substantial changes.

研究の動機と目的

  • 時系列機械学習タスク(予測、分類、外生回帰、クラスタリングを含む)に対して、統一的で使いやすい Python ツールキットを提供することを目指す。
  • パッケージをモジュール化し、scikit-learn API との互換性を持たせて、組み込み、モデル選択、パイプラインの統合を促進する。
  • コア依存関係を最小限に抑えつつ、他の人気のある Python ライブラリとのオプション統合を可能にする。
  • 幅広い時系列アルゴリズムとユーティリティをサポートし、単一のフレームワーク内で再現性のあるベンチマーキングと実験を可能にする。

提案手法

  • 学習タスクに焦点を当てたモジュール設計( forecasting、classification、clustering、extrinsic regression )で、クロスモジュールのインポートを大幅に回避。
  • scikit-learn に合わせたオブジェクト指向の推定器を提供し、BaseCollectionEstimator とデータ型タグ(例:multivariate、unequal_length)を用いて能力を記述。
  • numpy、scipy、そしてコアな scikit-learn 風の推定器インターフェースを広く使用。オプションの依存関係(statsmodels、TensorFlow、tsfresh)は追加アルゴリズムをラッピングまたは提供。
  • シリーズ間・シリーズから特徴量への変換を行い、パイプラインに統合して、一般的な処理とコレクション固有の処理の両方をサポート。
  • 実験志向のモジュール(セグメンテーション、異常検知、類似性検索、ベンチマーキング)を迅速に進化させることを意図。
  • forecasting のインターフェースは、モデル選択、評価、アンサンブリング、確率的区間、階層/グローバル予測、パネル予測などのツールをサポートしており、入力は主に pandas DataFrame/Series と変換ユーティリティを介して行う。

実験結果

リサーチクエスチョン

  • RQ1時系列機械学習タスクを、タスク固有の要件を損なうことなく、単一の scikit-learn 風のインターフェースの下でいかに統一できるか。
  • RQ2予測、分類、クラスタリング、および外生回帰のための easy integration、ベンチマーキング、および再現性を機械的に促進する設計上の選択肢は何か。
  • RQ3コア依存関係を最小限に抑えつつ、オプションの統合を通じて広範な TSML アルゴリズムにアクセスできる範囲はどこまで拡張できるか。
  • RQ4モジュラーでタスク指向のアーキテクチャは、時系列 ML コミュニティにおける実験と採用をどの程度促進できるか。
  • RQ5実験的モジュール(セグメンテーション、異常検知、類似性検索、ベンチマーキング)の範囲と潜在能力は、迅速な開発と試験にどのような影響を与えるか。

主な発見

  • aeon は、時系列 ML の予測、分類、クラスタリング、外生回帰、および実験タスクを含む、包括的でモジュール化されたツールキットを提供する。
  • パッケージは scikit-learn ライクな API に従い、パイプラインとモデル選択ツールとの使いやすさと統合を促進する。
  • aeon は、人気のある TSML パッケージへのオプション統合と最小限のコア依存関係を強調し、広範でありながらスマートなインターフェースを実現する。
  • コアモジュールは、データの能力を表すタグ(例:multivariate、unequal_length)を備えた共通ベース構造を中心に設計されており、柔軟なデータ処理を促進する。
  • forecasting モジュールは established ツール(例:prophet、pmdarima、statsforecast、tbats)と連携し、確率的区間や階層/グローバル予測などの高度な機能をサポートする。
  • 分類、クラスタリング、回帰の広範な手法を実装しており、畳み込み、辞書ベース、距離ベース、特徴量ベース、ハイブリッド、区間ベース、shapelet ベースなどが含まれる。
  • transformers は、シリーズ間・シリーズから特徴量への形でパイプライン内で時系列を変換する機能を提供し、フーリエ変換や TSFresh 特徴量などの表現をサポートする。
  • 実験モジュールは、セグメンテーション、異常検知、類似性検索、ベンチマーキングを含み、活発な開発と将来の拡張を示している。
  • aeon は、再現可能な TSML 研究と Python エコシステム内での統合を前進させることを意図した、統一的で拡張性のあるフレームワークとして位置づけられている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。