Skip to main content
QUICK REVIEW

[論文レビュー] Computing Continuous Dynamic Time Warping of Time Series in Polynomial Time

Kevin Buchin, André Nusser|arXiv (Cornell University)|Jan 1, 2022
Time Series Analysis and Forecasting被引用数 4
ひとこと要約

本稿では、1次元時系列曲線の連続的動的時系列 warp(CDTW)を計算する初めての正確な多項式時間アルゴリズムを提示する。時間計算量はO(n⁵)である。この手法は、動的計画法フレームワーク内において、連続的で区分的二次関数型のコスト関数を伝播させ、関数の複雑さを制限する独自の技術を用いることで、多項式時間実行を保証する。これは、時系列解析における実用的CDTW利用への基盤的段階を示している。

ABSTRACT

Dynamic Time Warping is arguably the most popular similarity measure for time series, where we define a time series to be a one-dimensional polygonal curve. The drawback of Dynamic Time Warping is that it is sensitive to the sampling rate of the time series. The Fréchet distance is an alternative that has gained popularity, however, its drawback is that it is sensitive to outliers. Continuous Dynamic Time Warping (CDTW) is a recently proposed alternative that does not exhibit the aforementioned drawbacks. CDTW combines the continuous nature of the Fréchet distance with the summation of Dynamic Time Warping, resulting in a similarity measure that is robust to sampling rate and to outliers. In a recent experimental work of Brankovic et al., it was demonstrated that clustering under CDTW avoids the unwanted artifacts that appear when clustering under Dynamic Time Warping and under the Fréchet distance. Despite its advantages, the major shortcoming of CDTW is that there is no exact algorithm for computing CDTW, in polynomial time or otherwise. In this work, we present the first exact algorithm for computing CDTW of one-dimensional curves. Our algorithm runs in time $O(n^5)$ for a pair of one-dimensional curves, each with complexity at most $n$. In our algorithm, we propagate continuous functions in the dynamic program for CDTW, where the main difficulty lies in bounding the complexity of the functions. We believe that our result is an important first step towards CDTW becoming a practical similarity measure between curves.

研究の動機と目的

  • 連続的動的時系列 warp(CDTW)の正確で多項式時間のアルゴリズムの欠如に取り組む。CDTWは、DTWのロバストネスとフリーチェ距離の連続性を組み合わせた類似度測定法である。
  • 従来の測定法の限界を克服する:DTWのサンプリングレートへの感受性と、フリーチェ距離の外れ値への感受性。
  • 連続的コスト関数を伝播させる動的計画法のアプローチを開発し、その複雑さを制限することで、多項式時間計算を保証する。
  • CDTWが時系列解析分野で実用的かつ広く採用される類似度測定法となるための理論的基盤を構築する。

提案手法

  • CDTWを、2つの1次元多角形曲線に沿った単調な走査経路に沿った点対点距離の積分として定式化する。
  • 曲線のセグメントからなるグリッド上で動的計画法を適用し、各セルはその点に到達するまでの最小コストを表す連続的で区分的二次関数型コスト関数を格納する。
  • 3種類の遷移(経路)を通じてコスト関数を伝播させる:(B1/B2) 水平および垂直、(C3.1/C3.2) 非水平拡張を伴う対角線。
  • 非水平(二次関数型)拡張を用いた累積最小演算を適用し、最適経路をモデル化することで、連続性と複雑さの有界性を保証する。
  • 二次関数の構造的解析とその導関数を用いて、各伝播コスト関数に含まれるピece数を制限する。
  • すべてのグリッドセルにおける関数ピece数の合計が多項式であることを証明し、全体の時間計算量がO(n⁵)であることを導出する。

実験結果

リサーチクエスチョン

  • RQ1CDTWの正確なアルゴリズムが、連続的アライメントの性質にもかかわらず多項式時間で計算可能かどうか。
  • RQ2動的計画法の伝播過程で生じる連続的コスト関数の最大複雑さはどの程度か。
  • RQ3CDTWにおける連続関数の伝播が、十分に良好に有界化可能かどうか。
  • RQ4提案手法が、サンプリングレートの変動や外れ値に対してロバストであるCDTWの性質を保ちつつ、正確な計算を可能にするか。

主な発見

  • 本稿は、1次元時系列曲線のCDTWを計算する初めての正確なアルゴリズムを提示し、O(n⁵)時間で実行可能である。
  • アルゴリズムは、動的計画法を用いて連続的で区分的二次関数型コスト関数を伝播させ、各関数の複雑さをきめ細かく制限している。
  • すべての伝播関数に含まれるピece数の合計は、nの多項式で有界であり、これにより全体の実行時間も多項式のままである。
  • この成果は、累積最小演算に非水平で二次関数型の拡張を導入することで達成されており、これは離散的DTWで用いられる標準的手法を一般化したものである。
  • 解析により、二次関数における異なる(a,b)係数ペアの数がレベルを跨いで非増加であることが証明され、これによりO(n⁵)のバウンドが可能になった。
  • 本研究は、CDTWが時系列解析分野で実用的かつ広く採用される類似度測定法となるための基盤的理論的枠組みを確立した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。