[論文レビュー] Dynamic Time Warping in Strongly Subquadratic Time: Algorithms for the Low-Distance Regime and Approximate Evaluation
本稿では、最小非ゼロ距離が1である任意の距離空間における文字列に対して、低距離領域におけるDTW(動的時系列適合)の最初の強力な準平方時間アルゴリズムを提示する。このアルゴリズムは、O(n · dtw(x, y)) 時間でDTWを計算する。さらに、木距離空間におけるO(n²⁻ᵝ)-時間の近似アルゴリズム(近似係数O(nᵝ))を導入し、編集距離からの還元を用いてDTWおよびLCSの新たな条件付き下界を確立する。
Dynamic time warping distance (DTW) is a widely used distance measure between time series, with applications in areas such as speech recognition and bioinformatics. The best known algorithms for computing DTW run in near quadratic time, and conditional lower bounds prohibit the existence of significantly faster algorithms. The lower bounds do not prevent a faster algorithm for the important special case in which the DTW is small, however. For an arbitrary metric space Sigma with distances normalized so that the smallest non-zero distance is one, we present an algorithm which computes dtw(x, y) for two strings x and y over Sigma in time O(n * dtw(x, y)). When dtw(x, y) is small, this represents a significant speedup over the standard quadratic-time algorithm. Using our low-distance regime algorithm as a building block, we also present an approximation algorithm which computes dtw(x, y) within a factor of O(n^epsilon) in time O~(n^{2 - epsilon}) for 0 < epsilon < 1. The algorithm allows for the strings x and y to be taken over an arbitrary well-separated tree metric with logarithmic depth and at most exponential aspect ratio. Notably, any polynomial-size metric space can be efficiently embedded into such a tree metric with logarithmic expected distortion. Extending our techniques further, we also obtain the first approximation algorithm for edit distance to work with characters taken from an arbitrary metric space, providing an n^epsilon-approximation in time O~(n^{2 - epsilon}), with high probability. Finally, we turn our attention to the relationship between edit distance and dynamic time warping distance. We prove a reduction from computing edit distance over an arbitrary metric space to computing DTW over the same metric space, except with an added null character (whose distance to a letter l is defined to be the edit-distance insertion cost of l). Applying our reduction to a conditional lower bound of Bringmann and Künnemann pertaining to edit distance over {0, 1}, we obtain a conditional lower bound for computing DTW over a three letter alphabet (with distances of zero and one). This improves on a previous result of Abboud, Backurs, and Williams, who gave a conditional lower bound for DTW over an alphabet of size five. With a similar approach, we also prove a reduction from computing edit distance (over generalized Hamming Space) to computing longest-common-subsequence length (LCS) over an alphabet with an added null character. Surprisingly, this means that one can recover conditional lower bounds for LCS directly from those for edit distance, which was not previously thought to be the case.
研究の動機と目的
- 真の距離が小さい場合にO(n²)より速いDTWアルゴリズムを開発し、一般ケースにおける近似平方時間下界を克服すること。
- 強力な準平方時間で動作し、保証された近似性能を有するDTWの近似アルゴリズムを設計すること。
- 任意の距離空間における編集距離の近似技術を拡張し、DTWおよびLCSの新たな条件付き下界を導出すること。
- 編集距離からDTW(ヌル文字を含む)への還元を確立し、編集距離の条件付き下界をDTWに移転可能にする。
提案手法
- 1つの文字列を文字として、もう1つの文字列を等価文字の連続(ラン)として扱う非対称な動的計画法の新規定式化を設計し、距離閾値Kに対して部分問題の数をO(nK)に制限する。
- 文字列間の役割を切り替える再帰的部分問題分解を用い、低コスト部分問題の数を制限する。
- ランダムスケーリング(r ∈ [R, 2R])を適用してランダムサンプル内の編集距離を低減し、マルコフの不等式を用いた確率的保証を可能にする。
- スケールパラメータの二分探索とランダムサンプリングを組み合わせたギャップベースの編集距離アルゴリズムを構築し、小距離と大距離を区別する。
- 任意の距離空間を深さが対数的で、期待される歪みが小さいwell-separated木距離空間に埋め込むことで、効率的な近似を可能にする。
- 距離空間上の編集距離をヌル文字(距離 = 挿入コスト)を含むDTWに還元し、編集距離からDTWへの条件付き下界の移転を実現する。
実験結果
リサーチクエスチョン
- RQ1真の距離が小さい場合に、DTWをO(n²)未満で計算できるか?
- RQ2一般の距離空間におけるDTWに対して、強力な準平方時間近似アルゴリズムは存在するか?
- RQ3編集距離からの還元を用いて、編集距離の条件付き下界をDTWに移転できるか?
- RQ4同じ還元技術を用いて、編集距離からLCSの下界を導出できるか?
- RQ5ランダムスケーリングがサンプル文字列内の編集距離に与える影響は何か?
主な発見
- 本稿では、低距離領域におけるDTWに対して、O(n · dtw(x, y)) 時間のアルゴリズムを提示し、dtw値が小さい場合にO(n²)よりも顕著に高速化されることを示した。
- 深さが対数的で、最大指数的アスペクト比を有する木距離空間におけるDTWに対して、O(n²⁻ᵝ)-時間O(nᵝ)-近似アルゴリズムを構築した。
- 任意の多項式サイズの距離空間は、対数的期待歪みを有するこのような木距離空間に埋め込めるため、近似アルゴリズムを一般に適用可能である。
- 本稿では、{0,1}上での編集距離からの還元を用いて、3文字アルファベット上でのDTWに対する条件付き下界を証明し、より大きなアルファベットに対する既存の境界を改善した。
- 一般化されたハミング空間上での編集距離からLCS(ヌル文字を含む)への還元により、編集距離の条件付き下界をLCSに移転可能であることを示した。
- ランダムサンプル sr(x) と sr(y) 間の期待編集距離は、元の編集距離の5倍以下であることが示され、近似アルゴリズムにおける確率的ギャップ検出が可能になった。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。