Skip to main content
QUICK REVIEW

[論文レビュー] Quadratic Conditional Lower Bounds for String Problems and Dynamic Time Warping

Karl Bringmann, Marvin Künnemann|arXiv (Cornell University)|Feb 3, 2015
Algorithms and Data Compression参考文献 16被引用数 29
ひとこと要約

本稿は、Strong Exponential Time Hypothesis (SETH) の下で、編集距離、動的時系列変形(DTW)、最長共通部分列(LCS)、最長回文部分列(LPS)、最長タンデム部分列(LTS)といった基本的な文字列および曲線類似度問題に対して、条件付きの二次時間下界を確立する。SETH が成り立たない限り、これらの問題に対して強下位二次時間のアルゴリズムは存在しないことを示すために、充足可能性問題への還元を可能にする一貫性のある表現力を持つガジェットを用いた一般化されたフレームワークを導入する。このフレームワークにより、二進文字列や一次元曲線においても、同様の下界が得られる。

ABSTRACT

Classic similarity measures of strings are longest common subsequence and Levenshtein distance (i.e., the classic edit distance). A classic similarity measure of curves is dynamic time warping. These measures can be computed by simple $O(n^2)$ dynamic programming algorithms, and despite much effort no algorithms with significantly better running time are known. We prove that, even restricted to binary strings or one-dimensional curves, respectively, these measures do not have strongly subquadratic time algorithms, i.e., no algorithms with running time $O(n^{2-\varepsilon})$ for any $\varepsilon > 0$, unless the Strong Exponential Time Hypothesis fails. We generalize the result to edit distance for arbitrary fixed costs of the four operations (deletion in one of the two strings, matching, substitution), by identifying trivial cases that can be solved in constant time, and proving quadratic-time hardness on binary strings for all other cost choices. This improves and generalizes the known hardness result for Levenshtein distance [Backurs, Indyk STOC'15] by the restriction to binary strings and the generalization to arbitrary costs, and adds important problems to a recent line of research showing conditional lower bounds for a growing number of quadratic time problems. As our main technical contribution, we introduce a framework for proving quadratic-time hardness of similarity measures. To apply the framework it suffices to construct a single gadget, which encapsulates all the expressive power necessary to emulate a reduction from satisfiability. Finally, we prove quadratic-time hardness for longest palindromic subsequence and longest tandem subsequence via reductions from longest common subsequence, showing that conditional lower bounds based on the Strong Exponential Time Hypothesis also apply to string problems that are not necessarily similarity measures.

研究の動機と目的

  • 何十年にもわたる研究にもかかわらず、古典的な文字列および曲線類似度問題がなぜより高速なアルゴリズムを避け続けてきたのかを説明すること。
  • これらの問題に対する既知の O(n²) の動的計画法アルゴリズムが、低次の項を除いて最適であるという強い証拠を提示すること。
  • Levenshtein 距離や Fréchet 距離に対する既存の条件付き下界を、任意の編集操作コストや最長回文部分列といった類似度でない測度を含むより広範な問題クラスへと拡張・一般化すること。
  • 一貫した、再利用可能なフレームワークを構築し、文字列および曲線類似度問題の広いクラスに対して二次時間の難解性を証明すること。

提案手法

  • k-SAT から類似度問題への還元を可能にする、一貫した表現力を備えたガジェットを用いた、新規の還元フレームワークを導入する。
  • 条件付き下界を導出するために、Strong Exponential Time Hypothesis (SETH) を基本的な複雑性仮定として用いる。
  • k-SAT から任意の操作コストをもつ編集距離への還元を構築し、二進文字列上でのすべての非自明なコスト組み合わせに対して、二次時間の難解性を証明する。
  • 同様のフレームワークを動的時系列変形(DTW)に適用し、一次元曲線上でも強下位二次時間で計算することは不可能であることを示す。
  • 最長共通部分列(LCS)を最長回文部分列(LPS)および最長タンデム部分列(LTS)へと還元し、非類似度測度に対しても下界を転送する。
  • 部分列距離に関する組合せ的性質(例:単調性、部分加法性)を用いて、還元における結果の部分列長を制限する。

実験結果

リサーチクエスチョン

  • RQ1任意の非自明な操作コスト(Levenshtein 距離を含む)をもつ編集距離が、二進文字列上で強下位二次時間で計算可能でないことを証明できるか?
  • RQ2一次元曲線上の動的時系列変形(DTW)も、SETH の下で二次時間下界を満たすか?
  • RQ3条件付き下界技術を類似度測度を超えて、LPS や LTS のような他の文字列問題へ一般化できるか?
  • RQ4一貫したフレームワークが、広範な文字列および曲線類似度問題のクラスに対してこのような下界を可能にするか?
  • RQ5同じ還元ガジェットを用いて、複数の問題に対して難解性を証明でき、今後の下界証明を簡略化できるか?

主な発見

  • 任意の非自明な操作コスト(Levenshtein 距離を含む)をもつ編集距離は、二進文字列上で O(n²−ε) 時間で計算可能でない(任意の ε>0 に対して)ため、SETH が成り立たない限り、強下位二次時間アルゴリズムは存在しない。
  • 一次元曲線上の動的時系列変形(DTW)に対しても、SETH の下で強下位二次時間アルゴリズムは存在せず、既存の難解性結果がこの基本的な曲線類似度測度へと拡張される。
  • 最長回文部分列(LPS)および最長タンデム部分列(LTS)が、LCS からの還元によって二次時間の難解性を示され、SETH を用いた下界が非類似度測度に対しても適用可能であることが証明された。
  • 提案されたフレームワークにより、二次時間の難解性を証明する作業が、一貫したユニバーサルガジェットの構築に集約され、今後の下界証明が著しく簡素化された。
  • 結果は二進文字列や一次元曲線に制限されても成り立つため、現在の O(n²) アルゴリズムが低次の項を除いて最適であるという証拠が強化された。
  • Backurs と Indyk(2015)の Levenshtein 距離に対する SETH を用いた下界を、任意のコストおよび二進アルファベットへと拡張し、一般化・改善した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。