Skip to main content
QUICK REVIEW

[论文解读] Quadratic Conditional Lower Bounds for String Problems and Dynamic Time Warping

Karl Bringmann, Marvin Künnemann|arXiv (Cornell University)|Feb 3, 2015
Algorithms and Data Compression参考文献 16被引用 29
一句话总结

本文在强指数时间假设(SETH)下,为基本的字符串与曲线相似性问题建立了条件性的二次时间下界,包括编辑距离、动态时间规整(DTW)、最长公共子序列(LCS)、最长回文子序列(LPS)以及最长重复子序列(LTS)。该工作提出了一种通用框架,通过单一且表达力强的规约构件,实现从可满足性问题到这些相似性问题的规约,证明了除非SETH不成立,否则在二进制字符串或一维曲线上,这些问题不存在强次二次时间算法。

ABSTRACT

Classic similarity measures of strings are longest common subsequence and Levenshtein distance (i.e., the classic edit distance). A classic similarity measure of curves is dynamic time warping. These measures can be computed by simple $O(n^2)$ dynamic programming algorithms, and despite much effort no algorithms with significantly better running time are known. We prove that, even restricted to binary strings or one-dimensional curves, respectively, these measures do not have strongly subquadratic time algorithms, i.e., no algorithms with running time $O(n^{2-\varepsilon})$ for any $\varepsilon > 0$, unless the Strong Exponential Time Hypothesis fails. We generalize the result to edit distance for arbitrary fixed costs of the four operations (deletion in one of the two strings, matching, substitution), by identifying trivial cases that can be solved in constant time, and proving quadratic-time hardness on binary strings for all other cost choices. This improves and generalizes the known hardness result for Levenshtein distance [Backurs, Indyk STOC'15] by the restriction to binary strings and the generalization to arbitrary costs, and adds important problems to a recent line of research showing conditional lower bounds for a growing number of quadratic time problems. As our main technical contribution, we introduce a framework for proving quadratic-time hardness of similarity measures. To apply the framework it suffices to construct a single gadget, which encapsulates all the expressive power necessary to emulate a reduction from satisfiability. Finally, we prove quadratic-time hardness for longest palindromic subsequence and longest tandem subsequence via reductions from longest common subsequence, showing that conditional lower bounds based on the Strong Exponential Time Hypothesis also apply to string problems that are not necessarily similarity measures.

研究动机与目标

  • 解释为何经典字符串与曲线相似性问题尽管历经数十年研究,仍难以获得更快的算法。
  • 为这些问题已知的O(n²)动态规划算法提供强有力证据,证明其在低阶项意义下已是最优。
  • 将先前的条件性下界结果(尤其是针对Levenshtein距离与Fréchet距离)推广至更广范围的问题类别,包括任意编辑操作代价及非相似性度量(如最长回文子序列)。
  • 开发一种通用且可复用的框架,通过单一强大规约构件,证明相似性度量的二次时间难解性。

提出的方法

  • 提出一种新颖的规约框架,通过一个精心构造的规约构件,将k-SAT规约为相似性问题,该构件具备全部必要的表达能力。
  • 以强指数时间假设(SETH)作为底层复杂性假设,推导出条件性下界。
  • 构建从k-SAT到具有任意操作代价的编辑距离的规约,证明在二进制字符串上,所有非平凡代价组合均具有二次时间难解性。
  • 将同一框架应用于动态时间规整(DTW),证明在一维曲线上,其计算也难以在强次二次时间内完成。
  • 将最长公共子序列(LCS)规约为最长回文子序列(LPS)与最长重复子序列(LTS),将下界结果推广至这些非相似性度量。
  • 利用子序列距离的组合性质(如单调性、次可加性)来约束规约中所得子序列的长度。

实验结果

研究问题

  • RQ1我们能否证明:在二进制字符串上,具有任意非平凡操作代价的编辑距离无法在O(n²−ε)时间内计算,其中ε>0?
  • RQ2在SETH假设下,一维曲线上的动态时间规整(DTW)是否也存在二次时间下界?
  • RQ3条件性下界技术能否推广至相似性度量之外的其他字符串问题,如LPS与LTS?
  • RQ4是否存在一个统一框架,可为一大类字符串与曲线相似性问题提供此类下界?
  • RQ5是否可使用同一规约构件证明多个问题的难解性,从而简化未来下界证明?

主要发现

  • 除非SETH不成立,在二进制字符串上,任何非平凡操作代价组合(包括Levenshtein距离)的编辑距离都无法在O(n²−ε)时间内计算,其中ε>0。
  • 在SETH假设下,一维曲线上的动态时间规整(DTW)同样不存在强次二次算法,将先前的下界结果扩展至这一基础的曲线相似性度量。
  • 通过从LCS规约至LPS与LTS,证明了最长回文子序列与最长重复子序列也具有二次时间难解性,表明SETH-based下界适用于非相似性度量。
  • 所提出的框架将证明二次时间难解性的任务简化为构造一个单一的通用规约构件,显著简化了未来下界证明的工作。
  • 即使在限制为二进制字符串或一维曲线的情况下,该结果依然成立,进一步强化了当前O(n²)算法在低阶项意义下最优的证据。
  • 本文结果在广度与深度上均超越了先前工作,例如Backurs与Indyk在2015年基于SETH对Levenshtein距离的下界研究,将其推广至任意代价与二进制字母表。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。