QUICK REVIEW

[논문 리뷰] Quadratic Conditional Lower Bounds for String Problems and Dynamic Time Warping

Karl Bringmann, Marvin Künnemann|arXiv (Cornell University)|2015. 02. 03.

Algorithms and Data Compression참고 문헌 16인용 수 29

한 줄 요약

이 논문은 강력한 지수시간 가설(Strong Exponential Time Hypothesis, SETH) 하에, 편집 거리(edit distance), 동적 시간 왜곡(dynamic time warping), 가장 긴 공통 부분수열(longest common subsequence), 가장 긴 팰린드롬 부분수열(longest palindromic subsequence), 가장 긴 텐덤 부분수열(longest tandem subsequence)와 같은 기본적인 문자열 및 곡선 유사도 문제들에 대해 조건부 이차시간 하한을 확립한다. SETH가 성립하지 않는 한, 이러한 문제들에 대해 강력한 이차시간 이하의 알고리즘이 존재하지 않음을 보여주기 위해, 만능 표현력의 단일 기반 기구(gadget)를 사용하는 일반적인 프레임워크를 제안한다. 이 기반 기구를 통해 만족 가능성 문제에서의 감소를 가능하게 하여, 이중 문자열 또는 일차원 곡선에서 이러한 문제들에 대해 강력한 이차시간 이하의 알고리즘이 존재하지 않음을 입증한다.

ABSTRACT

Classic similarity measures of strings are longest common subsequence and Levenshtein distance (i.e., the classic edit distance). A classic similarity measure of curves is dynamic time warping. These measures can be computed by simple $O(n^2)$ dynamic programming algorithms, and despite much effort no algorithms with significantly better running time are known. We prove that, even restricted to binary strings or one-dimensional curves, respectively, these measures do not have strongly subquadratic time algorithms, i.e., no algorithms with running time $O(n^{2-\varepsilon})$ for any $\varepsilon > 0$, unless the Strong Exponential Time Hypothesis fails. We generalize the result to edit distance for arbitrary fixed costs of the four operations (deletion in one of the two strings, matching, substitution), by identifying trivial cases that can be solved in constant time, and proving quadratic-time hardness on binary strings for all other cost choices. This improves and generalizes the known hardness result for Levenshtein distance [Backurs, Indyk STOC'15] by the restriction to binary strings and the generalization to arbitrary costs, and adds important problems to a recent line of research showing conditional lower bounds for a growing number of quadratic time problems. As our main technical contribution, we introduce a framework for proving quadratic-time hardness of similarity measures. To apply the framework it suffices to construct a single gadget, which encapsulates all the expressive power necessary to emulate a reduction from satisfiability. Finally, we prove quadratic-time hardness for longest palindromic subsequence and longest tandem subsequence via reductions from longest common subsequence, showing that conditional lower bounds based on the Strong Exponential Time Hypothesis also apply to string problems that are not necessarily similarity measures.

연구 동기 및 목표

고전적인 문자열 및 곡선 유사도 문제들이 수십 년에 걸친 연구에도 불구하고 더 빠른 알고리즘을 저지르지 못한 이유를 설명하기 위해.
이러한 문제들에 대한 알려진 O(n²) 동적 프rogramming 알고리즘이 하위항의 요소를 제외하고는 최적임을 강력한 증거로 제시하기 위해.
특히 Levenshtein 거리와 Fréchet 거리에 대한 이전의 조건부 하한을 넘어서, 임의의 편집 연산 비용과 가장 긴 팰린드롬 부분수열과 같은 비유사도 측정법을 포함한 더 넓은 문제 클래스로 하한을 일반화하기 위해.
단일 강력한 감소 기반 기구를 사용하여 다양한 문자열 및 곡선 유사도 문제들에 대한 이차시간 난이도를 증명하는 일반적이고 재사용 가능한 프레임워크를 개발하기 위해.

제안 방법

모든 필요한 표현력을 포함하는 단일로 신중히 구성된 기반 기구를 사용하여 k-SAT 문제에서 문자열 및 곡선 유사도 문제로의 새로운 감소 프레임워크를 도입한다.
조건부 하한을 유도하기 위해 강력한 지수시간 가설(SETH)을 복잡도 가정으로 사용한다.
임의의 연산 비용을 가진 편집 거리로 k-SAT 문제에서의 감소를 구성하여, 이중 문자열에서 비트리버스 비용 조합에 대해 강력한 이차시간 난이도를 증명한다.
동일한 프레임워크를 동적 시간 왜곡에 적용하여, 일차원 곡선에서 강력한 이차시간 이하의 알고리즘이 존재하지 않음을 보여준다.
가장 긴 공통 부분수열(LCS)을 가장 긴 팔린드롬 부분수열(LPS)과 가장 긴 텐덤 부분수열(LTS)으로 감소시켜, 이러한 비유사도 측정법에도 하한이 적용됨을 전이한다.
부분수열 거리의 조합적 성질(예: 단조성, 부분가환성)을 활용하여 감소 과정에서의 부분수열 길이를 제한한다.

실험 결과

연구 질문

RQ1임의의 비트리버스 비용 조합(Levenshtein 거리 포함)을 가진 편집 거리를 이중 문자열에서 O(n²−ε) 시간 내에 계산할 수 있는가를 증명할 수 있는가?
RQ2SETH 하에 일차원 곡선에서의 동적 시간 왜곡도 또한 이차시간 하한을 가질 수 있는가?
RQ3조건부 하한 기법을 유사도 측정법을 넘어서, LPS 및 LTS와 같은 다른 문자열 문제로 일반화할 수 있는가?
RQ4일반화된 프레임워크는 문자열 및 곡선 유사도 문제의 광범위한 클래스에 대해 이러한 하한을 가능하게 하는가?
RQ5동일한 감소 기반 기구를 사용하여 여러 문제에 대한 난이도를 증명함으로써, 향후 하한 증명을 단순화할 수 있는가?

주요 결과

임의의 비트리버스 비용 조합(Levenshtein 거리 포함)을 가진 편집 거리는 이중 문자열에서 SETH가 성립하지 않는 한, 어떤 ε>0에 대해서도 O(n²−ε) 시간 내에 계산될 수 없다.
SETH 하에 일차원 곡선에서의 동적 시간 왜곡 역시 강력한 이차시간 이하의 알고리즘이 없으며, 이는 이러한 기본적인 곡선 유사도 측정법으로의 이전의 난이도 결과를 확장한다.
가장 긴 팔린드롬 부분수열과 가장 긴 텐덤 부분수열은 LCS에서의 감소를 통해 이차시간 난이도를 입증하여, SETH 기반 하한이 비유사도 측정법에도 적용됨을 보였다.
제안된 프레임워크는 이차시간 난이도를 증명하는 작업을 단일 통합 기반 기구를 구성하는 것으로 단순화하여, 향후 하한 증명을 크게 간소화한다.
결과는 이중 문자열 또는 일차원 곡선로 제한된 경우에도 성립하여, 현재의 O(n²) 알고리즘이 하위항의 요소를 제외하고는 최적임을 더욱 강화한다.
이 논문은 Backurs와 Indyk의 2015년 Levenshtein 거리에 대한 SETH 기반 하한을 임의의 비용과 이중 알파벳으로 확장함으로써 이전 작업을 일반화하고 개선한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.