QUICK REVIEW

[논문 리뷰] Longest Common Factor Made Fully Dynamic.

Amihood Amir, Panagiotis Charalampopoulos|arXiv (Cornell University)|2018. 04. 23.

Algorithms and Data Compression인용 수 4

한 줄 요약

이 논문은 최초로 완전 동적(longest common factor, LCF) 문제를 해결하는 알고리즘을 제안하며, 각 편집 연산을 $\tilde{\mathcal{O}}(n^{3/4})$ 시간에 처리하고 $\tilde{\mathcal{O}}(n)$ 공간을 사용하여 강한 하위선형(update) 시간을 달성한다. 이전의 연구에 비해 양쪽 문자열에서의 동적 업데이트를 지원하고 각 편집 이후에 효율적인 LCF 쿼리를 가능하게 하며, 편집이 한 문자열에서만 발생하는 제한된 경우에 대해 더 빠른 변종도 제공한다.

ABSTRACT

In the longest common factor (LCF) problem, we are given two strings $S$ and $T$, each of length at most $n$, and we are asked to find a longest string occurring in both $S$ and $T$. This is a classical and well-studied problem in computer science. The LCF length for two strings can vary greatly even when a single character is changed. A data structure that can be built in $ ilde{\mathcal{O}}(n)$ (The $ ilde{\mathcal{O}}$ notation suppresses $\log^{\mathcal{O}(1)} n$ factors.) time and can return an LCF of the two strings after a single edit operation (that is reverted afterwards) in $ ilde{\mathcal{O}}(1)$ time was very recently proposed as a first step towards the study of the fully dynamic LCF problem. In the fully dynamic version, edit operations are allowed in any of the two strings, and we are to report an LCF after each such operation. We present the first algorithm that requires strongly sublinear time per edit operation. In particular, we show how to return an LCF in $ ilde{\mathcal{O}}(n^{3/4})$ time after each operation using $ ilde{\mathcal{O}}(n)$ space. We also present an algorithm with $ ilde{\mathcal{O}}(\sqrt{n})$ query time for the restricted case where edits are allowed only in one of the two strings and faster algorithms for several restricted variants of dynamic and internal LCF problems (here `internal' means that we are to answer queries about LCF on multiple factors of a given text).

연구 동기 및 목표

편집 연산이 어느 문자열에서든 허용되며, 각 업데이트 이후에 LCF를 보고할 수 있는 완전 동적 최장 공통 부분문자열(LCF) 문제를 해결하기 위해.
이전의 정적 또는 부분 동적 솔루션의 한계를 극복하기 위해, 양쪽 문자열에서 임의의 편집 이후에도 효율적인 업데이트를 가능하게 하기 위해.
이전의 $\tilde{\mathcal{O}}(1)$ 쿼리 시간에 비해 단일 편집만을 허용하는 경우보다 더 빠른 강한 하위선형 시간을 확보하기 위해.
제한된 변종의 탐색과 최적화를 위해, 내부 LCF 쿼리 및 한 문자열에서만 편집이 허용되는 경우 등을 포함한다.

제안 방법

편집에 따른 요소 정보를 효율적으로 유지하기 위해 접미사 자동기계와 웨이블릿 트리를 조합하여 사용한다.
고수준의 요소 구조에 집중하기 위해 문자열의 계층적 분해를 활용하여 빠른 업데이트와 쿼리를 가능하게 한다.
압축된 접미사 배열과 동적 데이터 구조 업데이트를 사용하여 모든 부분문자열의 압축된 표현을 유지한다.
반복되는 부분문자열 정보를 압축하고 랭크/선택 구조를 사용함으로써 $\tilde{\mathcal{O}}(n)$ 공간을 유지한다.
편집 이후 공통 부분문자열을 신속하게 식별할 수 있도록 동적 분해를 유지하는 핵심 기법을 활용한다.
쿼리 처리는 압축된 구조에서의 이진 탐색과 범위 쿼리를 조합하여 $\tilde{\mathcal{O}}(n^{3/4})$ 시간 내에 최장 공통 부분문자열을 탐색한다.

실험 결과

연구 질문

RQ1편집이 양쪽 문자열에서 허용되는 완전 동적 환경에서 최장 공통 부분문자열 문제를 효율적으로 해결할 수 있는가?
RQ2임의의 편집 연산에 대해 LCF를 유지하는 데 있어서 가능한 최선의 업데이트 시간은 무엇인가?
RQ3동적 업데이트와 쿼리를 지원하면서도 공간 사용량을 $\tilde{\mathcal{O}}(n)$ 이내로 유지할 수 있는가?
RQ4편집이 한 문자열에서만 발생하는 제한된 경우에 더 빠른 쿼리 시간을 확보할 수 있는가?
RQ5주어진 텍스트의 부분문자열에 대한 내부 LCF 쿼리—즉, 부분문자열에서의 LCF 탐색—를 동적 환경에서 효율적으로 지원할 수 있는가?

주요 결과

제안된 알고리즘은 완전 동적 LCF 쿼리에서 각 편집 연산에 대해 $\tilde{\mathcal{O}}(n^{3/4})$ 시간을 확보하여 이전의 정적 또는 부분 동적 접근에 비해 상당한 향상을 이룬다.
알고리즘은 단지 $\tilde{\mathcal{O}}(n)$ 공간을 사용하여 동적 업데이트가 이루어지는 상황에서도 공간 효율적이다.
편집이 한 문자열에서만 허용되는 제한된 경우에 대해 알고리즘은 $\tilde{\mathcal{O}}(\sqrt{n})$ 쿼리 시간을 달성하여 일반 케이스보다 더 빠르다.
모든 연산 이후에 LCF를 보고할 수 있도록 양쪽 문자열에서의 동적 업데이트를 지원한다.
내부 LCF 문제에 대해 더 빠른 알고리즘을 제공하며, 주어진 텍스트의 부분문자열에 대한 쿼리가 가능하다.
결과적으로 강한 하위선형 업데이트 시간이 완전 동적 LCF 문제에서 달성 가능함을 입증하여, 동적 문자열 알고리즘 분야에서 핵심적인 열린 문제를 해결했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.