Skip to main content
QUICK REVIEW

[논문 리뷰] Computing All Distinct Squares in Linear Time for Integer Alphabets

Hideo Bannai, Shunsuke Inenaga|arXiv (Cornell University)|2016. 10. 11.
Algorithms and Data Compression참고 문헌 21인용 수 3
한 줄 요약

이 논문은 정수 알파벳에서 문자열의 모든 서로 다른 제곱을 선형 시간에 계산하는 알고리즘을 제시한다. 이는 접미사 트리와 반동적 최저 마킹 조상 데이터 구조를 활용한다. 주요 기여는 최소 증강 접미사 트리(MAST)의 구조를 O(n) 시간에 구성하는 것으로, 이는 비중첩 부분문자열 발생 쿼리를 효율적으로 처리할 수 있게 한다.

ABSTRACT

Given a string on an integer alphabet, we present an algorithm that computes the set of all distinct squares belonging to this string in time linear to the string length. As an application, we show how to compute the tree topology of the minimal augmented suffix tree in linear time. Asides from that, we elaborate an algorithm computing the longest previous table in a succinct representation using compressed working space.

연구 동기 및 목표

  • 정수 알파벳에서 문자열의 모든 서로 다른 제곱을 선형 시간에 계산하기.
  • 최소 증강 접미사 트리(MAST)의 구조를 선형 시간에 효율적으로 구성하기.
  • 가장 긴 이전 요소(LPF) 표를 압축된 형태로 간결하게 표현하기.
  • 실용적인 데이터 구조 설계를 통해 온라인으로 서로 다른 제곱을 계산할 수 있도록 지원하기.

제안 방법

  • 범위 최소 쿼리(RMQ)를 통해 제곱 부분문자열을 효율적으로 찾기 위해 접미사 배열과 LCP 배열을 사용한다.
  • 처리된 영역을 접미사 트리에서 추적하기 위해 반동적 최저 마킹 조상(LMA) 데이터 구조를 활용한다.
  • 정수 정렬을 사용해 제곱 루트를 길이 순으로 정렬하여 증가하는 순서로 처리한다.
  • 접미사 트리의 상향식 순회를 통해 제곱 루트에 해당하는 위치에 새로운 노드를 삽입한다.
  • LPF 표를 2n + o(n) 비트로 표현하고 압축된 작업 공간을 사용해 계산한다.
  • LCP 배열에 대한 RMQ를 활용해 LCE 쿼리를 상수 시간에 응답한다.

실험 결과

연구 질문

  • RQ1정수 알파벳에 대해 문자열의 모든 서로 다른 제곱을 선형 시간에 계산할 수 있는가?
  • RQ2최소 증강 접미사 트리(MAST)의 트리 구조를 O(n) 시간에 구성할 수 있는가?
  • RQ3가장 긴 이전 요소(LPF) 표를 압축된 공간으로 저장하고 계산할 수 있는가?
  • RQ4알고리즘을 온라인 처리를 위한 것으로 적응시킬 수 있는가?

주요 결과

  • 알고리즘은 정수 알파벳 크기가 n^O(1)일 때 모든 서로 다른 제곱을 O(n) 시간에 계산한다.
  • 최소 증강 접미사 트리(MAST)의 구조는 O(n) 시간에 구성되며, 이는 이전의 O(n log n) bound를 향상시킨다.
  • LPF 표는 2n + o(n) 비트로 저장되고 압축된 작업 공간을 사용해 계산된다.
  • 반동적 최저 마킹 조상 구조를 활용해 접미사 트리에서 삽입 지점을 효율적으로 찾는다.
  • 제곱 루트에 해당하는 깊이에 맞는 위치에 노드를 삽입함으로써 MAST를 선형 시간에 구성할 수 있다.
  • 알고리즘이 온라인 처리를 지원함을 부록에서 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.