Skip to main content
QUICK REVIEW

[논문 리뷰] $k$-Universality of Regular Languages

Duncan Adamson, Pamela Fleischmann|arXiv (Cornell University)|2023. 01. 01.
semigroups and automata theory인용 수 1
한 줄 요약

이 논문은 정규 언어에서의 k-일반성의 두 가지 개념인 k-∃-부분수열 일반성(존재성)과 k-∀-부분수열 일반성(일반성)을 도입하고 연구한다. 알파벳 크기를 매개변수로 삼는 FPT 알고리즘을 제공하여, 알파벳이 작을 경우 다항 시간 내에 두 성질을 결정할 수 있도록 한다. 주요 기여는 유한 오ート마타 내에서 k-부분수열 일반 단어/경로를 세고 순위를 매기는 효율적인 FPT 기반 프레임워크를 제공하는 것으로, 런타임이 k에 의존하지 않고 알파벳 크기가 작을 경우 상태 수에 다항식적으로 의존한다.

ABSTRACT

A subsequence of a word w is a word u such that u = w[i₁] w[i₂] … w[i_k], for some set of indices 1 ≤ i₁ < i₂ < … < i_k ≤ |w|. A word w is k-subsequence universal over an alphabet Σ if every word in Σ^k appears in w as a subsequence. In this paper, we study the intersection between the set of k-subsequence universal words over some alphabet Σ and regular languages over Σ. We call a regular language L k-∃-subsequence universal if there exists a k-subsequence universal word in L, and k-∀-subsequence universal if every word of L is k-subsequence universal. We give algorithms solving the problems of deciding if a given regular language, represented by a finite automaton recognising it, is k-∃-subsequence universal and, respectively, if it is k-∀-subsequence universal, for a given k. The algorithms are FPT w.r.t. the size of the input alphabet, and their run-time does not depend on k; they run in polynomial time in the number n of states of the input automaton when the size of the input alphabet is O(log n). Moreover, we show that the problem of deciding if a given regular language is k-∃-subsequence universal is NP-complete, when the language is over a large alphabet. Further, we provide algorithms for counting the number of k-subsequence universal words (paths) accepted by a given deterministic (respectively, nondeterministic) finite automaton, and ranking an input word (path) within the set of k-subsequence universal words accepted by a given finite automaton.

연구 동기 및 목표

  • 정규 언어에서의 k-일반성의 두 새로운 개념인 k-∃-부분수열 일반성(존재성)과 k-∀-부분수열 일반성(일반성)을 정식화하고 분석하는 것.
  • 유한 오ート마타로 표현된 정규 언어가 k-∃-또는 k-∀-부분수열 일반성인지 결정하는 효율적인 의사결정 알고리즘을 개발하는 것.
  • 결정성 또는 비결정성 유한 오차마타에 의해 수락되는 k-부분수열 일반 단어 또는 경로의 수를 세고 순위를 매기는 계산 도구를 제공하는 것.
  • k-∃-부분수열 일반성 문제의 복잡도를 조사하여, 알파벳이 클 경우 NP-완전임을 보이는 것.
  • 런타임이 k에 의존하지 않으며, 입력 알파벳 크기가 O(log n)일 경우 다항 시간을 달성하는 알고리즘 설계

제안 방법

  • 모든 길이 k의 문자열이 부분수열로 포함된 단어를 k-부분수열 일반 단어로 정의한다.
  • 언어 수준의 두 개념을 도입한다: k-∃-부분수열 일반성(언어 L에 속하는 어떤 단어도 k-일반성임)과 k-∀-부분수열 일반성(언어 L에 속한 모든 단어가 k-일반성임).
  • 경로의 접두사에 대한 도달 가능성과 부분수열 커버리지 상태를 추적하기 위해 동적 프로그래밍 테이블 T(PR)과 U(PR)를 구성한다.
  • 현재 상태, 경로 길이, 별도의 기호 수, 기호 집합을 매개변수로 삼는 상태 기반 동적 프로그래밍을 사용하여 부분수열 일반성을 인코딩한다.
  • 알파벳 크기 σ에 대해 FPT 프레임워크를 활용하여, 런타임이 σ와 n(상태 수)에 의존하지만 k에는 의존하지 않도록 보장한다.
  • 접두사 기반 테이블과 수용 상태를 통한 합산을 이용해 주어진 단어보다 작은 모든 k-일반 단어의 수를 세어 사전순 순위를 계산한다.

실험 결과

연구 질문

  • RQ1유한 오차마타 표현을 가진 정규 언어가 k-∃-부분수열 일반성인지 FPT 시간 내에 결정할 수 있는가?
  • RQ2정규 언어가 k-∀-부분수열 일반성인지 결정하는 문제의 복잡도는 얼마이며, 이를 효율적으로 수행할 수 있는가?
  • RQ3알파벳이 클 경우 k-∃-부분수열 일반성 문제는 NP-완전한가?
  • RQ4주어진 유한 오차마타에 의해 수락되는 k-부분수열 일반 단어 또는 경로의 수를 효율적으로 세는 것이 가능한가?
  • RQ5주어진 k-일반 단어의 사전순 순위를, 오차마타에 의해 수락되는 모든 k-일반 단어 집합 내에서 계산할 수 있는가?

주요 결과

  • 입력 알파벳이 클 경우 k-∃-부분수열 일반성 문제의 결정은 NP-완전하다. 이는 정규 언어에 대해서도 성립한다.
  • k-∃- 및 k-∀-부분수열 일반성 문제를 결정하는 알고리즘은 알파벳 크기 σ에 대해 FPT 시간 내에 작동하며, σ = O(log n)일 경우 n(상태 수)에 다항식 시간 내에 수행된다.
  • 길이 m의 경로에 대해 결정성 또는 비결정성 유한 오차마타에 의해 수락되는 k-부분수열 일반 단어(또는 경로)의 수는 O*(m²n²k²σ) 시간 내에 계산할 수 있다.
  • 길이 m인 k-일반 단어 w의 사전순 순위는 오차마타에 의해 수락되는 길이 m인 k-일반 단어 집합 내에서 O*(m²n²k²σ) 시간 내에 계산할 수 있다.
  • 길이가 최대 m인 모든 단어에 대해 순위는 O*(m²n²k²σ) 시간 내에 계산 가능하며, 언어 내 모든 단어에 대해 순위는 O*(n⁴k³σ) 시간 내에 계산 가능하다.
  • 이 프레임워크는 결정성 및 비결정성 유한 오차마타 모두를 지원하며, 단어 수 계산과 경로 수 계산 모두에 대해 동일한 결과가 성립한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.