QUICK REVIEW

[논문 리뷰] $k$-Universality of Regular Languages

Duncan Adamson, Pamela Fleischmann|arXiv (Cornell University)|2023. 01. 01.

semigroups and automata theory인용 수 1

한 줄 요약

이 논문은 정규 언어에서의 k-일반성의 두 가지 개념인 k-∃-부분수열 일반성(존재성)과 k-∀-부분수열 일반성(일반성)을 도입하고 연구한다. 알파벳 크기를 매개변수로 삼는 FPT 알고리즘을 제공하여, 알파벳이 작을 경우 다항 시간 내에 두 성질을 결정할 수 있도록 한다. 주요 기여는 유한 오ート마타 내에서 k-부분수열 일반 단어/경로를 세고 순위를 매기는 효율적인 FPT 기반 프레임워크를 제공하는 것으로, 런타임이 k에 의존하지 않고 알파벳 크기가 작을 경우 상태 수에 다항식적으로 의존한다.

ABSTRACT

A subsequence of a word w is a word u such that u = w[i₁] w[i₂] … w[i_k], for some set of indices 1 ≤ i₁ < i₂ < … < i_k ≤ |w|. A word w is k-subsequence universal over an alphabet Σ if every word in Σ^k appears in w as a subsequence. In this paper, we study the intersection between the set of k-subsequence universal words over some alphabet Σ and regular languages over Σ. We call a regular language L k-∃-subsequence universal if there exists a k-subsequence universal word in L, and k-∀-subsequence universal if every word of L is k-subsequence universal. We give algorithms solving the problems of deciding if a given regular language, represented by a finite automaton recognising it, is k-∃-subsequence universal and, respectively, if it is k-∀-subsequence universal, for a given k. The algorithms are FPT w.r.t. the size of the input alphabet, and their run-time does not depend on k; they run in polynomial time in the number n of states of the input automaton when the size of the input alphabet is O(log n). Moreover, we show that the problem of deciding if a given regular language is k-∃-subsequence universal is NP-complete, when the language is over a large alphabet. Further, we provide algorithms for counting the number of k-subsequence universal words (paths) accepted by a given deterministic (respectively, nondeterministic) finite automaton, and ranking an input word (path) within the set of k-subsequence universal words accepted by a given finite automaton.

연구 동기 및 목표

정규 언어에서의 k-일반성의 두 새로운 개념인 k-∃-부분수열 일반성(존재성)과 k-∀-부분수열 일반성(일반성)을 정식화하고 분석하는 것.
유한 오ート마타로 표현된 정규 언어가 k-∃-또는 k-∀-부분수열 일반성인지 결정하는 효율적인 의사결정 알고리즘을 개발하는 것.
결정성 또는 비결정성 유한 오차마타에 의해 수락되는 k-부분수열 일반 단어 또는 경로의 수를 세고 순위를 매기는 계산 도구를 제공하는 것.
k-∃-부분수열 일반성 문제의 복잡도를 조사하여, 알파벳이 클 경우 NP-완전임을 보이는 것.
런타임이 k에 의존하지 않으며, 입력 알파벳 크기가 O(log n)일 경우 다항 시간을 달성하는 알고리즘 설계

제안 방법

모든 길이 k의 문자열이 부분수열로 포함된 단어를 k-부분수열 일반 단어로 정의한다.
언어 수준의 두 개념을 도입한다: k-∃-부분수열 일반성(언어 L에 속하는 어떤 단어도 k-일반성임)과 k-∀-부분수열 일반성(언어 L에 속한 모든 단어가 k-일반성임).
경로의 접두사에 대한 도달 가능성과 부분수열 커버리지 상태를 추적하기 위해 동적 프로그래밍 테이블 T(PR)과 U(PR)를 구성한다.
현재 상태, 경로 길이, 별도의 기호 수, 기호 집합을 매개변수로 삼는 상태 기반 동적 프로그래밍을 사용하여 부분수열 일반성을 인코딩한다.
알파벳 크기 σ에 대해 FPT 프레임워크를 활용하여, 런타임이 σ와 n(상태 수)에 의존하지만 k에는 의존하지 않도록 보장한다.
접두사 기반 테이블과 수용 상태를 통한 합산을 이용해 주어진 단어보다 작은 모든 k-일반 단어의 수를 세어 사전순 순위를 계산한다.

실험 결과

연구 질문

RQ1유한 오차마타 표현을 가진 정규 언어가 k-∃-부분수열 일반성인지 FPT 시간 내에 결정할 수 있는가?
RQ2정규 언어가 k-∀-부분수열 일반성인지 결정하는 문제의 복잡도는 얼마이며, 이를 효율적으로 수행할 수 있는가?
RQ3알파벳이 클 경우 k-∃-부분수열 일반성 문제는 NP-완전한가?
RQ4주어진 유한 오차마타에 의해 수락되는 k-부분수열 일반 단어 또는 경로의 수를 효율적으로 세는 것이 가능한가?
RQ5주어진 k-일반 단어의 사전순 순위를, 오차마타에 의해 수락되는 모든 k-일반 단어 집합 내에서 계산할 수 있는가?

주요 결과

입력 알파벳이 클 경우 k-∃-부분수열 일반성 문제의 결정은 NP-완전하다. 이는 정규 언어에 대해서도 성립한다.
k-∃- 및 k-∀-부분수열 일반성 문제를 결정하는 알고리즘은 알파벳 크기 σ에 대해 FPT 시간 내에 작동하며, σ = O(log n)일 경우 n(상태 수)에 다항식 시간 내에 수행된다.
길이 m의 경로에 대해 결정성 또는 비결정성 유한 오차마타에 의해 수락되는 k-부분수열 일반 단어(또는 경로)의 수는 O*(m²n²k²σ) 시간 내에 계산할 수 있다.
길이 m인 k-일반 단어 w의 사전순 순위는 오차마타에 의해 수락되는 길이 m인 k-일반 단어 집합 내에서 O*(m²n²k²σ) 시간 내에 계산할 수 있다.
길이가 최대 m인 모든 단어에 대해 순위는 O*(m²n²k²σ) 시간 내에 계산 가능하며, 언어 내 모든 단어에 대해 순위는 O*(n⁴k³σ) 시간 내에 계산 가능하다.
이 프레임워크는 결정성 및 비결정성 유한 오차마타 모두를 지원하며, 단어 수 계산과 경로 수 계산 모두에 대해 동일한 결과가 성립한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.