QUICK REVIEW

[논문 리뷰] Constructing Deterministic Parity Automata from Positive and Negative Examples

León Bohn, Christof Löding|arXiv (Cornell University)|2023. 01. 01.

semigroups and automata theory참고 문헌 35인용 수 4

한 줄 요약

이 논문은 정규 ω-언어를 양성 및 부정적인 궁극적으로 주기적인 예제로부터 한정된 시간 내에 학습할 수 있는 최초의 다항시간 수동 학습 알고리즘을 제시한다. 이 방법은 문법적 오른쪽 동치의 가족(FORC)에서 '정확한 DPA'를 구성하여, 우선순위와 언어-등가 상태 수가 유한한 하위클래스에 대해 다항 시간의 데이터 복잡도를 달성한다.

ABSTRACT

We present a polynomial time algorithm that constructs a deterministic parity automaton (DPA) from a given set of positive and negative ultimately periodic example words. We show that this algorithm is complete for the class of $ω$-regular languages, that is, it can learn a DPA for each regular $ω$-language. For use in the algorithm, we give a definition of a DPA, that we call the precise DPA of a language, and show that it can be constructed from the syntactic family of right congruences for that language (introduced by Maler and Staiger in 1997). Depending on the structure of the language, the precise DPA can be of exponential size compared to a minimal DPA, but it can also be a minimal DPA. The upper bound that we obtain on the number of examples required for our algorithm to find a DPA for $L$ is therefore exponential in the size of a minimal DPA, in general. However we identify two parameters of regular $ω$-languages such that fixing these parameters makes the bound polynomial.

연구 동기 및 목표

양성 및 부정적인 궁극적으로 주기적인 예제로부터 수동 학습 알고리즘을 개발하여 결정성 평가 자동기계(DPA)를 구성한다.
알고리즘이 모든 정규 ω-언어를 한정된 시간 내에 학습함으로써 ω-정규 언어의 클래스에 대해 완전성을 확보한다.
최소 DPA 크기와 관련된 구조적 매개변수를 식별하여 샘플 크기가 최소 DPA 크기의 다항식이 되도록 데이터 요구량을 최소화한다.
문법적 오른쪽 동치의 가족(FORC) 기반으로 '정확한 DPA'라는 개념을 도입하고 공식화하여 표준 DPA 구성 방법을 제시한다.
샘플 크기와 알고리즘 복잡도에 대한 이론적 한계를 설정하여, 알고리즘이 다항 시간 내에 실행되고 구조적 언어 매개변수에 따라 다항식의 데이터 의존성을 보임을 보여준다.

제안 방법

언어의 정확한 DPA를 정의한다. 이는 언어에 속한 단어의 주기적 부분을 분석하여 우선순위 할당을 유도하는 DPA이다.
Maler 및 Staiger(1997)가 도입한 문법적 오른쪽 동치의 가족(FORC)에서 정확한 DPA를 구성하며, 등幂 클래스를 사용하여 우선순위 할당을 결정한다.
MMAL 활성 학습 알고리즘의 수정된 버전(모의 교사 응답 포함)을 사용하여 언어의 특징 샘플을 생성한다.
MMAL의 출력 및 등가성 질의를 수동 학습 파이프라인에 통합하기 위해, 반복적으로 반례와 접두사 질의를 사용하여 샘플을 동적으로 확장한다.
목표 언어에 기반하여 일관된 응답을 제공하는 교사 모의 환경을 사용하여 정확성을 보장하며, 올바른 DPA로 종료됨을 보장한다.
알고리즘이 다항 시간 내에 실행되며, 입력 샘플과 일치하는 DPA를 생성함을 증명하며, 샘플 크기는 FORC 크기와 정확한 DPA 크기 중 최대값으로 제한된다.

실험 결과

연구 질문

RQ1수동 학습 알고리즘이 양성 및 부정적인 궁극적으로 주기적인 예제로부터 모든 정규 ω-언어에 대해 다항 시간 내에 결정성 평가 자동기계(DPA)를 구성할 수 있는가?
RQ2ω-언어의 어떤 구조적 성질이 수동 DPA 학습에서 다항 샘플 복잡도를 가능하게 하는가?
RQ3문법적 오른쪽 동치의 가족(FORC)을 어떻게 사용하여 언어의 자연스러운 구조를 반영하는 우선순위 할당을 가진 표준 DPA 구성 방법—즉, 정확한 DPA—를 정의할 수 있는가?
RQ4알고리즘의 데이터 요구량이 지수적에서 다항식으로 전환되는 조건은 무엇인가?
RQ5정확한 DPA와 좋은-게임 자동기계 또는 정규화된 메일리 기계와 같은 다른 표준 표현 간에 관련성이 있는가?

주요 결과

제안된 알고리즘 DPAInf는 다항 시간 내에 실행되며, 양성 및 부정적인 궁극적으로 주기적인 예제로부터 모든 정규 ω-언어를 한정된 시간 내에 학습하는 DPA를 구성한다.
알고리즘은 문법적 FORC에서 정확한 DPA를 구성하며, 이는 언어의 주기적 구조에서 유도된 우선순위 할당을 가진 표준 DPA이다.
필요한 예제 수의 상한은 일반적으로 최소 DPA 크기의 지수함수이지만, 우선순위 수와 서로 다른 언어-등가 상태의 최대 수가 고정되어 있을 경우 다항식으로 감소한다.
각 ∼L-클래스가 정확히 하나의 DPA 상태에 대응하는 클래스 IRC(DPA)에서는, 알고리즘이 다항 크기의 샘플만 필요로 한다.
각 ∼L-클래스에 최대 d개의 상태가 있으며 우선순위가 {0,…,k−1}에 속하는 클래스 d-IRC(k-DPA)에서는 고정된 d와 k에 대해 다항 데이터 복잡도를 달성한다.
정확한 DPA는 정규화된 DPA의 클래스를 포함한다. 즉, DPA가 메일리 기계로서 정규화되고 최소일 때이고, 그 자체 언어와 동치 관계에 대해 정확한 DPA일 때에만 성립한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.