[論文レビュー] Constructing Deterministic Parity Automata from Positive and Negative Examples
本稿では、正および負の最終的に周期的例から、決定的パリティオートマトン(DPA)を多項式時間で学習する、初めての受動学習アルゴリズムを提示する。このアルゴリズムは、すべての正則ω言語を極限において学習可能であり、優先度と言語同値状態数が有界な部分クラスに対しては、多項式的データ複雑性を達成する。この手法は、右同値関係の文法的族(FORC)から『正確なDPA』を構築することで実現される。
We present a polynomial time algorithm that constructs a deterministic parity automaton (DPA) from a given set of positive and negative ultimately periodic example words. We show that this algorithm is complete for the class of $ω$-regular languages, that is, it can learn a DPA for each regular $ω$-language. For use in the algorithm, we give a definition of a DPA, that we call the precise DPA of a language, and show that it can be constructed from the syntactic family of right congruences for that language (introduced by Maler and Staiger in 1997). Depending on the structure of the language, the precise DPA can be of exponential size compared to a minimal DPA, but it can also be a minimal DPA. The upper bound that we obtain on the number of examples required for our algorithm to find a DPA for $L$ is therefore exponential in the size of a minimal DPA, in general. However we identify two parameters of regular $ω$-languages such that fixing these parameters makes the bound polynomial.
研究の動機と目的
- 正および負の最終的に周期的例から、決定的パリティオートマトン(DPA)を構築する受動学習アルゴリズムの開発。
- アルゴリズムがすべての正則ω言語を極限において学習可能であり、ω正則言語のクラスに対して完全性を達成することの保証。
- 最小DPAサイズに比例する多項式的サンプルサイズが得られる構造的パラメータを同定することで、データ要件の最小化。
- 『正確なDPA』という概念を導入・形式化し、右同値関係の文法的族に基づく標準的DPA構築法としての役割を明確化。
- サンプルサイズおよびアルゴリズムの複雑性に関する理論的上限を確立し、実行時間と構造的言語パラメータに依存する多項式的データ依存性を示す。
提案手法
- 言語の正確なDPAを、言語に属する語の周期的部分を分析することで得られる優先度割り当てを持つDPAとして定義する。
- MalerとStaiger(1997)が導入した右同値関係の文法的族(FORC)から、正確なDPAを構築する。この際、べき等クラスを用いて優先度割り当てを決定する。
- MMALアクティブ学習アルゴリズム(模擬教師の応答を含む)の変種を用いて、言語の特徴的サンプルを生成する。
- MMALの出力および同値性クエリを、反例および接頭辞クエリによる動的サンプル拡張を組み合わせることで、受動学習パイプラインに統合する。
- 教師がターゲット言語に基づいて一貫してクエリに応答する模擬教師を用いてMMAL実行をシミュレートすることで正しさを保証し、正しいDPAが得られるまで終了することを保証する。
- アルゴリズムが多項式時間で実行され、入力サンプルと整合するDPAを生成することを証明する。サンプルサイズは、FORCサイズと正確なDPAサイズの最大値によって上限が定まる。
実験結果
リサーチクエスチョン
- RQ1正および負の最終的に周期的例から、すべての正則ω言語を多項式時間で学習可能な受動学習アルゴリズムは存在するか?
- RQ2ω言語のどの構造的性質が、受動学習におけるDPAの多項式的サンプル複雑性を可能にするか?
- RQ3右同値関係の文法的族(FORC)をどのように用いることで、言語の自然な構造を反映する優先度割り当てを持つ標準的DPA(正確なDPA)を定義できるか?
- RQ4アルゴリズムのデータ要件が指数的ではなく多項式的になる条件は何か?
- RQ5正確なDPAと、ゲームに良いオートマトンや正規化Mealyマシンといった他の標準的表現との間に、何らかの関係があるか?
主な発見
- 提案されたアルゴリズムDPAInfは多項式時間で実行され、正および負の最終的に周期的例から、すべての正則ω言語を極限において学習可能である。
- アルゴリズムは、文法的FORCから正確なDPAを構築する。これは、言語の周期的構造に基づいて優先度が決定される標準的DPAである。
- 必要な例の数の上限は一般には最小DPAサイズの指数関数的であるが、優先度数と言語同値状態の最大数が固定されている場合には多項式的に減少する。
- 各∼L類がちょうど1つのDPA状態に対応するクラスIRC(DPA)では、アルゴリズムは多項式サイズのサンプルのみを必要とする。
- 各∼L類に高々d個の状態があり、優先度が{0,…,k−1}に属するクラスd-IRC(k-DPA)では、dおよびkが固定されている場合に多項式的データ複雑性を達成する。
- 正確なDPAは、正規化DPAのクラスを包含する。すなわち、DPAがMealyマシンとして正規化かつ最小であることは、それが自身の言語および同値関係について正確なDPAであることに同値する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。