Skip to main content
QUICK REVIEW

[論文レビュー] Optimal Test Sets for Context-Free Languages

Mikaël Mayer, Jad Hamza|arXiv (Cornell University)|Nov 21, 2016
semigroups and automata theory参考文献 2被引用数 1
ひとこと要約

本稿は、サイズ n の任意の文脈自由文法に対して、O(n³) のサイズのテストセットを構成する最初のアルゴリズムを提示する。これは、従来の O(n⁶) の上界と O(n³) の下界の間の長年のギャップを埋めるものである。文法から導かれるグラフにおける最適パス列挙と、Plandowski のテストセット補題の洗練された応用により、著者たちはタイトな立方体の境界を達成し、文脈自由言語におけるテストセットのサイズとして O(n³) が最適であることを証明する。

ABSTRACT

A test set for a formal language (set of strings) L is a subset T of L such that for any two string homomorphisms f and g defined on L, if the restrictions of f and g on T are identical functions, then f and g are identical on the entire L. Previously, it was shown that there are context-free grammars for which smallest test sets are cubic in the size of the grammar, which gives a lower bound on tests set size. Existing upper bounds were higher degree polynomials; we here give the first algorithm to compute test sets of cubic size for all context-free grammars, settling the gap between the upper and lower bound.

研究の動機と目的

  • 文脈自由文法におけるテストセットサイズの既知の O(n⁶) 上界と O(n³) 下界の間のギャップを埋めること。
  • 任意の文脈自由文法に対して、O(n³) のサイズのテストセットを構成する効率的なアルゴリズムを開発すること。
  • すべての文脈自由文法に対してこのサイズのテストセットを構築することで、O(n³) がタイトであることを証明すること。
  • Lin(G) 変換を用いて、線形文脈自由文法から一般の文脈自由文法への構成を一般化すること。

提案手法

  • 生成規則に基づいてラベル付きグラフを構築し、ノードを非終端記号および終端記号とし、エッジを規則として定義する。
  • 長さと辞書式順序に基づく全順序をパスに定義し、最適パスを特定する。
  • O(|N|²|R|) 時間で、すべての頂点対(非終端記号または ⊥)間の最適パスを事前に計算する。
  • n ≤ 3 である形 P₁e₁P₂…PₙeₙPₙ₊₁ に従う受理パスに対応する語の集合 Φ₃(G) を構築する。ここで Pᵢ は最適であり、Pᵢeᵢ は最適でない。
  • 4 文字アルファベット上で Plandowski のテストセット補題を用い、背理法により Φ₃(G) が有効なテストセットであることを証明する。
  • Lin(G) 変換を適用して非線形文法に拡張し、元の文法のテストセットを形成する線形文法を生成する。

実験結果

リサーチクエスチョン

  • RQ1任意の文脈自由文法に対して、既知の下界に一致する O(n³) のサイズのテストセットを構築することは可能か?
  • RQ2テストセット構成の O(n⁶) 上界を、O(n³) の下界に一致するように改善できるか?
  • RQ3文法グラフにおける最適パスの構成は、ホモモーティズム同値性を保つ最小のテストセットを導くか?
  • RQ4Plandowski のテストセット補題は、一般の文脈自由文法の文脈で最小性を証明するために適応可能か?
  • RQ5Lin(G) 変換は、一般のケースを線形ケースに還元しつつ、テストセットの性質を保持するのに十分か?

主な発見

  • 本稿は、文脈自由文法におけるテストセットサイズのタイトな上界が O(n³) であることを確立する。
  • 線形文脈自由文法に対して、O(|N|·|R|³) 時間でサイズ O(n³) のテストセットを構成するアルゴリズムが提示される。
  • 構成は、最適でないエッジを高々3つ含むパスの列挙に依存しており、最小パスの一意性と正しさを保証する。
  • Plandowski の補題を4文字アルファベット上で用い、背理法により Φ₃(G) が有効なテストセットであることを証明する。
  • 一般の文脈自由文法に対しては、Lin(G) 変換により線形ケースに還元することで、同じ O(n³) の境界を達成できる。
  • 結果として、従来の O(n⁶) 上界と O(n³) 下界のギャップが埋められ、O(n³) が最適であることが証明される。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。