Skip to main content
QUICK REVIEW

[論文レビュー] Optimal Regular Expressions for Permutations

Antonio Molina Lovett, Jeffrey Shallit|arXiv (Cornell University)|Dec 15, 2018
semigroups and automata theory参考文献 8被引用数 2
ひとこと要約

本稿では、n文字のアルファベットのすべての順列を指定する正規表現 Rn の分割統治的構成を提示する。これにより、アルファベット長が 4n n−(lg n)/4+Θ(1) という最適値に達する。著者らは、順列言語 Pn を指定するすべての正規表現の中で、この表現がサイズ最小であることを証明し、従来の 2n−1 の下界を改善し、スターリング近似と再帰的不等式を用いてタイトな漸近的境界を確立した。

ABSTRACT

The permutation language $P_n$ consists of all words that are permutations of a fixed alphabet of size $n$. Using divide-and-conquer, we construct a regular expression $R_n$ that specifies $P_n$. We then give explicit bounds for the length of $R_n$, which we find to be $4^n n^{-(\lg n)/4+Θ(1)}$, and use these bounds to show that $R_n$ has minimum size over all regular expressions specifying $P_n$.

研究の動機と目的

  • n文字のアルファベットのすべての順列からなる言語 Pn を指定する正規表現を、サイズ最小となるように構成すること。
  • Pn を指定する正規表現のアルファベット長に対する従来の弱い下界 2n−1 を改善すること。
  • 再帰的分解と組合せ的解析を用いて、Pn を指定する最小の正規表現のサイズに対するタイトな漸近的境界を確立すること。
  • 提案された分割統治的構成が、Pn に対して可能な最小サイズの正規表現を生成することを証明すること。
  • 正規表現のサイズをスターリングの公式に関連づけ、関数 f(n)(表現のアルファベット長)の正確な成長見積もりを導出すること。

提案手法

  • 再帰的な分割統治戦略により、E(S) を、S の大きさ ⌊n/2⌋ の部分集合 T ⊆ S 全体の和集合として、E(T) と E(S−T) の連結で定義する。初期条件は E(i) = i である。
  • アルファベット長 f(n) を次のように再帰的に定義する:f(1) = 1、n > 1 のとき f(n) = (n choose ⌊n/2⌋) · (f(⌊n/2⌋) + f(⌈n/2⌉)) である。
  • スターリング近似を適用して f(n) の漸近的挙動を推定し、特に 2 のべき乗に対して f(n) ≈ 4n n−(lg n)/4+Θ(1) を得る。
  • 最適性の証明は、任意の 0 < k < n に対して (n choose k)(f(k) + f(n−k)) ≥ f(n) が成り立ち、等号が成立するのは k = ⌊n/2⌋ または k = ⌈n/2⌉ のときに限ることを示す重要な補題に依存する。
  • 関数 gα(n) = n^α e^{−c√n} の性質と再帰的不等式を用いて f(n) の上界と下界を導出し、スターリング型近似と関連付ける。
  • 最後に、f(n+1) ≥ 3f(n) の成長境界と得られた境界を組み合わせた帰納的議論により、すべての n ≥ 1 に対して最適性証明を完了する。

実験結果

リサーチクエスチョン

  • RQ1順列言語 Pn を指定する正規表現は、自明な n·n! の上界よりも著しく小さいアルファベット長で構成可能だろうか?
  • RQ2アルファベットを2つの等大の部分集合に分割する分割統治的構成は、表現サイズの観点で最適だろうか?
  • RQ3Pn を指定する最小のアルファベット長の正規表現のタイトな漸近的境界は何か?
  • RQ4提案された構成は理論的最小サイズに達しており、すべての n ≥ 1 に対して厳密に証明可能だろうか?
  • RQ5表現サイズに現れる再帰的構造と組合せ的係数は、スターリングの公式のような既知の漸近的近似とどのように関係するだろうか?

主な発見

  • Pn に対する提案された正規表現 Rn は、f(n) = 4n n−(lg n)/4+Θ(1) のアルファベット長を持つ。これは、この漸近的サイズに達する最初の明示的構成である。
  • この構成は最適性が証明されている:Pn を指定する正規表現は f(n) よりも小さくはならない。従来の 2n−1 の下界を改善した。
  • 最小サイズは、各再帰的段階でアルファベットを大きさ ⌊n/2⌋ と ⌈n/2⌉ の部分集合に分割する分割統治戦略によってのみ達成される。
  • 著者らは、上界 f(n) ≤ 1/4 g^{5/4−lg π/2}(n) と下界 f(n) ≥ 0.195 g^{5/4−lg π/2}(n) を確立した。ここで gα(n) = n^α e^{−c√n} である。これにより、漸近的成長率が確認された。
  • 最適性の証明は、重要な不等式 (n choose k)(f(k) + f(n−k)) ≥ f(n) に依存しており、任意の 0 < k < n に対して成り立ち、等号が成立するのは k = ⌊n/2⌋ または k = ⌈n/2⌉ のときのみである。
  • 関数 f(n) は 3f(n−1) よりも速やかに成長する。これは、すべての n ≥ 1 に対して最適性の帰納的証明のギャップを埋めるために用いられた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。