[論文レビュー] Regular Expressions with Backreferences and Lookaheads Capture NLOG
この論文は、後方参照および予測照合を備えた正規表現(REWBLk)が、対数領域非決定的チューリングマシンが認識可能な言語の集合であるNLOGという複雑度クラスを正確に表現することを確立している。著者らは、補集合のためのImmerman–Szelepcsényi定理と、入れ子になった予測照合を処理する対数領域ネスト型オラクルマシンを用いて、REWBLkから対数領域非決定的チューリングマシン(NTM)への翻訳を構築することで、REWBLkの属する問題がPSPACE完全であることを証明した。
Backreferences and lookaheads are vital features to make classical regular expressions (REGEX) practical. Although these features have been widely used, understanding of the unrestricted combination of them has been limited. Practically, most likely, no implementation fully supports them. Theoretically, while some studies have addressed these features separately, few have dared to combine them. Those few studies showed that the amalgamation of these features significantly enhances the expressiveness of REGEX. However, no acceptable expressivity bound for REWBLk - REGEX with backreferences and lookaheads - has been established. We elucidate this by establishing that REWBLk coincides with NLOG, the class of languages accepted by log-space nondeterministic Turing machines (NTMs). In translating REWBLk to log-space NTMs, negative lookaheads are the most challenging part since it essentially requires complementing log-space NTMs in nondeterministic log-space. To address this problem, we revisit Immerman-Szelepcsényi theorem. In addition, we employ log-space nested-oracles NTMs to naturally handle nested lookaheads of REWBLk. Utilizing such oracle machines, we also present the new result that the membership problem of REWBLk is PSPACE-complete.
研究の動機と目的
- 後方参照および予測照合を拡張した正規表現(REWBLk)の表現力を特定すること。
- REWBLkが既知のどの複雑度クラスに対応するかという未解決の問いを解明すること。
- REWBLkの属する問題の計算複雑度を確立すること。
- REWBLkから対数領域非決定的チューリングマシン(NTM)への形式的翻訳メカニズムを構築すること。
提案手法
- 正規表現のコア部分に対して、修正版McNaughton–Yamada–Thompson構成を用いて、REWBLk式を対数領域非決定的チューリングマシン(NTM)に翻訳する。
- 変数の再名付け(α変換に類似した変換)を適用して、入れ子になった変数のキャプチャを排除し、後方参照の処理を単純化する。
- 実行中に、バックレファレンスの値(キャプチャされた部分文字列)を2進形式で格納・比較する特別な作業テープを用いる。
- 入れ子になった予測照合を処理するため、対数領域ネスト型オラクルNTMを導入し、オラクルが予測照合条件をシミュレートする。
- 補集合のためのImmerman–Szelepcsényi定理を適用して、対数領域NTMの補集合を可能にし、非受容状態を正しくシミュレートすることで、負の予測照合(!(E))を処理する。
- 入力全体を消費することを保証するため、マシンに一意の開始状態および終了状態を設ける。これは正規表現の意味論と整合する。
実験結果
リサーチクエスチョン
- RQ1後方参照および予測照合を拡張した正規表現(REWBLk)の表現力は何か?
- RQ2REWBLkのクラスは、計算理論における既知の複雑度クラスと等しいか?
- RQ3REWBLkの属する問題の計算複雑度は何か?
- RQ4負の予測照合が、非決定的対数領域マシンの補集合を必要とするにもかかわらず、対数領域NTMで正しくエミュレート可能か?
主な発見
- REWBLkは、対数領域非決定的チューリングマシンが認識可能な言語の集合であるNLOGと正確に等しい。
- REWBLkの属する問題はPSPACE完全であることが示され、計算上の難易度が裏付けられた。
- 本論文は、任意のREWBLk式から対数領域NTMへの形式的翻訳を提供し、NLOGとの同値性を証明した。
- Immerman–Szelepcsényi定理が、対数領域NTMの補集合を可能にすることで、負の予測照合の処理を可能にした。
- 入れ子になった予測照合は、対数領域ネスト型オラクルNTMによって処理され、対数領域内で再帰的なオラクルクエリをサポートする。
- NLOG完全な言語が、予測照合なしのREWB内でも表現可能であることが示され、コア拡張の表現力が確認された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。