Skip to main content
QUICK REVIEW

[論文レビュー] Edit Distance of Finite State Transducers

C. Aiswarya, Amaldev Manuel|arXiv (Cornell University)|Jan 1, 2024
DNA and Biological Computing被引用数 1
ひとこと要約

本稿では、関数的同等性を越えて有限状態トランスダクタを比較するためのメトリックベースのフレームワークを導入する。トランスダクション間の編集距離を、すべての入力に対して出力の間の編集距離の上界として定義することで、それらの距離を測定する。一般的な整数値編集距離(例:ハミング、転置、共役、レーベンシュタイン系列)に対しては、関数的トランスダクタにおける近接性およびk近接性問題が決定可能であり、距離の計算が可能であり、問題はco-NP ∩ NPに属する。

ABSTRACT

We lift metrics over words to metrics over word-to-word transductions, by defining the distance between two transductions as the supremum of the distances of their respective outputs over all inputs. This allows to compare transducers beyond equivalence. Two transducers are close (resp. $k$-close) with respect to a metric if their distance is finite (resp. at most $k$). Over integer-valued metrics computing the distance between transducers is equivalent to deciding the closeness and $k$-closeness problems. For common integer-valued edit distances such as, Hamming, transposition, conjugacy and Levenshtein family of distances, we show that the closeness and the $k$-closeness problems are decidable for functional transducers. Hence, the distance with respect to these metrics is also computable. Finally, we relate the notion of distance between functions to the notions of diameter of a relation and index of a relation in another. We show that computing edit distance between functional transducers is equivalent to computing diameter of a rational relation and both are a specific instance of the index problem of rational relations.

研究の動機と目的

  • 関数的同等性を越えて、出力間の編集距離に基づくトランスダクタ比較の形式的フレームワークを構築すること。
  • さまざまな整数値編集距離の下で、関数的トランスダクタにおける近接性およびk近接性問題の決定可能性を調査すること。
  • 有理関係の直径や、ある関係の合成閉包における別の関係のインデックスといった、より広範なオートマトン理論的概念との関連を明らかにすること。
  • 距離計算問題の計算量的境界を確立し、主な編集距離において問題がco-NP ∩ NPに属することを示すこと。

提案手法

  • 2つのトランスダクション間の距離を、共通するすべての入力に対して出力語の間の編集距離の上界として定義する。
  • トランスダクタ距離の計算問題を、整数値編集距離の下での近接性およびk近接性の決定問題に還元する。
  • トランスダクタの強連結成分(SCC)から、出力変換をシミュレートする多項式サイズの非循環オートマトンを構築する。
  • 各SCCに対して前向きおよび後向きのガジェットを構築し、パス走査中に編集操作(例:置換や隣接転置)を追跡する。
  • トポロジカルソートと状態の統合を用いて非循環性を保証し、経路解析を有界化する。
  • 反復的なk近接性チェックを用いて、距離計算問題をNPおよびco-NPに属する有界性問題に還元する。

実験結果

リサーチクエスチョン

  • RQ1ハミング、転置、共役、レーベンシュタインといった一般的な編集距離の下で、2つの関数的有限状態トランスダクタ間の距離は計算可能か?
  • RQ2これらの編集距離の下で、トランスダクタの近接性およびk近接性問題は決定可能か?
  • RQ3これらの距離の下で、トランスダクタ間の編集距離の計算問題はco-NP ∩ NPに属するか?
  • RQ4トランスダクタ間の距離は、有理関係の直径や、ある関係の合成閉包における別の関係のインデックスとどのように関係するか?
  • RQ5このフレームワークは、双方向トランスダクタやポリレギュラートランスダクタ、あるいは無限語へと拡張可能か?

主な発見

  • ハミング、転置、共役、およびレーベンシュタイン系列の編集距離の下で、関数的トランスダクタにおける近接性およびk近接性問題は決定可能である。
  • トランスダクタ間の編集距離の計算は、整数値編集距離の下での近接性およびk近接性の決定問題に等価である。
  • ハミングおよび転置距離の下で、距離計算問題はco-NP ∩ NPに属し、有界解析に適した多項式時間の非循環オートマトンの構築が可能である。
  • 有理関係の直径は計算可能であり、ニヴァトの定理により、2つのトランスダクション間の距離に等しい。
  • 問題は、トランスダクタの状態グラフのSCCから導かれる非循環オートマトンにおけるパス上の有界編集操作のチェックに還元される。
  • このフレームワークは有理関係へ一般化可能であり、トランスダクタ距離が有理関係におけるインデックス問題および直径計算の特別なケースであることが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。