[论文解读] Edit Distance of Finite State Transducers
本文提出一种基于度量的框架,用于在超越功能等价性的基础上比较有限状态转换器。通过将转换之间的编辑距离定义为所有输入下其输出之间编辑距离的上确界,实现该比较。对于常见的整数型编辑距离(如汉明距离、换位距离、共轭距离及Levenshtein族距离),功能型转换器的接近度与k-接近度问题可判定,且距离可计算,该问题位于 co-NP ∩ NP 中。
We lift metrics over words to metrics over word-to-word transductions, by defining the distance between two transductions as the supremum of the distances of their respective outputs over all inputs. This allows to compare transducers beyond equivalence. Two transducers are close (resp. $k$-close) with respect to a metric if their distance is finite (resp. at most $k$). Over integer-valued metrics computing the distance between transducers is equivalent to deciding the closeness and $k$-closeness problems. For common integer-valued edit distances such as, Hamming, transposition, conjugacy and Levenshtein family of distances, we show that the closeness and the $k$-closeness problems are decidable for functional transducers. Hence, the distance with respect to these metrics is also computable. Finally, we relate the notion of distance between functions to the notions of diameter of a relation and index of a relation in another. We show that computing edit distance between functional transducers is equivalent to computing diameter of a rational relation and both are a specific instance of the index problem of rational relations.
研究动机与目标
- 开发一种基于其输出之间编辑距离的转换器比较的正式框架,超越单纯的函数等价性。
- 研究在各种整数型编辑度量下,功能型转换器的接近度与k-接近度问题的可判定性。
- 将转换器距离与更广泛的自动机理论概念(如有理关系的直径,以及一个关系在另一个关系的复合闭包中的指标)联系起来。
- 为距离计算问题建立计算复杂度界限,表明在关键编辑距离下,该问题位于 co-NP ∩ NP 中。
提出的方法
- 将两个转换之间的距离定义为所有公共输入下其输出词之间编辑距离的上确界。
- 将转换器距离的计算问题归约为在整数型编辑度量下判定接近度与k-接近度的问题。
- 从转换器自动机的强连通分量构造出多项式规模的有向无环自动机,以模拟输出变换。
- 为每个强连通分量设置前向与后向装置,以在路径遍历过程中追踪编辑操作(如替换或相邻换位)。
- 利用拓扑排序与状态合并技术,确保无环性并支持有界路径分析。
- 通过迭代的k-接近度检查,将距离计算归约为NP与co-NP中的有界性问题。
实验结果
研究问题
- RQ1在常见的编辑距离(如汉明距离、换位距离、共轭距离及Levenshtein距离)下,两个功能型有限状态转换器之间的距离是否可计算?
- RQ2对于这些编辑度量,转换器的接近度与k-接近度问题是否可判定?
- RQ3在这些度量下,计算转换器之间编辑距离的问题是否位于 co-NP ∩ NP 中?
- RQ4转换器之间的距离与有理关系的直径,以及一个关系在另一个关系的复合闭包中的指标之间有何关联?
- RQ5该框架能否扩展至双向或多正则转换器,或无限字上的情况?
主要发现
- 在汉明距离、换位距离、共轭距离及Levenshtein族编辑距离下,功能型转换器的接近度与k-接近度问题均可判定。
- 计算转换器之间的编辑距离等价于在整数型度量下判定接近度与k-接近度问题。
- 在汉明距离与换位距离下,距离计算问题位于 co-NP ∩ NP 中,且可构造出用于有界分析的多项式时间有向无环自动机。
- 有理关系的直径是可计算的,且根据Nivat定理,等价于通过两个转换之间的距离。
- 该问题可归约为在从转换器状态图的强连通分量导出的有向无环自动机中,对路径上的有界编辑操作进行检查。
- 该框架可推广至有理关系,表明转换器距离是有理关系中指标问题与直径计算的特例。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。