[论文解读] Alternating Towers and Piecewise Testable Separators
本文研究了使用交替塔计算正则语言的分段可测试分离器的复杂性,表明最大有限塔的高度——决定可分性的关键因素——随状态数呈多项式增长,但随字母表大小呈指数增长。作者为二元字母表建立了紧致的指数下界,并证明了无限前缀塔存在的NL-完全性,解决了语言可分性中的关键复杂性问题。
Two languages are separable by a piecewise testable language if and only if there exists no infinite tower between them. An infinite tower is an infinite sequence of strings alternating between the two languages such that every string is a subsequence (scattered substring) of all the strings that follow. For regular languages represented by nondeterministic finite automata, the existence of an infinite tower is decidable in polynomial time. In this paper, we investigate the complexity of a particular method to compute a piecewise testable separator. We show that it is closely related to the height of maximal finite towers, and provide the upper and lower bounds with respect to the size of the given nondeterministic automata. Specifically, we show that the upper bound is polynomial with respect to the number of states with the cardinality of the alphabet in the exponent. Concerning the lower bound, we show that towers of exponential height with respect to the cardinality of the alphabet exist. Since these towers mostly turn out to be sequences of prefixes, we also provide a comparison with towers of prefixes.
研究动机与目标
- 确定由非确定性有限自动机表示的两个正则语言之间最大有限塔高度的上下界。
- 阐明塔高度与构造分段可测试分离器的计算复杂性之间的关系。
- 研究在不相交的正则语言之间是否存在无限前缀塔,并确定其复杂性。
- 扩展先前关于交替塔的研究,并改进NFA和DFA的界。
- 通过分析塔的结构特性,解决高效计算分段可测试分离器的开放问题。
提出的方法
- 本文通过产品自动机构造分析交替塔——即两个语言中字符串交替出现的序列,其中每个字符串是后续所有字符串的分散子序列。
- 通过在产品自动机 A × B 中进行可达性分析,检测暗示存在高塔或无限塔的环路和模式。
- 提出一种基于模式的新型刻画方法,涉及六个状态(σ, σ1, σ2, τ, τ1, τ2),通过形成环路和相互可达性来检测无限塔条件。
- 将无限前缀塔存在的问题归约为有向图中的标准可达性问题,通过构造性归约证明其NL-完全性。
- 利用强连通分量的结构分析和环路检测,推导出塔高度的上下界。
- 该方法利用了已知的分段可测试可分性结果,并将其与无限塔的不存在性联系起来,从而建立算法意义。
实验结果
研究问题
- RQ1在不存在无限塔的前提下,由NFA表示的两个正则语言之间,最大有限交替塔的高度可能是多少?
- RQ2此类塔的高度如何随状态数和字母表大小变化?
- RQ3即使对于最小化的确定性有限自动机(DFA),是否也能实现塔高度的指数下界?
- RQ4判断两个不相交的正则语言之间是否存在无限前缀塔的计算复杂性是什么?
- RQ5有限塔的结构与计算分段可测试分离器的效率之间是否存在关联?
主要发现
- 最大有限塔高度的上界在状态数上为多项式,但在字母表大小上为指数,具体为字母表大小作为指数的多项式。
- 为二元正则语言建立了紧致的指数下界 2^|Σ|,最多相差一个线性因子,表明该界近乎最优。
- 两个不相交正则语言之间存在无限前缀塔的判定问题,对NFA和最小DFA均为NL-完全。
- 通过前缀序列实现的指数塔高度下界构造表明,基于前缀的塔是复杂性的关键来源。
- 本文确认,基于塔高度的分段可测试分离器计算算法,在最坏情况下必须处理的正则语言数量至少随字母表大小呈指数增长。
- 结果表明,分离器计算的复杂性本质上与有限塔的高度相关,且即使在小字母表下,该高度也可能呈指数级增长。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。