[论文解读] Optimal Test Sets for Context-Free Languages
本文提出了首个针对任意大小为 n 的上下文无关文法构造大小为 O(n³) 的测试集的算法,填补了此前已知的 O(n⁶) 上限与 O(n³) 下限之间的长期空白。通过利用文法导出图中的最优路径枚举,并应用改进版的 Plandowski 测试集引理,作者实现了紧致的立方级界,证明了在上下文无关语言中,O(n³) 是测试集大小的最优值。
A test set for a formal language (set of strings) L is a subset T of L such that for any two string homomorphisms f and g defined on L, if the restrictions of f and g on T are identical functions, then f and g are identical on the entire L. Previously, it was shown that there are context-free grammars for which smallest test sets are cubic in the size of the grammar, which gives a lower bound on tests set size. Existing upper bounds were higher degree polynomials; we here give the first algorithm to compute test sets of cubic size for all context-free grammars, settling the gap between the upper and lower bound.
研究动机与目标
- 填补上下文无关文法中测试集大小已知的 O(n⁶) 上限与 O(n³) 下限之间的差距。
- 设计一种高效算法,为任意上下文无关文法构造大小为 O(n³) 的测试集。
- 通过为所有上下文无关文法构造该大小的测试集,证明 O(n³) 是紧致的。
- 通过 Lin(G) 变换将构造方法从线性文法推广到任意上下文无关文法。
提出的方法
- 从文法的产生式规则构建一个带标签的图,其中节点为非终结符和终结符,边表示规则。
- 基于长度和字典序定义路径的全序,以识别最优路径。
- 在 O(|N|²|R|) 时间内预计算所有顶点对(非终结符或 ⊥)之间的最优路径。
- 将 Φ₃(G) 定义为形如 P₁e₁P₂…PₙeₙPₙ₊₁(n ≤ 3)的接受路径所对应的单词集合,其中 Pᵢ 为最优路径,而 Pᵢeᵢ 不是。
- 在四字母字母表上应用 Plandowski 的测试集引理,通过反证法证明 Φ₃(G) 是有效的测试集。
- 通过应用 Lin(G) 变换将结果推广到非线性文法,该变换生成一个线性文法,其语言是原文法的测试集。
实验结果
研究问题
- RQ1是否可以为任意上下文无关文法构造大小为 O(n³) 的测试集,以匹配已知的下限?
- RQ2能否将测试集构造的 O(n⁶) 上限改进为与 O(n³) 下限一致?
- RQ3文法图中最优路径的构造是否能导出保持同态等价性的最小测试集?
- RQ4Plandowski 的测试集引理是否可适配以在一般上下文无关文法背景下证明最小性?
- RQ5Lin(G) 变换是否足以将一般情况约化为线性情况,同时保持测试集的性质?
主要发现
- 本文确立了 O(n³) 是上下文无关文法中测试集大小的最紧致可能上界。
- 提出了一种算法,可在 O(|N|·|R|³) 时间内为线性上下文无关文法构造大小为 O(n³) 的测试集。
- 该构造依赖于枚举最多包含三条非最优边的路径,从而确保最小路径的唯一性与正确性。
- 通过在四字母字母表上应用 Plandowski 引理并采用反证法,证明了 Φ₃(G) 是有效的测试集。
- 对于一般上下文无关文法,通过 Lin(G) 变换可将问题约化为线性情况,从而实现相同的 O(n³) 上界。
- 该结果填补了此前已知的 O(n⁶) 上限与 O(n³) 下限之间的差距,证明了 O(n³) 是最优的。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。