[论文解读] E-Cyclist: Implementation of an Efficient Validation of FOLID Cyclic Induction Reasoning
本文提出 E-Cyclist,一种高效多项式时间方法,通过用基于轨迹的多重集排序方法替代标准的指数级 Büchi 自动机补全,实现对 FOLID(一阶逻辑带归纳定义)循环归纳证明的验证。该方法集成于 CYCLIST 推理器中,通过局部 rb-路径分析与增量度量计算,将证明验证时间减少高达 5 倍,成功验证了所有原始证明及部分此前无法检查的证明。
Checking the soundness of cyclic induction reasoning for first-order logic with inductive definitions (FOLID) is decidable but the standard checking method is based on an exponential complement operation for B\"uchi automata. Recently, we introduced a polynomial checking method whose most expensive steps recall the comparisons done with multiset path orderings. We describe the implementation of our method in the Cyclist prover. Referred to as E-Cyclist, it successfully checked all the proofs included in the original distribution of Cyclist. Heuristics have been devised to automatically define, from the analysis of the proof derivations, the trace-based ordering measures that guarantee the soundness property.
研究动机与目标
- 为解决 FOLID 循环归纳证明中可靠性检查的高计算成本问题,该问题依赖于指数级 Büchi 自动机补全。
- 开发一种比 CYCLIST 推理器中标准验证方法更高效的多项式时间替代方案。
- 将新方法集成至 CYCLIST 作为 E-Cyclist,确保与现有证明的向后兼容性,同时提升性能。
- 自动从证明推导中生成基于轨迹的度量排序,消除人工干预。
提出的方法
- 将循环预证明归一化为有向图 P,包含推导树和扩展的归纳函数,包括根-芽(rb)路径。
- 为每个根 r 分配一个多重集度量 M(r),表示其断言中归纳前提原子(IAAs),初始为空。
- 应用算法 1 通过分析来自非单元素强连通分量(SCCs)的 rb-路径,逐步构建 M(r),添加由轨迹关联的 IAAs。
- 使用基于轨迹的多重集扩展序:若在删除非进展轨迹后,b 中剩余的 IAAs 通过进展轨迹严格小于 r 中的 IAAs,则 b 小于 r。
- 应用增量精炼:仅当保持有效性时,才将 IAAs 添加至根度量,并通过伴随节点传播更新以维持一致性。
- 通过检查所有轨迹是否均进展来验证每条 rb-路径,进展点由轨迹中度量的严格递减步骤标记。
实验结果
研究问题
- RQ1是否可采用多项式时间方法替代 FOLID 循环证明验证中的指数级 Büchi 补全,而不会牺牲正确性?
- RQ2如何从证明推导中自动推导出基于轨迹的度量排序以确保有效性?
- RQ3新方法能否验证原始 CYCLIST 发布版本无法验证的循环证明?
- RQ4与标准方法相比,新方法在实际中实现了多大的性能提升?
主要发现
- E-Cyclist 顺利验证了原始 CYCLIST 发布版本中的所有循环证明,包括此前因性能限制而无法检查的证明。
- 与标准的 Büchi 补全方法相比,该方法将证明验证时间减少了高达 5 倍。
- 将 E-Cyclist 集成至 CYCLIST 后,证明构造过程中不再需要调用外部模型检查器,显著降低了开销。
- 改进的度量计算算法支持对 M(r) 值的增量精炼,在保持正确性的同时,使此前不可行的检查成为可能。
- 在 2-Hydra 证明中,所有 rb-路径均在基于轨迹的多重集排序下被验证为进展路径,确认了该证明的正确性。
- 该方法在小型但复杂的证明上表现出良好的可扩展性,且在分离逻辑及其他形式系统中具有良好的扩展潜力。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。