[论文解读] A Formal Proof of R(4,5)=25
本论文使用 HOL4 交互式定理证明器,首次对拉姆齐数 R(4,5) = 25 提供了形式化证明,通过将拼接问题编码为 SAT 实例,并利用 HOL4 与 MiniSat 的接口,验证了 McKay 和 Radziszowski 在 1995 年证明中的计算核心。关键贡献在于一个经过验证的泛化算法,以及一种用于选择 SAT 友好图抽象的启发式方法,从而降低了证明复杂度,并通过 HOL4 的小内核确保了信任度。
In 1995, McKay and Radziszowski proved that the Ramsey number R(4,5) is equal to 25. Their proof relies on a combination of high-level arguments and computational steps. The authors have performed the computational parts of the proof with different implementations in order to reduce the possibility of an error in their programs. In this work, we prove this theorem in the interactive theorem prover HOL4 limiting the uncertainty to the small HOL4 kernel. Instead of verifying their algorithms directly, we rely on the HOL4 interface to MiniSat to prove gluing lemmas. To reduce the number of such lemmas and thus make the computational part of the proof feasible, we implement a generalization algorithm. We verify that its output covers all the possible cases by implementing a custom SAT-solver extended with a graph isomorphism checker.
研究动机与目标
- 使用可信的交互式定理证明器,对 R(4,5) = 25 证明的计算核心进行形式化验证。
- 通过 HOL4 与 MiniSat 的接口,减少对未经验证的自定义 SAT 求解器的依赖。
- 开发一个经过验证的泛化算法,将同构图分组以最小化拼接问题的数量。
- 设计并验证一种启发式方法,用于预测 SAT 求解器的运行时间,指导选择更简单的拼接问题实例。
- 证明利用现代定理证明器基础设施,对大规模组合证明进行形式化是可行的。
提出的方法
- 将拉姆齐拼接问题编码为命题逻辑公式,并通过 HOL4 接口调用 MiniSat 进行不可满足性证明。
- 实现一个带有图同构检查的自定义 SAT 求解器扩展,以验证泛化的完备性。
- 使用一种泛化算法,将同构的 R(3,5,d) 和 R(4,4,24−d) 图分组为抽象表示,以减少情况爆炸。
- 应用一种简化启发式方法,估算 SAT 求解器的运行时间,并指导选择能产生更简单拼接问题的泛化。
- 利用 HOL4 内核验证所有逻辑步骤,仅信任内核和 MiniSat 接口。
- 通过理论图加载器验证证明结构,检查依赖关系并确保 828,857 个祖先理论之间的逻辑一致性。
实验结果
研究问题
- RQ1R(4,5)=25 证明的计算部分能否通过可信的交互式定理证明器实现形式化验证?
- RQ2如何构建并验证图泛化,以覆盖所有同构类,同时最小化拼接问题的数量?
- RQ3能否开发一种启发式方法,用于预测 SAT 求解器在拼接问题上的性能,并指导选择更简单的实例?
- RQ4在形式化证明系统中,能否通过可信接口用标准求解器替代自定义 SAT 求解器?
- RQ5能否通过抽象化与对称性约简技术,实现大规模组合证明形式化的可扩展性?
主要发现
- R(4,5) = 25 的形式化证明在 HOL4 中成功完成,整个计算链均通过可信内核进行了验证。
- 作者通过构建并形式化一个 R(4,5,24)-图,验证了 R(4,5) > 24,与 Kalbfleisch 在 1965 年的构造一致。
- 实现了并验证了一种泛化算法,通过将同构图分组,显著减少了拼接问题的数量。
- 基于预测的 SAT 求解器运行时间选择泛化的启发式方法显著提升了性能,避免了难以处理的情况。
- 通过包含 828,857 个祖先理论的完整理论图,验证了证明结构,确保了逻辑一致性和依赖完整性。
- 该形式化证明表明,即使面对 PB 级别的 DRAT 证明文件,大型组合证明也能在 HOL4 中实现端到端的形式化验证。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。