Skip to main content
QUICK REVIEW

[论文解读] Schur Number Five.

Marijn J. H. Heule|arXiv (Cornell University)|Nov 21, 2017
Logic, Reasoning, and Knowledge被引用 9
一句话总结

该论文解决了五色Schur数问题,证明了最大的数n为160,即当正整数1至n可被5种颜色着色且不存在a + b = c的单色解时,n的最大值为160。该解通过将问题编码为命题逻辑,并利用大规模并行可满足性求解实现,生成了一个2PB的证明文件,并通过形式化验证确保其正确性。

ABSTRACT

We present the solution of a century-old problem known as Schur Number Five: What is the largest (natural) number $n$ such that there exists a five-coloring of the positive numbers up to $n$ without a monochromatic solution of the equation $a + b = c$? We obtained the solution, $n = 160$, by encoding the problem into propositional logic and applying massively parallel satisfiability solving techniques on the resulting formula. We constructed and validated a proof of the solution to increase trust in the correctness of the multi-CPU-year computations. The proof is two petabytes in size and was certified using a formally verified proof checker, demonstrating that any result by satisfiability solvers---no matter how large---can now be validated using highly trustworthy systems.

研究动机与目标

  • 确定最大的整数n,使得集合{1, 2, ..., n}可进行5着色,且不存在a + b = c的单色解。
  • 通过计算方法解决Ramsey理论中长期悬而未决的问题。
  • 使用形式化验证的证明检查器,验证大规模SAT求解结果的正确性。
  • 展示使用高可信度形式化验证工具验证大规模计算证明的可行性。

提出的方法

  • 将Schur数问题编码为合取范式(CNF)形式的命题逻辑公式。
  • 使用大规模并行SAT求解器,搜索对应于有效5着色的满足赋值。
  • 为所有超过n = 160的公式构造不可满足性证明。
  • 生成一个2PB的证明文件,以记录不可满足性结果。
  • 使用形式化验证的证明检查器验证该证明,以确保其正确性。
  • 利用数千个CPU核心的分布式计算,处理计算复杂性。

实验结果

研究问题

  • RQ1对于{1, ..., n}的5着色,避免出现a + b = c的单色解时,n的最大值是多少?
  • RQ2是否能够通过SAT求解与证明日志计算并验证五色Schur数问题的解?
  • RQ3生成并形式化验证一个大小为2PB的不可满足性证明是否可行?
  • RQ4是否能够对大规模SAT求解器的结果实现高度可信的证明验证?

主要发现

  • 五色Schur数恰好为160,意味着{1, ..., 161}的任意5着色都无法避免出现a + b = c的单色解。
  • 为n = 161的公式生成了一个2PB的证明文件,以记录其不可满足性。
  • 使用具有机器可检查正确性保证的形式化验证证明检查器,对证明进行了形式化验证。
  • 该计算耗时超过一百万CPU小时,分布在数千个核心上。
  • 通过形式化验证确认了SAT求解器输出的正确性,消除了对硬件或软件栈的信任需求。
  • 该方法为数学与逻辑领域中大规模计算结果的验证设立了新标准。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。