[论文解读] Schur Number Five.
该论文解决了五色Schur数问题,证明了最大的数n为160,即当正整数1至n可被5种颜色着色且不存在a + b = c的单色解时,n的最大值为160。该解通过将问题编码为命题逻辑,并利用大规模并行可满足性求解实现,生成了一个2PB的证明文件,并通过形式化验证确保其正确性。
We present the solution of a century-old problem known as Schur Number Five: What is the largest (natural) number $n$ such that there exists a five-coloring of the positive numbers up to $n$ without a monochromatic solution of the equation $a + b = c$? We obtained the solution, $n = 160$, by encoding the problem into propositional logic and applying massively parallel satisfiability solving techniques on the resulting formula. We constructed and validated a proof of the solution to increase trust in the correctness of the multi-CPU-year computations. The proof is two petabytes in size and was certified using a formally verified proof checker, demonstrating that any result by satisfiability solvers---no matter how large---can now be validated using highly trustworthy systems.
研究动机与目标
- 确定最大的整数n,使得集合{1, 2, ..., n}可进行5着色,且不存在a + b = c的单色解。
- 通过计算方法解决Ramsey理论中长期悬而未决的问题。
- 使用形式化验证的证明检查器,验证大规模SAT求解结果的正确性。
- 展示使用高可信度形式化验证工具验证大规模计算证明的可行性。
提出的方法
- 将Schur数问题编码为合取范式(CNF)形式的命题逻辑公式。
- 使用大规模并行SAT求解器,搜索对应于有效5着色的满足赋值。
- 为所有超过n = 160的公式构造不可满足性证明。
- 生成一个2PB的证明文件,以记录不可满足性结果。
- 使用形式化验证的证明检查器验证该证明,以确保其正确性。
- 利用数千个CPU核心的分布式计算,处理计算复杂性。
实验结果
研究问题
- RQ1对于{1, ..., n}的5着色,避免出现a + b = c的单色解时,n的最大值是多少?
- RQ2是否能够通过SAT求解与证明日志计算并验证五色Schur数问题的解?
- RQ3生成并形式化验证一个大小为2PB的不可满足性证明是否可行?
- RQ4是否能够对大规模SAT求解器的结果实现高度可信的证明验证?
主要发现
- 五色Schur数恰好为160,意味着{1, ..., 161}的任意5着色都无法避免出现a + b = c的单色解。
- 为n = 161的公式生成了一个2PB的证明文件,以记录其不可满足性。
- 使用具有机器可检查正确性保证的形式化验证证明检查器,对证明进行了形式化验证。
- 该计算耗时超过一百万CPU小时,分布在数千个核心上。
- 通过形式化验证确认了SAT求解器输出的正确性,消除了对硬件或软件栈的信任需求。
- 该方法为数学与逻辑领域中大规模计算结果的验证设立了新标准。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。