[論文レビュー] Schur Number Five.
この論文はシュール数5を解き、a + b = c の単色解を含まないような正の整数 1 から n までを 5 色に塗り分けることができる最大の n が n = 160 であることを証明した。この解決は、問題を命題論理に符号化し、大規模並列充足可能性ソルバーを用いて達成された。2 ペタバイトの証明は形式的検証により正しさが保証された。
We present the solution of a century-old problem known as Schur Number Five: What is the largest (natural) number $n$ such that there exists a five-coloring of the positive numbers up to $n$ without a monochromatic solution of the equation $a + b = c$? We obtained the solution, $n = 160$, by encoding the problem into propositional logic and applying massively parallel satisfiability solving techniques on the resulting formula. We constructed and validated a proof of the solution to increase trust in the correctness of the multi-CPU-year computations. The proof is two petabytes in size and was certified using a formally verified proof checker, demonstrating that any result by satisfiability solvers---no matter how large---can now be validated using highly trustworthy systems.
研究の動機と目的
- 集合 {1, 2, ..., n} が a + b = c の単色解を含まない 5 色塗り分けを許容するような最大の整数 n を特定すること。
- 計算的手法を用いて長年の未解決問題であるラマヌジャン理論における問題を解くこと。
- 形式的検証された証明検証ツールを用いて大規模 SAT 解法の結果の正しさを検証すること。
- 大規模計算証明を高信頼性で検証する手法の実現可能性を示すこと。
提案手法
- シュール数問題を、標準形(CNF)の命題論理式に符号化すること。
- 大規模並列 SAT ソルバーを用いて、有効な 5 色塗り分けに対応する充足割り当てを探索すること。
- n = 160 を超えるすべての式について充足不能性の証明を構築すること。
- 充足不能性の結果を記録するため、2 ペタバイトの証明ファイルを生成すること。
- 証明を形式的検証された証明検証ツールで検証し、正しさを保証すること。
- 数千の CPU コアを活用した分散計算により、計算の複雑性に対処すること。
実験結果
リサーチクエスチョン
- RQ1a + b = c の単色解を含まない {1, ..., n} の 5 色塗り分けが可能な n の最大値は何か?
- RQ2SAT 解法と証明ログを用いてシュール数5の解を計算および検証できるか?
- RQ32 ペタバイトの大きさの充足不能性証明を生成し、形式的検証することは可能か?
- RQ4大規模 SAT ソルバーの結果に対して、極めて信頼性の高い証明検証が可能か?
主な発見
- 5 色におけるシュール数は正確に 160 であり、{1, ..., 161} のいかなる 5 色塗り分けも a + b = c の単色解を含む。
- n = 161 の場合の論理式の充足不能性を記録するため、2 ペタバイトの証明が生成された。
- 機械的検証による正しさ保証を備えた証明検証ツールを用いて、証明が形式的検証された。
- 計算には 100 万時間以上の CPU 時間が要され、数千のコアにわたる分散処理が行われた。
- 形式的検証により SAT ソルバーの出力の正しさが確認され、ハードウェアやソフトウェアスタックへの信頼性の必要がなくなった。
- 数学および論理学分野における大規模計算結果の検証の新しい基準を確立した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。