Skip to main content
QUICK REVIEW

[論文レビュー] GamePad: A Learning Environment for Theorem Proving

Daniel Huang, Prafulla Dhariwal|arXiv (Cornell University)|Jun 2, 2018
Logic, programming, and type systems参考文献 14被引用数 34
ひとこと要約

GamePad は、機械学習モデルのトレーニングを目的とした、Coq 証明の構造的で機械可読な表現を抽出する Python ベースのフレームワークである。人間が作成した形式的証明を用いて、戦略予測および位置評価タスクを実行可能であり、玩具的な代数的リライト問題および Feit-Thompson 定理の形式化において、ベースラインモデルを用いた実現可能性を示している。

ABSTRACT

In this paper, we introduce a system called GamePad that can be used to explore the application of machine learning methods to theorem proving in the Coq proof assistant. Interactive theorem provers such as Coq enable users to construct machine-checkable proofs in a step-by-step manner. Hence, they provide an opportunity to explore theorem proving with human supervision. We use GamePad to synthesize proofs for a simple algebraic rewrite problem and train baseline models for a formalization of the Feit-Thompson theorem. We address position evaluation (i.e., predict the number of proof steps left) and tactic prediction (i.e., predict the next proof step) tasks, which arise naturally in tactic-based theorem proving.

研究の動機と目的

  • 機械学習応用のための、Coq 証明の構造的で学習可能な表現を提供するシステムを構築すること。
  • 証明の構造と意味的コンテンツを保持したまま、人間が監視した形式的証明から学習できるようにすること。
  • 戦略予測や位置評価といった、主な定理証明タスクを、実世界および合成された証明データを用いてサポートすること。
  • 形式的証明の上での機械学習モデルのトレーニングと評価を再利用可能でオープンソースのプラットフォームとして提供すること。
  • 人間が作成した証明を用いた、インタラクティブ定理証明におけるエンドツーエンド学習の実現可能性を検討すること。

提案手法

  • GamePad は Coq から、コンテキスト、ゴール、戦略、AST などを含む、完全な証明状態のシーケンスを抽出し、構造的データ表現を可能にする。
  • 動的証明構築を支援する軽量な Coq へのインターフェースを提供し、強化学習およびインタラクティブなモデルトレーニングを可能にする。
  • 項および証明コンテキストの構造的表現を用いて、証明状態を ℝᴰ に埋め込むことをサポートする。
  • Feit-Thompson 形式化および合成された代数的リライト問題からの証明トレースを用いて、戦略予測および位置評価のためのベースラインモデルをトレーニングした。
  • 証明木上の状態追跡と証明スクリプト合成を通じて、モデルの評価をフレームワークが可能にする。
  • すべてのデータ、モデル、コードは GitHub でオープンソースとして公開され、再現性および拡張性を確保している。

実験結果

リサーチクエスチョン

  • RQ1人間が作成した Coq 証明の構造的表現は、戦略予測のための有効な機械学習を可能にするか?
  • RQ2位置評価モデルは、証明状態の埋め込みから、残りの証明ステップ数を正確に予測できるか?
  • RQ3人間が監視したデータを用いた実世界の形式化(例:Feit-Thompson 定理)において、ベースラインモデルの性能はいかほどか?
  • RQ4合成された手作業の代数的リライト問題は、学習済みモデルを用いた証明合成のためのテストベッドとしてどの程度有効か?
  • RQ5GamePad フレームワークは、インタラクティブ定理証明におけるエンドツーエンドトレーニングおよびモンテカルロツリーサーチをサポートできるか?

主な発見

  • GamePad は、証明状態、戦略、AST を含む Coq 証明トレースを効果的に抽出・構造化し、下流の機械学習タスクを可能にした。
  • 合成された代数的リライト問題および Feit-Thompson 形式化の両方において、戦略予測および位置評価のためのベースラインモデルをトレーニングおよび評価した。
  • 訓練済みの戦略予測モデルを用いた証明スクリプト合成が可能であり、学習ベースの証明構築の実現可能性を示した。
  • Feit-Thompson 形式化は、インタラクティブ定理証明における機械学習モデルのトレーニングと評価のための豊富な実世界データセットを提供している。
  • 構造的表現は、項構文と暗黙の引数アノテーションを保持することで、意味的認識に基づくモデリングを可能にする。
  • GamePad、データセット、モデルのオープンソース公開により、形式的証明学習分野における再現性と将来のベンチマークが可能になった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。