Skip to main content
QUICK REVIEW

[論文レビュー] A New Paradigm for Minimax Search

Jonathan Schaeffer, Wim Pijls|arXiv (Cornell University)|Jan 1, 1994
Artificial Intelligence in Games参考文献 26被引用数 23
ひとこと要約

本稿では、反復深化とメモリ強化を活用することで、探索効率を顕著に向上させる新しいミニマックス探索パラダイム、MTD(f) を導入する。MT 手続きを再定義することで、従来のアルファベータ法や SSS* アルゴリズムを上回る性能を達成し、チェッカーズ、オセロ、チェスの全ゲームにおいて、葉ノードの展開数を20%以上削減し、最良のアルファベータ実装を葉ノード数、全ノード数、実行時間のすべての面で上回る。

ABSTRACT

textabstractThis paper introduces a new paradigm for minimax game-tree search algorithms. MT is a memory-enhanced version of Pearl's Test procedure. By changing the way MT is called, a number of best-first game-tree search algorithms can be simply and elegantly constructed (including SSS*). Most of the assessments of minimax search algorithms have been based on simulations. However, these simulations generally do not address two of the key ingredients of high performance game-playing programs: iterative deepening and memory usage. This paper presents experimental data from three game-playing programs (checkers, Othello and chess), covering the range from low to high branching factor. The improved move ordering due to iterative deepening and memory usage results in significantly different results from those portrayed in the literature. Whereas some simulations show alpha-beta expanding almost 100% more leaf nodes than other algorithms [Marsland, Reinefeld & Schaeffer, 1987], our results showed variations of less than 20%. One new instance of our framework MTD(f) out-performs our best alpha-beta searcher (aspiration NegaScout) on leaf nodes, total nodes and execution time. To our knowledge, these are the first reported results that compare both depth-first and best-first algorithms given the same amount of memory.

研究の動機と目的

  • ゲームツリー探索における反復深化とメモリ使用量といった重要な性能要因を無視した従来のシミュレーションのギャップを埋める。
  • 記憶強化された MT 手続きを用いることで、SSS* を含む最良優先探索アルゴリズムを洗練された形で構築できる統一的フレームワークの構築。
  • 反復深化とメモリ使用の探索効率への影響を、シミュレーション結果にとどまらず実際のプログラムで実証的に評価すること。
  • 同じメモリ制約下で深さ優先探索(アルファベータ法)と最良優先探索(SSS*)を比較すること。これは、これまで報告されていなかった比較である。
  • 本フレームワークの新規インスタンスである MTD(f) が、実際の応用において、最良のアルファベータ実装でさえも上回ることを示すこと。

提案手法

  • 記憶強化された MT 手続きを再定義することで導出される新しいミニマックス探索アルゴリズム、MTD(f) を提案する。
  • 反復深化を用いることで、手の順序付けを改善し、メモリによる探索空間の刈り減らし効果を高める。
  • ペイジのテスト手順(MT)の記憶強化版を用い、ゲームツリーの値の境界を保存・再利用する。
  • MT の呼び出し方を変えることで、SSS* などの最良優先探索アルゴリズムを構築し、統一的フレームワークを実現する。
  • 以前に保存された境界に基づいて、選択的な再計算を伴う深さ優先探索構造を採用する。
  • 分岐係数が低いものから高いものまでカバーする3つのゲーム(チェッカーズ、オセロ、チェス)で性能を評価する。

実験結果

リサーチクエスチョン

  • RQ1反復深化とメモリ使用の導入が、ミニマックス探索アルゴリズムの相対的性能にどのように影響するか。
  • RQ2ノード展開比に関するシミュレーション結果が、実際のゲームプログラムに一般化できる範囲はどの程度か。
  • RQ3MT の呼び出しに基づく統一的フレームワークによって、効率的な最良優先探索アルゴリズム(SSS* を含む)を構築できるか。
  • RQ4MTD(f) が、葉ノード数、全ノード数、実行時間のすべての面で、最良のアルファベータ実装を上回るか。
  • RQ5同じメモリ制約下で、深さ優先探索と最良優先探索の実際の性能差はどの程度か。

主な発見

  • MTD(f) は、すべての3つの指標(葉ノード数、全ノード数、実行時間)において、最良のアルファベータ探索者(アスピレーション NegaScout)を上回る。
  • 実プログラムでは、アルゴリズム間の葉ノード数のばらつきが20%未満に抑えられ、過去のシミュレーションで報告された最大100%の差異とは対照的である。
  • 反復深化による手の順序付けの向上が、メモリを固定した状態でも、探索ノード数の大幅な削減に寄与する。
  • 本稿は、同じメモリ制約下で深さ優先探索と最良優先探索を比較した、初めての実証的比較を提示する。
  • 結果から、メモリ使用量と反復深化が、シミュレーション評価でしばしば無視されがちな重要な要因であることが明らかになった。
  • SSS* やその他の最良優先探索アルゴリズムは、異なる MT 呼び出し戦略を用いることで、提示されたフレームワーク内で洗練されて構築可能である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。