[论文解读] A Minimax Algorithm Better than Alpha-Beta? No and Yes
本文通过将SSS*算法重新表述为带有置换表的增强型alpha-beta搜索,证明其等价于带有置换表的alpha-beta搜索。该研究提出MTD(f)这一新型最优优先搜索算法,在固定深度博弈树搜索中,尤其在迭代深化场景下,其性能优于传统极大极小法,实证结果来自锦标赛级游戏程序。
This paper has three main contributions to our understanding of fixed-depth minimax search: (A) A new formulation for Stockman's SSS* algorithm, based on Alpha-Beta, is presented. It solves all the perceived drawbacks of SSS*, finally transforming it into a practical algorithm. In effect, we show that SSS* = alpha-beta + ransposition tables. The crucial step is the realization that transposition tables contain so-called solution trees, structures that are used in best-first search algorithms like SSS*. Having created a practical version, we present performance measurements with tournament game-playing programs for three different minimax games, yielding results that contradict a number of publications. (B) Based on the insights gained in our attempts at understanding SSS*, we present a framework that facilitates the construction of several best-first fixed- depth game-tree search algorithms, known and new. The framework is based on depth-first null-window Alpha-Beta search, enhanced with storage to allow for the refining of previous search results. It focuses attention on the essential differences between algorithms. (C) We present a new instance of the framework, MTD(f). It is well-suited for use with iterative deepening, and performs better than algorithms that are currently used in most state-of-the-art game-playing programs. We provide experimental evidence to explain why MTD(f) performs better than the other fixed-depth minimax algorithms.
研究动机与目标
- 通过使用带有置换表的alpha-beta搜索重新表述SSS*算法,以解决其长期存在的实际局限性。
- 基于深度优先的空窗alpha-beta搜索与结果精炼,构建统一框架,用于构造最优优先的固定深度博弈树搜索算法。
- 提出并评估MTD(f),该框架内的新算法在迭代深化场景下表现出优于现有方法的性能。
- 通过实证结果挑战文献中既有的观点,反驳关于SSS*优于alpha-beta的既定假设。
提出的方法
- 将SSS*重新表述为带有置换表的alpha-beta搜索,证明置换表天然维护了最优优先搜索中使用的解树。
- 以深度优先的空窗alpha-beta搜索为核心引擎,通过存储机制扩展以精炼和更新先前的搜索结果。
- 提出一个框架,通过聚焦于结果精炼与节点排序,抽象出不同最优优先算法之间的关键差异。
- 设计MTD(f)作为该框架内的新算法,利用迭代深化与置换表复用以提升搜索效率。
- 在三种不同的极小极大博弈中,使用锦标赛级游戏程序实现并基准测试MTD(f)及其他算法。
- 不仅将置换表用作记忆化工具,更将其作为结构组件,使深度优先框架具备最优优先行为。
实验结果
研究问题
- RQ1SSS*能否通过基于alpha-beta和置换表的重构实现实际应用?
- RQ2哪些结构与算法组件区分了不同的最优优先固定深度搜索算法?
- RQ3MTD(f)作为所提框架的产物,在真实游戏程序场景中与现有极小极大算法相比性能如何?
- RQ4为何先前关于SSS*优于alpha-beta的断言在现代实现的实证评估中不成立?
- RQ5与其它固定深度算法相比,迭代深化在多大程度上提升了MTD(f)的性能?
主要发现
- SSS*在正确实现下,功能上等价于带有置换表的alpha-beta搜索,解决了其先前不切实际的问题。
- 该框架成功统一并泛化了已知与新型最优优先搜索算法,聚焦于结果精炼与置换表的使用。
- MTD(f)在三种不同游戏的性能基准测试中,持续优于传统alpha-beta及其他固定深度算法。
- MTD(f)的性能优势归因于对置换表的高效利用与迭代深化,实现了更优的走法排序与结果复用。
- 实证结果反驳了既往文献中关于SSS*优于alpha-beta的断言,表明MTD(f)在实践中超越了两者。
- 置换表不仅是优化工具,更是使深度优先框架具备最优优先行为的关键结构组件。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。