Skip to main content
QUICK REVIEW

[論文レビュー] Beyond the Node: Clade-level Selection for Efficient MCTS in Automatic Heuristic Design

Kezhao Lai, Yutao Lai|arXiv (Cornell University)|Jan 31, 2026
Advanced Multi-Objective Optimization Algorithms被引用数 0
ひとこと要約

Clade-AHD はノードレベルの点推定を系統クレードレベルのベイズ信念と Thompson Sampling に置き換え、自動ヒューリスティック設計の MCTS を導くことで、複雑な組み合わせ問題に対して計算コストを抑えつつ性能を向上させます。

ABSTRACT

While Monte Carlo Tree Search (MCTS) shows promise in Large Language Model (LLM) based Automatic Heuristic Design (AHD), it suffers from a critical over-exploitation tendency under the limited computational budgets required for heuristic evaluation. To address this limitation, we propose Clade-AHD, an efficient framework that replaces node-level point estimates with clade-level Bayesian beliefs. By aggregating descendant evaluations into Beta distributions and performing Thompson Sampling over these beliefs, Clade-AHD explicitly models uncertainty to guide exploration, enabling more reliable decision-making under sparse and noisy evaluations. Extensive experiments on complex combinatorial optimization problems demonstrate that Clade-AHD consistently outperforms state-of-the-art methods while significantly reducing computational cost. The source code is publicly available at: https://github.com/Mriya0306/Clade-AHD.

研究の動機と目的

  • sparse 評価予算下の MCTS における過剰探索の動機づけと対処(LLM 主導の AHD で)
  • ノードレベルの値ではなく、クレードレベルの潜在力をモデル化する階層的ベイズ近似の導入
  • 深さ減衰付きクレード認定割り当てによるクレード意識の信念更新機構の開発
  • 探索-利用のバランスを取る予算認識型アニーリングを備えたクレードレベル Thompson Sampling 方針の提案
  • サブ最適なクレードを剪定し資源を効率的に配分する Dynamic Clade Freezing の実装

提案手法

  • 探索木における祖先とそのすべての子孫をクレードとして定義する
  • クレード潜在力をBeta分布としてモデル化し、深さ減衰を伴ってボトムアップで証拠を伝搬する
  • 子孫の証拠をクレード意識の信念更新で集約し、クレードレベルの α と β パラメータを算出する
  • クレードレベル Thompson Sampling を温度ベースの予算アニーリングと併用して展開するクレードを選択する
  • 最小訪問回数とギャップ基準に基づいてサブ最適クレードを剪定する Dynamic Clade Freezing を使用する

実験結果

リサーチクエスチョン

  • RQ1 sparse 評価下での探索-利用バランスを改善するクレードレベルのベイズ信念は AHD の MCTS に有効か?
  • RQ2クレードレベルでのボトムアップ証拠集約はノード中心法と比較して推定分散を低減するか?
  • RQ3予算認識型 Thompson Sampling はクレード-AHD の探索ダイナミクスと収束にどう影響するか?
  • RQ4Dynamic Clade Freezing は資源配分と性能にどのような効果をもたらすか?

主な発見

  • Clade-AHD は複雑な組み合わせ問題において最先端手法より一貫して性能を改善する。
  • 階層的クレード信念のモデリングは sparse な観測下で推定分散を低減する。
  • 予算認識型アニーリングを伴うクレードレベル Thompson Sampling は予算の進行に合わせて探索と利用を効果的にバランスさせる。
  • Dynamic Clade Freezing は高潜在力クレードへ計算を集中させ、サブ最適な分岐を剪定する。
  • アブレーション研究は、Dynamic Freezing、温度アニーリング、深さ減衰付き逆伝播、疑似評価、適応正規化といった要素の重要性を確認する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。