QUICK REVIEW

[論文レビュー] ToolACE-MCP: Generalizing History-Aware Routing from MCP Tools to the Agent Web

Zhiyuan Yao, Zishan Xu|arXiv (Cornell University)|Jan 13, 2026

Graph Theory and Algorithms被引用数 0

ひとこと要約

ToolACE-MCP は history-aware なルータを訓練し、巨大な MCP ツール空間をナビゲートし、エージェントルーティングへ一般化することで、MCP ベンチマークにおいて強力な性能とロバスト性を発揮する。

ABSTRACT

With the rise of the Agent Web and Model Context Protocol (MCP), the agent ecosystem is evolving into an open collaborative network, exponentially increasing accessible tools. However, current architectures face severe scalability and generality bottlenecks. To address this, we propose ToolACE-MCP, a pipeline for training history-aware routers to empower precise navigation in large-scale ecosystems. By leveraging a dependency-rich candidate Graph to synthesize multi-turn trajectories, we effectively train routers with dynamic context understanding to create the plug-and-play Light Routing Agent. Experiments on the real-world benchmarks MCP-Universe and MCP-Mark demonstrate superior performance. Notably, ToolACE-MCP exhibits critical properties for the future Agent Web: it not only generalizes to multi-agent collaboration with minimal adaptation but also maintains exceptional robustness against noise and scales effectively to massive candidate spaces. These findings provide a strong empirical foundation for universal orchestration in open-ended ecosystems.

研究の動機と目的

Millions of MCP ツールとエージェントを備えたオープンな Agent Web エコシステムにおけるスケーラブルで一般化可能なルーティングを実現する動機。
静的マッチングではなく多ターンの対話コンテキストを活用した history-aware ルータの開発。
様々なアーキテクチャでのルーティングと実行を統合するプラグアンドプレイ式の Light Routing Agent の作成。
ノイズへの堅牢性と大規模な候補空間へのスケーラビリティを示す。
ツールルーティングからエージェントルーティングへのクロスドメイン移行性を大規模再訓練なしで示す。

提案手法

候補仕様をエンコードし、コサイン類似性で意味的に類似したものをリンクして候補グラフを構築する。
自己進化変異を適用して新しい候補バリアントを生成し、変異関係でグラフを拡張する。
グラフ上でのランダムウォークサンプリングと複数エージェント対話のシミュレーションによって history-rich な supervision signals を作成する。
合成された軌跡から導出された監督信号を用いて、クエリ Q と history H が与えられた場合に候補空間 C から最適な候補 c を予測する history-aware ルータを訓練する。
訓練済みルータをラップする最小限のライトルーティングエージェントを導入し、ルーティングと実行ツールを分離してプラグアンドプレイ統合を実現する。
MCP-Universe と MCP-Mark のベンチマークで評価し、Agent Bank ベンチマークでエージェントルーティングへの一般化を試す。

実験結果

リサーチクエスチョン

RQ1合成されたグラフ拡張候補空間で訓練された history-aware ルータは、MCP 時代のベンチマークにおいて stateless 埋め込み検索やモノリシックなツール選択より優れているか。
RQ2自己進化変異と軌跡ベースの監督は、意味的に類似したツールやエージェント間の識別性を改善するか。
RQ3ライトルーティングエージェントは、ツール由来のルーティング決定をオープンエンドのエコシステムにおけるエージェントレベルのオーケストレーションへ一般化できるか。
RQ4エージェントWeb特有の大規模な候補空間やノイズに対してルータはどれほど堅牢か。
RQ5相互作用履歴を含めることがルーティング精度と障害回復に与える影響は何か。

主な発見

ルータは MCP-Universe および MCP-Mark ベンチマークで埋め込みベースおよび ReAct ベースラインを一貫して上回る。
8B パラメータの専門ルータが大規模な汎用モデル（例：GPT-4o、Gemini-2.5-Pro）をツールルーティングタスクで上回ることがある。
history-aware ルーティングは history-agnostic なベースラインに対して大きな利得を提供（例：MCP-Universe が 48% から 53% へ）。
ToolACE-MCP はより大きな候補空間へスケールしても、ノイズのあるツールセットや変異ツールにも高い精度を維持する。
ツールルーティングからエージェントルーティングへの一般化が進み、Agent Route Benchmark（91.6%）で高精度を達成。
ライトルーティングエージェントは推論時に大規模なツール記述を挟まず、軽量でプラグアンドプレイ統合を可能にする。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。