QUICK REVIEW

[论文解读] ToolACE-MCP: Generalizing History-Aware Routing from MCP Tools to the Agent Web

Zhiyuan Yao, Zishan Xu|arXiv (Cornell University)|Jan 13, 2026

Graph Theory and Algorithms被引用 0

一句话总结

ToolACE-MCP 训练一个具备历史感知的路由器，以在大型 MCP 工具空间中导航并泛化到代理路由，在 MCP 基准中实现强劲性能和鲁棒性。

ABSTRACT

With the rise of the Agent Web and Model Context Protocol (MCP), the agent ecosystem is evolving into an open collaborative network, exponentially increasing accessible tools. However, current architectures face severe scalability and generality bottlenecks. To address this, we propose ToolACE-MCP, a pipeline for training history-aware routers to empower precise navigation in large-scale ecosystems. By leveraging a dependency-rich candidate Graph to synthesize multi-turn trajectories, we effectively train routers with dynamic context understanding to create the plug-and-play Light Routing Agent. Experiments on the real-world benchmarks MCP-Universe and MCP-Mark demonstrate superior performance. Notably, ToolACE-MCP exhibits critical properties for the future Agent Web: it not only generalizes to multi-agent collaboration with minimal adaptation but also maintains exceptional robustness against noise and scales effectively to massive candidate spaces. These findings provide a strong empirical foundation for universal orchestration in open-ended ecosystems.

研究动机与目标

实现可扩展、可泛化的开放 Agent Web 生态系统中路由的动机，涉及数以百万计的 MCP 工具和代理。
开发一个利用多轮交互上下文而非静态匹配的具历史感知的路由器。
创建一个即插即用的轻量路由代理，将路由与执行集成到多样化体系结构中。
demonstrated robustness to noise and scalability to large candidate spaces.
Show cross-domain transferability from tool routing to agent routing without extensive retraining.

提出的方法

通过对候选规格进行编码并通过余弦相似度将语义相似的候选项连接，构建一个候选图。
应用自我进化变异以生成新的候选变体，并通过变异关系扩展图。
通过在图上进行随机游走采样并模拟多智能体交互来进行轨迹综合，以创建历史丰富的监督信号。
在给定查询 Q 和历史 H 的情况下，利用来自综合轨迹的监督信号训练一个历史感知的路由器，以从候选空间 C 中预测最佳候选 c。
引入轻量路由代理，作为训练路由器的最小包装器，将路由与执行工具解耦，实现即插即用的集成。
在 MCP-Universe 和 MCP-Mark 基准上进行评估，并测试跨域迁移到代理路由的 Agent Bank 基准。

实验结果

研究问题

RQ1一个在合成的、图扩展的候选空间上训练的历史感知路由器，是否能在 MCP 时代的基准中超越无状态嵌入检索和单元工具选择？
RQ2自我进化变异与基于轨迹的监督是否能提升对语义上相似的工具和代理之间的判别能力？
RQ3一个轻量级路由代理是否能将工具来源的路由决策泛化到开放生态系统中的代理级编排？
RQ4路由器对噪声和 Agent Web 常见的大规模候选空间有多鲁棒？
RQ5纳入交互历史对路由准确性和故障恢复的影响是什么？

主要发现

路由器在 MCP-Universe 和 MCP-Mark 基准上持续优于基于嵌入的和 ReAct 基线。
一个 80 亿参数的专业路由器可以在工具路由任务中超越大型通用模型（如 GPT-4o、Gemini-2.5-Pro）。
具历史感知的路由在对历史不敏感的基线上提供显著收益（例如 MCP-Universe 从 48% 提升至 53%）。
ToolACE-MCP 在扩展到更大候选空间、面对嘈杂或被变异的工具集时保持较高的准确性。
该方法可以从工具路由泛化到代理路由，在 Agent Route 基准中达到高准确度（91.6%）。
轻量路由代理实现了一个轻量级、可插拔的集成，在推理时不需要注入大量工具描述就能维持性能。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。