Skip to main content
QUICK REVIEW

[논문 리뷰] ToolACE-MCP: Generalizing History-Aware Routing from MCP Tools to the Agent Web

Zhiyuan Yao, Zishan Xu|arXiv (Cornell University)|2026. 01. 13.
Graph Theory and Algorithms인용 수 0
한 줄 요약

ToolACE-MCP는 히스토리 인식 라우터를 학습시켜 대형 MCP 도구 공간을 탐색하고 에이전트 라우팅으로 일반화하며, MCP 벤치마크에서 강력한 성능과 강건함을 달성합니다.

ABSTRACT

With the rise of the Agent Web and Model Context Protocol (MCP), the agent ecosystem is evolving into an open collaborative network, exponentially increasing accessible tools. However, current architectures face severe scalability and generality bottlenecks. To address this, we propose ToolACE-MCP, a pipeline for training history-aware routers to empower precise navigation in large-scale ecosystems. By leveraging a dependency-rich candidate Graph to synthesize multi-turn trajectories, we effectively train routers with dynamic context understanding to create the plug-and-play Light Routing Agent. Experiments on the real-world benchmarks MCP-Universe and MCP-Mark demonstrate superior performance. Notably, ToolACE-MCP exhibits critical properties for the future Agent Web: it not only generalizes to multi-agent collaboration with minimal adaptation but also maintains exceptional robustness against noise and scales effectively to massive candidate spaces. These findings provide a strong empirical foundation for universal orchestration in open-ended ecosystems.

연구 동기 및 목표

  • 수백만 MCP 도구와 에이전트가 있는 오픈 Agent Web 생태계에서 확장 가능하고 일반화 가능한 라우팅을 가능하게 하는 동기.
  • 정적 매칭이 아니라 다회 대화 맥락을 활용하는 히스토리 인식 라우터를 개발한다.
  • 다양한 아키텍처에서 라우팅과 실행을 플러그 앤 플레이로 통합하는 경량 라우팅 에이전트를 만든다.
  • 노이즈에 대한 강건성과 대규모 후보 공간에 대한 확장성을 입증한다.
  • 도구 라우팅에서 에이전트 라우팅으로의 교차 도메인 전이 가능성을 광범위한 재학습 없이 보여준다.

제안 방법

  • 후보 사양을 인코딩하고 코사인 유사도를 통해 시맨틱하게 유사한 것을 연결하여 후보 그래프를 구성한다.
  • Self-Evolutionary Mutation을 적용하여 새로운 후보 변형을 생성하고 돌연변이 관계로 그래프를 확장한다.
  • 그래프에서 무작위 보행 샘플링을 통해 궤적 합성을 수행하고 다중 에이전트 상호 작용을 시뮬레이션하여 히스토리 풍부한 감독 신호를 생성한다.
  • 합성된 궤적에서 파생된 감독 신호를 사용하여 질의 Q와 히스토리 H가 주어졌을 때 후보 공간 C에서 최적의 후보 c를 예측하도록 학습된 히스토리 인식 라우터를 감독 신호로 학습한다.
  • 훈련된 라우터를 잘 연결해 주는 최소한의 래퍼로서 경량 라우팅 에이전트를 도입하여 라우팅과 실행 도구를 분리하고 플러그 앤 플레이 통합을 가능하게 한다.
  • MCP-Universe와 MCP-Mark 벤치마크에서 평가하고, Agent Bank 벤치마크로 에이전트 라우팅으로의 일반화도 테스트한다.

실험 결과

연구 질문

  • RQ1히스토리 인식 라우터가 합성된 그래프 확장 후보 공간에서 학습되었을 때, MCP 시대 벤치마크에서 무상태 임베딩 검색 및 단일 도구 선택을 능가하는가?
  • RQ2자체 진화적 돌연변이와 궤적 기반 감독이 시맨틱하게 유사한 도구와 에이전트 간의 식별력을 향상시키는가?
  • RQ3경량 라우팅 에이전트가 도구 원산지에서 에이전트 수준의 오케스트레이션으로 라우팅 결정을 일반화할 수 있는가?
  • RQ4에이전트 웹에서 흔히 보이는 대규모 후보 공간과 노이즈에 대해 라우터의 강건성은 어느 정도인가?
  • RQ5상호 작용 기록의 포함이 라우팅 정확도 및 실패 복구에 미치는 영향은 무엇인가?

주요 결과

  • 라우터는 MCP-Universe 및 MCP-Mark 벤치마크에서 일관되게 임베딩 기반 및 ReAct 기반 베이스라인을 능가한다.
  • 8B 파라미터의 특수화된 라우터가 도구 라우팅 작업에서 대형 일반 모델(GPT-4o, Gemini-2.5-Pro 등)을 능가할 수 있다.
  • 히스토리 인식 라우팅은 히스토리 비적용 베이스라인 대비 상당한 이점을 제공한다(예: MCP-Universe에서 48%에서 53%로 증가).
  • ToolACE-MCP는 더 큰 후보 공간으로 스케일링하고 노이즈가 있거나 변형된 도구 세트에 직면해도 높은 정확성을 유지한다.
  • 이 접근법은 도구 라우팅에서 에이전트 라우팅으로의 일반화를 달성하여 Agent Route Benchmark에서 높은 정확도(91.6%)를 기록한다.
  • 경량 라우팅 에이전트는 추론 시 대형 도구 설명을 인젝션하지 않고도 성능을 유지하는 경량, 플러그 앤 플레이 통합을 가능하게 한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.