Skip to main content
QUICK REVIEW

[論文レビュー] Rethinking the Value of Multi-Agent Workflow: A Strong Single Agent Baseline

Jiawei Xu, Arief Koesdwiady|arXiv (Cornell University)|Jan 18, 2026
Multi-Agent Systems and Negotiation被引用数 2
ひとこと要約

論文は、単一のLLMエージェントが多ターン会話とKVキャッシュを用いると、同質のマルチエージェントワークフローの性能に匹敵できることを示し、単一エージェントのワークフロー設計を自動化するOneFlowを提案します。

ABSTRACT

Recent advances in LLM-based multi-agent systems (MAS) show that workflows composed of multiple LLM agents with distinct roles, tools, and communication patterns can outperform single-LLM baselines on complex tasks. However, most frameworks are homogeneous, where all agents share the same base LLM and differ only in prompts, tools, and positions in the workflow. This raises the question of whether such workflows can be simulated by a single agent through multi-turn conversations. We investigate this across seven benchmarks spanning coding, mathematics, general question answering, domain-specific reasoning, and real-world planning and tool use. Our results show that a single agent can reach the performance of homogeneous workflows with an efficiency advantage from KV cache reuse, and can even match the performance of an automatically optimized heterogeneous workflow. Building on this finding, we propose extbf{OneFlow}, an algorithm that automatically tailors workflows for single-agent execution, reducing inference costs compared to existing automatic multi-agent design frameworks without trading off accuracy. These results position the single-LLM implementation of multi-agent workflows as a strong baseline for MAS research. We also note that single-LLM methods cannot capture heterogeneous workflows due to the lack of KV cache sharing across different LLMs, highlighting future opportunities in developing extit{truly} heterogeneous multi-agent systems.

研究の動機と目的

  • 同質のマルチエージェントワークフローが単一エージェントの多ターン会話で効果的に近似できるかを検討する。
  • 単一エージェント実行と従来のマルチエージェントセットアップの性能とコストへの影響を定量化する。
  • パフォーマンスとコストを最適化する自動ワークフロ設計フレームワーク(OneFlow)を提案する。
  • 単一エージェントベースの基準と比較した異種マルチエージェントワークフローの限界と潜在的利益を探る。

提案手法

  • LLMベースのマルチエージェントワークフローをエージェント、プロンプト、ツール、ルーティングを含む有向グラフとして形式化する。
  • 単一LLMシミュレータが履歴に基づく決定論的ツール効果とルーティングの下で、同質ワークフローのトランスクリプト分布を再現できることを示す。
  • プレフィルコストを削減するためにターン間でKVキャッシュを再利用する具体的な単一エージェント実装を記述する。
  • OneFlowを導入し、自動的に単一エージェント実行に適合したワークフローを設計するデュアルメタLLM+モンテカルロ木探索フレームワークを提示する。
  • 自動設計のワークフロー設計と最適化されたワークフローの単一LLM実行の2段階アプローチを概説する。

実験結果

リサーチクエスチョン

  • RQ1単一エージェント実装は表現力の損失なく同質マルチエージェントワークフローを忠実に模倣できるか。
  • RQ2KVキャッシュ共有はマルチエージェント設定と比較して単一エージェント実行の性能とコストにどのように影響するか。
  • RQ3OneFlowのような自動設計戦略で、推論コストを抑えつつ同等の性能を得られるか。
  • RQ4異種(マルチモデル)ワークフローを単一エージェントのアプローチで捉える際の限界は何か。

主な発見

  • 単一エージェントが同質ワークフローを実行すると、複数のベンチマークにおいてマルチエージェント版の性能に匹敵する。
  • KVキャッシュの再利用によりコストを削減しつつ、性能を維持または向上させることが多い。
  • OneFlowは既存手法と同等の性能を得つつ推論コストを抑える、ストリームライン化されたワークフローを自動設計する。
  • 自動設計された異種ワークフローの単一エージェント実行は、いくつかの異種ベースラインと同等の性能に達することがあるが、異種性(異なるモデル間でのKVキャッシュ共有)そのものは未解決で難しい。
  • ターン間のKVキャッシュ共有は重要な効率要因として示され、オープンウェイトやコスト意識の強い設定で特に有効。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。