Skip to main content
QUICK REVIEW

[论文解读] Rethinking the Value of Multi-Agent Workflow: A Strong Single Agent Baseline

Jiawei Xu, Arief Koesdwiady|arXiv (Cornell University)|Jan 18, 2026
Multi-Agent Systems and Negotiation被引用 2
一句话总结

论文显示:单个 LLM 代理在多轮对话和 KV 缓存下,可以达到同构多代理工作流的性能,并引入 OneFlow 用于自动化的单代理工作流设计。

ABSTRACT

Recent advances in LLM-based multi-agent systems (MAS) show that workflows composed of multiple LLM agents with distinct roles, tools, and communication patterns can outperform single-LLM baselines on complex tasks. However, most frameworks are homogeneous, where all agents share the same base LLM and differ only in prompts, tools, and positions in the workflow. This raises the question of whether such workflows can be simulated by a single agent through multi-turn conversations. We investigate this across seven benchmarks spanning coding, mathematics, general question answering, domain-specific reasoning, and real-world planning and tool use. Our results show that a single agent can reach the performance of homogeneous workflows with an efficiency advantage from KV cache reuse, and can even match the performance of an automatically optimized heterogeneous workflow. Building on this finding, we propose extbf{OneFlow}, an algorithm that automatically tailors workflows for single-agent execution, reducing inference costs compared to existing automatic multi-agent design frameworks without trading off accuracy. These results position the single-LLM implementation of multi-agent workflows as a strong baseline for MAS research. We also note that single-LLM methods cannot capture heterogeneous workflows due to the lack of KV cache sharing across different LLMs, highlighting future opportunities in developing extit{truly} heterogeneous multi-agent systems.

研究动机与目标

  • 通过多轮对话来评估同构多代理工作流是否可以被单代理有效模拟的动机。
  • 量化单代理执行与传统多代理设置在性能与成本上的影响。
  • 提出一个自动工作流设计框架(OneFlow),在单代理执行中优化性能与成本。
  • 探讨异构多代理工作流相对于单代理基线的局限性与潜在收益。

提出的方法

  • 将基于 LLM 的多代理工作流形式化为带有代理、提示、工具和路由的有向图。
  • 证明在工具效果和基于历史的路由确定性的条件下,单一 LLM 仿真器可以复现同构工作流的 transcripts 分布。
  • 描述一个具体的单代理实现,在各轮之间重复使用 KV 缓存以降低预填充成本。
  • 引入 OneFlow,一个双元 LLM + 蒙特卡洛树搜索框架,自动设计面向单代理执行的工作流。
  • 概述一个两阶段的方法:自动化工作流设计,随后对优化工作流进行单 LLM 执行。

实验结果

研究问题

  • RQ1单代理实现是否能够在不降低表达力的前提下,真实模拟同构多代理工作流?
  • RQ2在性能和成本方面,KV 缓存共享对单代理执行相比多代理设置有何影响?
  • RQ3哪些自动设计策略(如 OneFlow)可以在降低推理成本的同时实现可比的性能?
  • RQ4捕捉异构(多模型)工作流时,单代理方法存在哪些局限性?

主要发现

  • 一个单代理执行同构工作流可以在若干基准测试中达到多代理版本的性能。
  • 单代理执行受益于 KV 缓存复用,通常在保持或提升性能的同时降低成本。
  • OneFlow 能自动设计精简化的工作流,达到与现有方法相似的性能,但推理成本更低。
  • 对异构工作流(自动设计)进行的单代理执行可以达到某些异构基线的性能,尽管真正的异构性(在不同模型之间的 KV 缓存共享)仍具挑战性。
  • 轮次间的 KV 缓存共享被证明是一个关键的效率因素,特别是在开源权重或成本敏感的设置中。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。