QUICK REVIEW

[論文レビュー] Scaling Large Language Model-based Multi-Agent Collaboration

Qian Chen, Zihao Xie|arXiv (Cornell University)|Jun 11, 2024

Multi-Agent Systems and Negotiation被引用数 6

ひとこと要約

MacNetはDAG構造のマルチエージェント協調を用いてLLMエージェントを整理し、ベースラインを上回るスケーラブルな相互作用と優れた結果を実現する。1000を超えるエージェントの協調を含む。

ABSTRACT

Recent breakthroughs in large language model-driven autonomous agents have revealed that multi-agent collaboration often surpasses each individual through collective reasoning. Inspired by the neural scaling law--increasing neurons enhances performance, this study explores whether the continuous addition of collaborative agents can yield similar benefits. Technically, we utilize directed acyclic graphs to organize agents into a multi-agent collaboration network (MacNet), upon which their interactive reasoning is topologically orchestrated for autonomous task solving. Extensive evaluations reveal that it effectively supports collaboration among over a thousand agents, with irregular topologies outperforming regular ones. We also identify a collaborative scaling law--the overall performance follows a logistic growth pattern as agents scale, with collaborative emergence occurring earlier than traditional neural emergence. We speculate this may be because scaling agents catalyzes their multidimensional considerations during interactive reflection and refinement, thereby producing more comprehensive artifacts. The code is available at https://github.com/OpenBMB/ChatDev/tree/macnet.

研究の動機と目的

ニューロンスケーリングに触発された emergent behavior を活用して、単一エージェント推論を超えるスケーラブルなマルチエージェント協調を動機づける。
MacNetを設計して、指示者とアシスタントの役割を持つディレクトリ付き有向グラフ（DAG）によりエージェントを整理する。
トポロジカル順序付けと限定的なコンテキスト伝搬を通じて、効率的な対話型推論を実現する。
トポロジー密度と構造が性能とスケーラビリティに与える影響を調査する。
MacNetにおける協調スケーリング法と初期の協調出現の存在を特定する。

提案手法

ノードをアシスタントエージェントに割り当て、エッジを指導者エージェントに割り当てた有向非巡回グラフ(DAG)としてトポロジーをモデル化する。
エッジに沿った2エージェント対話ラウンド（指導者–アシスタントの会話）を編成するためにトポロジカル順序を使用する。
短期のインターアクション内メモリと長期の最終解決伝播によるメモリ制御を実装し、コンテキストをスケーラブルに保つ。
多様なタスクに対して、連鎖、ツリー、グラフを含む複数のトポロジーを評価する（連鎖、より広い/深いツリー、メッシュ、層状、ランダムを含む）。
MMLU、HumanEval、SRDD、CommonGen-Hard ベンチマークでベースライン（CoT、AutoGPT、GPTSwarm、AgentVerse）と比較する。

実験結果

リサーチクエスチョン

RQ1エージェント数を増やすと、ニューラルスケーリング則に類似した新たな協調能力が現れるか。
RQ2MacNetの異なるトポロジー（連鎖、ツリー、グラフ、およびバリエーション）がタスク全体の性能にどのように影響するか。
RQ3ネットワーク特性（例：小世界特性、密度）は協調推論と解決品質を最適化するか。
RQ4協調の出現はニューラルな出現よりも早く起き得るか、そしてそれはスケーリングとどう関連するか。
RQ5大規模なMacNetトポロジーにおけるメモリ制御はスケーラビリティと解決品質にどう影響するか。

主な発見

手法	MMLU	HumanEval	SRDD	CommonGen	平均
CoT	0.3544	0.6098	0.7222	0.6165	0.5757
AutoGPT	0.4485	0.4809	0.7353	0.5972	0.5655
GPTSwarm	0.2368	0.4969	0.7096	0.6222	0.5163
AgentVerse	0.2977	0.7256	0.7587	0.5399	0.5805
MacNet-Chain	0.6632	0.3720	0.8056	0.5903	0.6078
MacNet-Star	0.4456	0.5549	0.7679	0.7382	0.6267
MacNet-Tree	0.3421	0.4878	0.8044	0.7718	0.6015
MacNet-Mesh	0.6825	0.5122	0.7792	0.5525	0.6316
MacNet-Layered	0.2780	0.4939	0.7623	0.7176	0.5629
MacNet-Random	0.6877	0.5244	0.8054	0.5912	0.6522

MacNetはタスクとトポロジーを問わず一貫してベースラインを上回る。
密度が高く小世界のようなトポロジーは優れた性能をもたらす傾向がある（小世界協調現象）。
協調スケーリング法が現れる：正規化された解決品質はエージェント数が増えるにつれてロジスティック成長に従い、出現はニューラル出現よりも早い。
多くのトポロジーで、データ数を急激に増やさなくても、適度なスケールで性能飽和が生じる（約2^4〜2^5エージェント）。
不規則/ランダムなトポロジーは、ショートカットによる有効パス長の短縮で規則的なメッシュよりも優れることがある。
分岐型トポロジー（子が親より多い）は、エージェント協調において一般に収束型よりも優れている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。