QUICK REVIEW

[論文レビュー] Agents: An Open-source Framework for Autonomous Language Agents

Wangchunshu Zhou, Yuchen Eleanor Jiang|arXiv (Cornell University)|Sep 14, 2023

Topic Modeling被引用数 19

ひとこと要約

Agents は、計画、記憶、ツールの使用、マルチエージェント対話、そして象徴的制御を備えた自律型言語エージェントの構築、調整、デプロイを可能にするオープンソースライブラリです。

ABSTRACT

Recent advances on large language models (LLMs) enable researchers and developers to build autonomous language agents that can automatically solve various tasks and interact with environments, humans, and other agents using natural language interfaces. We consider language agents as a promising direction towards artificial general intelligence and release Agents, an open-source library with the goal of opening up these advances to a wider non-specialist audience. Agents is carefully engineered to support important features including planning, memory, tool usage, multi-agent communication, and fine-grained symbolic control. Agents is user-friendly as it enables non-specialists to build, customize, test, tune, and deploy state-of-the-art autonomous language agents without much coding. The library is also research-friendly as its modularized design makes it easily extensible for researchers. Agents is available at https://github.com/aiwaves-cn/agents.

研究の動機と目的

非専門家や研究者を対象にした自動言語エージェントへのアクセスを広げる動機。
計画、記憶、ツール、およびマルチエージェント通信を組み合わせた、モジュール式で拡張可能なフレームワークを提供する。
最先端エージェントの容易なカスタマイズ、テスト、チューニング、そしてデプロイを促進する。
安定性と調整性を向上させるために、Standard Operating Procedures (SOPs) を通じた象徴的制御を提供する。

提案手法

設定ファイルから生成される Agent、SOP、Environment クラスからなるコアエージェントフレームワークを導入する。
VectorDB に格納された長期記憶をオプションとして含む、長期・短期記憶の実装および意味検索。
ToolComponents と OpenAI tool-calling を用いて、文脈依存ツールのためのツール使用とウェブナビゲーションをサポート。
モデレーター/コントローラエージェントによって制御される動的スケジューリングでマルチエージェント通信を有効化。
is_human を介してエージェントを人間操作モードに切り替えることを許可し、人間-エージェントの対話を提供。
API（FastAPI）としてのデプロイを可能にし、微調整されたエージェントを共有する Agent Hub を導入する。
タスク固有の設定を作成するための retrieval-augmented generation (RAG) パイプラインを介して SOP 生成を自動化する。

Figure 1: Illustration of the Agents framework.

実験結果

リサーチクエスチョン

RQ1Agents フレームワークは、計画、記憶、ツール利用、マルチエージェント通信を、使用可能なオープンソースライブラリとしていかに統合できるか？
RQ2非専門家や研究者のために、言語エージェントを制御可能、調整可能、デプロイ可能にするために不可欠な特徴は何か？
RQ3象徴的計画（SOPs）は、エージェント挙動の安定性と再現性を向上させる細かな制御を提供できるか？
RQ4広範な普及と言語エージェントの共有を支えるインフラストラクチャは何か（Agent Hub、API デプロイなど）？

主な発見

Agents は、モジュール化された設定ドリブンのコンポーネントを通じて、非専門家が自律型言語エージェントを構築、カスタマイズ、テスト、調整、デプロイできるように設計されています。
このフレームワークは、長期記憶と短期記憶、ツールの使用、マルチエージェント通信、人間との対話、および象徴的制御を単一のライブラリで独自に組み合わせます。
ToolComponents を介したウェブナビゲーションと外部 API/ツールの統合をサポートし、文脈依存のツール使用のためのオプションの function-calling を提供します。
動的スケジューリングコントローラは、柔軟で固定されていないマルチエージェント動作の順序を可能にします。
Agents は FastAPI で API としてデプロイでき、再利用と協力を容易にする Agent Hub を通じて共有されます。
タスク記述から設定ファイルとプロンプトを生成する自動 SOP 生成パイプラインが、手作業を削減します。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。