[論文レビュー] OpenAgents: An Open Platform for Language Agents in the Wild
OpenAgents は、Data、Plugins、Web の三つの言語エージェントをホストするオープンソースプラットフォームを提供し、ウェブUI、ローカルデプロイメント、研究者向けコンポーネントを備え、実世界・野外での言語エージェント評価を可能にします。
Language agents show potential in being capable of utilizing natural language for varied and intricate tasks in diverse environments, particularly when built upon large language models (LLMs). Current language agent frameworks aim to facilitate the construction of proof-of-concept language agents while neglecting the non-expert user access to agents and paying little attention to application-level designs. We present OpenAgents, an open platform for using and hosting language agents in the wild of everyday life. OpenAgents includes three agents: (1) Data Agent for data analysis with Python/SQL and data tools; (2) Plugins Agent with 200+ daily API tools; (3) Web Agent for autonomous web browsing. OpenAgents enables general users to interact with agent functionalities through a web user interface optimized for swift responses and common failures while offering developers and researchers a seamless deployment experience on local setups, providing a foundation for crafting innovative language agents and facilitating real-world evaluations. We elucidate the challenges and opportunities, aspiring to set a foundation for future research and development of real-world language agents.
研究の動機と目的
- 非専門家と研究者の双方に向けた、オープンで使いやすいプラットフォームを提供し、言語エージェントへのアクセスを民主化する。
- Data Agent、Plugins Agent、Web Agent の三つのエージェントを通じて実世界のタスクを実現する。
- ユーザー向けウェブUI、開発者向けローカルデプロイ、研究者向けリサーチフックを含むエンドツーエンドのデプロイ支援を提供する。
- 野外でのエージェント構築の実践的な課題を調査し、それに対するアーキテクチャとツールの解決策を提案する。
提案手法
- ユーザーとエージェントの相互作用のための二部構成のプラットフォーム設計: (a) ユーザーインターフェース(フロントエンドとバックエンド)とユーザーエージェント相互作用用; (b) モデル、ツール、環境を含む言語エージェントのコア。
- 三統合エージェント:Data Agent(ツールを用いた Python/SQL データ分析)、Plugins Agent(200+ ツール)、Web Agent(自律的ブラウジング)。
- ツール使用と API 呼び出しのために parsable outputs を備えた ReAct 派生の観察・熟考・行動ループに基づくプロンプティング。
- ブラウザ制御のためのサンドボックス化された環境と Chrome 拡張機能を用いて現実の安全な実行を可能にする。
- 多数のプラグインとツール API を扱う自動ツール選択とスケーリング、ストリーミング、エラーハンドリング、堅牢なバックエンドロジック。
実験結果
リサーチクエスチョン
- RQ1オープンプラットフォームは、さまざまなユーザーニーズに対して実世界でのデプロイと評価をどのように支援できるか?
- RQ2野外エージェントを構築する際の設計・エンジニアリングの課題は何か、ツールはそれをどのように緩和できるか?
- RQ3三つの実用的なエージェントタイプ(データ、プラグイン、ウェブ)は実世界のタスクでどのように性能を示し、どの評価シグナルが最も有益か?
- RQ4UI、デプロイ、グラウンディング、ツールオーケストレーションといった開発パターンは、スケーラブルで堅牢なエージェントエコシステムをどう実現するか?
主な発見
| Interface | Environment | Name | Online | Human Feedback | UI | Coding Env. | #Tools | Web |
|---|---|---|---|---|---|---|---|---|
| OpenGPT-like | Wild | AutoGPT (Gravitas, 2023) | ✗ | ✓ | CLI | Wild | 15 | ✓ |
| OpenGPT-like | Controlled | BMTools (Qin et al., 2023a) | ✗ | ✗ | - | Controlled | - | - |
| OpenGPT-like | Controlled | BabyAGI (Nakajima, 2023) | ✗ | ✗ | - | Controlled | - | - |
| OpenGPT-like | Controlled | Gentopia (Xu et al., 2023a) | ✗ | ✓ | CLI | Controlled | 15 | ✗∗ |
| OpenGPT-like | Wild | Open Interpreter (Lucas, 2023) | ✗ | ✓ | CLI | Wild | 1 | ✗ |
| OpenGPT-like | - | GAs (Park et al., 2023) | ✗ | ✗ | Web | - | - | - |
| OpenGPT-like | Web | AgentVerse (Chen et al., 2023) | ✗ | ✗ | Web | - | - | - |
| OpenGPT-like | - | Camel (Li et al., 2023b) | ✓ | ✗ | Web | - | - | - |
| OpenGPT-like | Wild | Agents (Zhou et al., 2023c) | ✓ | ✓ | Web | Wild | 11 | ✗∗ |
| OpenAgents (ours) | Controlled & Wild | OpenAgents (ours) | ✓ | ✓ | Web | Controlled & Wild | ≥200+ | ✓+ |
- OpenAgents は広範なツールアクセスとウェブ UI を備え、エンドユーザー向けに三つのエージェントをデプロイできる。
- プラットフォームはリアルタイムのストリーミング、堅牢なエラーハンドリング、および安全なサンドボックス環境を強調し、ユーザー体験と信頼性を向上させる。
- 自動ツール選択とスケーリングはエンドユーザーの手動プラグイン管理を軽減する。
- リアルワールドのデプロイは、プロンプトの複雑さ、ストリーミングの利点、および信頼性のためのウェブ閲覧とチャットのオーケストレーションを分離する必要性といった課題を明らかにする。
- OpenAgents は実世界の言語エージェントの研究開発を加速する再利用可能なコードベースとコンポーネントを提供する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。