Skip to main content
QUICK REVIEW

[論文レビュー] The Rise and Potential of Large Language Model Based Agents: A Survey

Zhiheng Xi, Wen-Xiang Chen|arXiv (Cornell University)|Sep 14, 2023
Topic Modeling被引用数 247
ひとこと要約

本論文は、大規模言語モデルに基づくエージェントの出現と潜在能力を調査し、分野における注目すべきモデル・アーキテクチャ・研究動向を概説する。

ABSTRACT

For a long time, humanity has pursued artificial intelligence (AI) equivalent to or surpassing the human level, with AI agents considered a promising vehicle for this pursuit. AI agents are artificial entities that sense their environment, make decisions, and take actions. Many efforts have been made to develop intelligent agents, but they mainly focus on advancement in algorithms or training strategies to enhance specific capabilities or performance on particular tasks. Actually, what the community lacks is a general and powerful model to serve as a starting point for designing AI agents that can adapt to diverse scenarios. Due to the versatile capabilities they demonstrate, large language models (LLMs) are regarded as potential sparks for Artificial General Intelligence (AGI), offering hope for building general AI agents. Many researchers have leveraged LLMs as the foundation to build AI agents and have achieved significant progress. In this paper, we perform a comprehensive survey on LLM-based agents. We start by tracing the concept of agents from its philosophical origins to its development in AI, and explain why LLMs are suitable foundations for agents. Building upon this, we present a general framework for LLM-based agents, comprising three main components: brain, perception, and action, and the framework can be tailored for different applications. Subsequently, we explore the extensive applications of LLM-based agents in three aspects: single-agent scenarios, multi-agent scenarios, and human-agent cooperation. Following this, we delve into agent societies, exploring the behavior and personality of LLM-based agents, the social phenomena that emerge from an agent society, and the insights they offer for human society. Finally, we discuss several key topics and open problems within the field. A repository for the related papers at https://github.com/WooooDyy/LLM-Agent-Paper-List.

研究の動機と目的

  • LLMベースのエージェントの研究を促進し、それらがAI研究において急速に重要性を増していることを示す。
  • エージェントのアーキテクチャ、行動、人格特性に関する既存研究を整理・総括する。
  • 景観を把握するため、代表的なシステムとカテゴリ(個別の行動 vs. 集団行動、認知と人格)を特定する。
  • 有能で社交的なLLMベースのエージェントを開発する上での未解決課題と将来の方向性を強調する。

提案手法

  • 本論文で引用されている最近のLLMベースのエージェントと関連技術(例:CoT、ReAct、Voyager、RoCo、AutoGen)に関する文献総合。
  • エージェントを、行動的・人格的次元(個別の行動 vs. 集団行動;社会的認知)に分類。
  • 引用ソースからの代表的なシステムとベンチマークを議論し、進展とギャップを示す。

実験結果

リサーチクエスチョン

  • RQ1LLMベースのエージェントが自律的または半自律的に行動することを可能にする主要なアーキテクチャパターンと技術は何か?
  • RQ2人格・認知・社会的行動の概念は、LLMベースのエージェントにどのように具現化されているか?
  • RQ3実用化を目的としてLLMベースのエージェントをスケールさせる際の主な課題と未解決の研究方向は何か?
  • RQ4個別と集団設定における能力と社交性の観点から、異なるエージェントシステムはどのように比較されるか。

主な発見

  • LLMベースのエージェントは急速に普及しており、個別および集団の行動を示す多数のシステムが存在する。
  • 認知と人格の側面を組み込む取り組みが進んでおり、エージェントの社交性と有用性を高めている。
  • 連鎖思考(チェイン・オブ・ソート)やReAct、その他の prompting 戦略といった基盤的技術が、多くの調査対象システムに見られる。
  • 多様なエージェントエコシステムとベンチマークが含まれており、幅広く進化する研究領域を示している。
  • 調査は堅牢で社交的なエージェントの実現に向けた進展と、依然として存在する課題の両方を強調している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。