Skip to main content
QUICK REVIEW

[논문 리뷰] The Rise and Potential of Large Language Model Based Agents: A Survey

Zhiheng Xi, Wen-Xiang Chen|arXiv (Cornell University)|2023. 09. 14.
Topic Modeling인용 수 247
한 줄 요약

이 논문은 대형 언어 모델 기반 에이전트의 등장과 잠재력을 조사하고, 이 분야의 주목할 만한 모델, 아키텍처, 연구 방향을 개관합니다.

ABSTRACT

For a long time, humanity has pursued artificial intelligence (AI) equivalent to or surpassing the human level, with AI agents considered a promising vehicle for this pursuit. AI agents are artificial entities that sense their environment, make decisions, and take actions. Many efforts have been made to develop intelligent agents, but they mainly focus on advancement in algorithms or training strategies to enhance specific capabilities or performance on particular tasks. Actually, what the community lacks is a general and powerful model to serve as a starting point for designing AI agents that can adapt to diverse scenarios. Due to the versatile capabilities they demonstrate, large language models (LLMs) are regarded as potential sparks for Artificial General Intelligence (AGI), offering hope for building general AI agents. Many researchers have leveraged LLMs as the foundation to build AI agents and have achieved significant progress. In this paper, we perform a comprehensive survey on LLM-based agents. We start by tracing the concept of agents from its philosophical origins to its development in AI, and explain why LLMs are suitable foundations for agents. Building upon this, we present a general framework for LLM-based agents, comprising three main components: brain, perception, and action, and the framework can be tailored for different applications. Subsequently, we explore the extensive applications of LLM-based agents in three aspects: single-agent scenarios, multi-agent scenarios, and human-agent cooperation. Following this, we delve into agent societies, exploring the behavior and personality of LLM-based agents, the social phenomena that emerge from an agent society, and the insights they offer for human society. Finally, we discuss several key topics and open problems within the field. A repository for the related papers at https://github.com/WooooDyy/LLM-Agent-Paper-List.

연구 동기 및 목표

  • LLM 기반 에이전트 연구의 동기를 제시하고 AI 연구에서의 그 증가하는 주목도를 설명한다.
  • 에이전트 아키텍처, 행동 및 성격 측면에 관한 기존 연구를 체계화하고 종합한다.
  • 현장을 개관하기 위한 대표 시스템과 범주(개인 행동 대 그룹 행동; 인지 및 성격)를 식별한다.
  • 능력 있고 사교적인 LLM 기반 에이전트를 개발하기 위한 남은 과제와 향후 방향을 강조한다.

제안 방법

  • 논문에 인용된 최근 LLM 기반 에이전트 및 관련 기법들에 대한 문헌 종합(예: CoT, ReAct, Voyager, RoCo, AutoGen).
  • 에이전트를 행동 및 성격 차원으로 분류(개인 행동 vs 그룹 행동; 사회적 인지).
  • 진행 및 격차를 설명하기 위해 인용된 소스의 대표 시스템 및 벤치마크에 대한 논의.

실험 결과

연구 질문

  • RQ1LLM 기반 에이전트가 자율적으로 또는 반자율적으로 작동하도록 하는 주요 아키텍처 패턴과 기법은 무엇인가?
  • RQ2성격, 인지, 사회적 행동의 개념이 LLM 기반 에이전트에서 어떻게 구현되는가?
  • RQ3실용적 사용을 위한 LLM 기반 에이전트의 확장에 있어 핵심 도전과 남은 연구 방향은 무엇인가?
  • RQ4개인 환경과 그룹 환경에서 능력 및 사교성 측면에서 다양한 에이전트 시스템은 어떻게 비교되는가?

주요 결과

  • LLM 기반 에이전트가 빠르게 확산되고 있으며, 다수의 시스템이 개인 및 그룹 행동을 보여준다.
  • 에이전트의 사회성 및 활용성을 높이기 위해 인지 및 성격 측면을 인코딩하려는 노력이 있다.
  • 사고의 연쇄(chain-of-thought), ReAct 및 기타 프롬프팅 전략과 같은 기초 기술이 여러 조사 대상 시스템에서 나타난다.
  • 이 분야는 다양한 에이전트 생태계와 벤치마크를 포함하고 있어 광범위하고 진화하는 연구 영역을 시사한다.
  • 본 조사는 강력하고 사교적인 에이전트를 가능하게 하는 데 있어 진전과 지속적인 도전을 모두 강조한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.