Skip to main content
QUICK REVIEW

[논문 리뷰] Retrieval-Augmented Generation for Large Language Models: A Survey

Yunfan Gao, Yun Xiong|arXiv (Cornell University)|2023. 12. 18.
Topic Modeling인용 수 610
한 줄 요약

이 설문조사는 Retrieval-Augmented Generation (RAG)를 LLMs에 대해 분석하고, 패러다임, 핵심 구성 요소, 평가 지표, 벤치마크, 그리고 향후 연구 방향을 자세히 기술한다.

ABSTRACT

Large Language Models (LLMs) showcase impressive capabilities but encounter challenges like hallucination, outdated knowledge, and non-transparent, untraceable reasoning processes. Retrieval-Augmented Generation (RAG) has emerged as a promising solution by incorporating knowledge from external databases. This enhances the accuracy and credibility of the generation, particularly for knowledge-intensive tasks, and allows for continuous knowledge updates and integration of domain-specific information. RAG synergistically merges LLMs' intrinsic knowledge with the vast, dynamic repositories of external databases. This comprehensive review paper offers a detailed examination of the progression of RAG paradigms, encompassing the Naive RAG, the Advanced RAG, and the Modular RAG. It meticulously scrutinizes the tripartite foundation of RAG frameworks, which includes the retrieval, the generation and the augmentation techniques. The paper highlights the state-of-the-art technologies embedded in each of these critical components, providing a profound understanding of the advancements in RAG systems. Furthermore, this paper introduces up-to-date evaluation framework and benchmark. At the end, this article delineates the challenges currently faced and points out prospective avenues for research and development.

연구 동기 및 목표

  • Naive RAG에서 Advanced RAG 및 Modular RAG에 이르는 RAG 패러다임의 진화를 요약한다.
  • RAG의 삼요소 기반인 검색, 생성 및 증강 기법을 해부한다.
  • 검색 및 생성 구성 요소에 사용되는 최첨단 기술을 검토한다.
  • RAG 모델의 평가 지표, 벤치마크 및 현재의 평가 프레임워크를 제시한다.
  • RAG 생태계에서 도전 과제를 강조하고 향후 유망한 연구 방향을 개요화한다.

제안 방법

  • RAG 아키텍처를 Naive RAG, Advanced RAG, 및 Modular RAG로 분류한다.
  • RAG 시스템에서 검색, 생성 및 증강의 역할을 분석한다.
  • 각 RAG 구성 요소에 내재된 최첨단 기법들을 조사한다.
  • RAG 모델 평가에 사용 가능한 지표와 벤치마킹 방법을 요약한다.
  • 다중 모달성, 인프라 및 생태계 개발과 같은 향후 가능성 있는 방향을 논의한다.

실험 결과

연구 질문

  • RQ1주요 RAG 패러다임은 무엇이며 어떻게 진화해 왔는가?
  • RQ2RAG 시스템에서 검색, 생성 및 증강을 구성하는 기술과 구성 요소는 무엇인가?
  • RQ3RAG 모델 평가에 사용되는 지표와 벤치마크는 무엇이며, 어떤 프레임워크가 존재하는가?
  • RQ4RAG 연구 및 배치의 주요 도전 과제와 향후 방향은 무엇인가?

주요 결과

  • RAG 시스템은 LLM의 지식과 외부 데이터 소스를 결합하여 정확성과 신뢰성을 향상시킨다.
  • 본 설문은 Naive RAG, Advanced RAG, 및 Modular RAG를 진보적 패러다임으로 제시한다.
  • 핵심 구성요소로 검색, 생성 및 증강을 식별하고 각 구성요소별 최첨단 방법을 제시한다.
  • RAG 성능 평가를 위한 평가 지표 및 프레임워크를 요약한다.
  • 본 논문은 다중 모달성 확장과 RAG 생태계 개발을 포함한 향후 연구 방향을 제안한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.