[논문 리뷰] A Survey on Prompting Techniques in LLMs
이 논문은 자동회귀형 대규모 언어 모델(LM)을 위한 프롬프팅 기법에 대한 종합적인 서베이를 제공하며, 기존 방법들을 체계적인 분류 체계로 분류하고, 구조화된 데이터 처리, 답변 엔지니어링, 프롬프트 삽입 공격 등의 주요 과제를 밝혀낸다. 프롬프팅은 피팅 튜닝 없이도 효과적인 제로샷 또는 패트샷 추론을 가능하게 하지만, 강건성, 일반화 및 안전성 측면에서 여전히 중요한 열린 문제들이 남아 있다.
Autoregressive Large Language Models have transformed the landscape of Natural Language Processing. Pre-train and prompt paradigm has replaced the conventional approach of pre-training and fine-tuning for many downstream NLP tasks. This shift has been possible largely due to LLMs and innovative prompting techniques. LLMs have shown great promise for a variety of downstream tasks owing to their vast parameters and huge datasets that they are pre-trained on. However, in order to fully realize their potential, their outputs must be guided towards the desired outcomes. Prompting, in which a specific input or instruction is provided to guide the LLMs toward the intended output, has become a tool for achieving this goal. In this paper, we discuss the various prompting techniques that have been applied to fully harness the power of LLMs. We present a taxonomy of existing literature on prompting techniques and provide a concise survey based on this taxonomy. Further, we identify some open problems in the realm of prompting in autoregressive LLMs which could serve as a direction for future research.
연구 동기 및 목표
- 자동회귀형 LLM을 위한 프롬프팅 기법에 대한 체계적인 분류 체계를 제공하기 위해.
- 구조적이고 조직적인 방식으로 프롬프팅 방법에 관한 기존 문헌을 서베이하기 위해.
- 프롬프팅의 열린 문제, 즉 구조화된 입력 처리, 답변 추출 향상, 프롬프트 삽입 공격 완화 등을 특정하기 위해.
- 미래 연구를 이끌기 위해 LLM을 위한 프롬프팅에서의 주요 과제와 잠재적 방향을 제시하기 위해.
제안 방법
- 논문은 입력 형식, 지시 스타일, 작업 유형을 기반으로 프롬프팅 기법의 분류 체계를 수립한다.
- 제로샷, 패트샷, 체인 오브 토우트, 프리픽스 튜닝 등의 범주에 걸쳐 기존의 프롬프팅 방법을 서베이한다.
- 분석은 프롬프팅이 피팅 튜닝 없이도 자동회귀형 LLM이 원하는 출력으로 유도하는 방식에 집중한다.
- 분류, 생성, 추론 등의 하류 NLP 작업에서의 효과성을 통해 프롬프팅 기법을 평가한다.
- 최근에 프롬프팅을 통해 구조화된 데이터(예: 표, 그래프)를 처리하는 데의 진전을 분석하며, GraphPrompt 및 표에서 텍스트로의 프롬프팅 등의 방법을 포함한다.
- 프롬프트 삽입 공격를 탐지하기 위해 보조 모델을 사용하는 방법을 논의하며, LLM 기반 탐지기들을 사용하는 방어 전략을 제안한다.
실험 결과
연구 질문
- RQ1자동회귀형 LLM에서의 기능적·구조적 차이를 반영할 수 있도록 프롬프팅 기법을 체계적으로 분류할 수 있는 방법은 무엇인가?
- RQ2표, 그래프 또는 트리와 같은 구조화된 입력을 처리할 때 현재의 프롬프팅 방법의 주요 제약은 무엇인가?
- RQ3LLM이 비효율적 또는 모호한 출력을 생성할 경우, 생성된 답변의 신뢰성과 정확도를 어떻게 향상시킬 수 있는가?
- RQ4프롬프트 삽입 공격는 배포된 LLM의 안전 메커니즘을 얼마나 효과적으로 우회할 수 있는가?
- RQ5강건성, 일반화 및 안전성 향상을 위해 향후 연구에서 가장 유망한 방향은 무엇인가?
주요 결과
- 프롬프팅은 피팅 튜닝을 대체하여 하류 작업에 LLM을 배포하는 주요 패러다임이 되었으며, 재학습이 최소 또는 전혀 없이 제로샷 또는 패트샷 추론을 가능하게 한다.
- LLM의 잠재 능력(예: 컨텍스트 내 학습)은 스케일에 기인하며, 모델 업데이트 없이도 체계적인 프롬프팅을 통해 효과적으로 해제된다.
- 현재의 프롬프팅 방법은 구조화된 데이터 처리에 어려움을 겪는다: GraphPrompt와 같은 일부 접근법은 존재하지만, 일반적으로 사전 학습이 필요하여 실용성에 제약이 있다.
- 답변 엔지니어링은 여전히 주요 과제이며, LLM은 종종 정확하지 않거나 모호한 출력을 생성하므로, 정규식 또는 동의어 매칭과 같은 작업별 후처리가 필요로 한다.
- 프롬프트 삽입 공격는 미세한 프롬프팅 기법을 통해 안전 메커니즘을 우회할 수 있으며, 이는 현재의 방어 조치가 취약하고 더 강력하고 적응 가능한 솔루션이 필요함을 보여준다.
- 다양한 입력 형식을 처리하고, 답변 신뢰도를 향상시키며, 악성 조작에 저항할 수 있는 일반화 가능하고 강건한 프롬프팅 프레임워크의 필요성이 핵심 과제로 지적된다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.