Skip to main content
QUICK REVIEW

[논문 리뷰] Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing

Pengfei Liu, Weizhe Yuan|arXiv (Cornell University)|2021. 07. 28.
Topic Modeling인용 수 513
한 줄 요약

프롬프트 기반 학습을 NLP에 조직적으로 다룬 포괄적 설문조사로, 프롬프트의 기초, 모델 계열, 설계 전략, 학습 방법, 응용 분야, 과제 및 메타 분석, 신규 진입자들을 돕기 위한 자료를 상세히 제시한다.

ABSTRACT

This paper surveys and organizes research works in a new paradigm in natural language processing, which we dub "prompt-based learning". Unlike traditional supervised learning, which trains a model to take in an input x and predict an output y as P(y|x), prompt-based learning is based on language models that model the probability of text directly. To use these models to perform prediction tasks, the original input x is modified using a template into a textual string prompt x' that has some unfilled slots, and then the language model is used to probabilistically fill the unfilled information to obtain a final string x, from which the final output y can be derived. This framework is powerful and attractive for a number of reasons: it allows the language model to be pre-trained on massive amounts of raw text, and by defining a new prompting function the model is able to perform few-shot or even zero-shot learning, adapting to new scenarios with few or no labeled data. In this paper we introduce the basics of this promising paradigm, describe a unified set of mathematical notations that can cover a wide variety of existing work, and organize existing work along several dimensions, e.g.the choice of pre-trained models, prompts, and tuning strategies. To make the field more accessible to interested beginners, we not only make a systematic review of existing works and a highly structured typology of prompt-based concepts, but also release other resources, e.g., a website http://pretrain.nlpedia.ai/ including constantly-updated survey, and paperlist.

연구 동기 및 목표

  • 전통적인 감독 학습에서 벗어난 프롬프트 기반 학습 패러다임을 소개한다.
  • 다양한 연구를 포괄하는 프롬프트 개념과 기호에 대한 형식적이고 통일된 설명을 제공한다.
  • 사전 학습 모델, 프롬프트, 튜닝 전략 등의 차원에 따라 기존 연구를 정리한다.
  • 학습 전략, 응용 분야 및 프롬프트 관련 도전과제를 조사하여 향후 연구를 안내한다.
  • 신규 진입자들이 프롬프트 기반 NLP 연구에 진입하도록 큐레이션된 자원과 구조화된 유형학을 제공한다.

제안 방법

  • 프롬프트 추가, 정답 탐색, 정답 매핑의 3단계 과정으로 프롬프트를 형식적으로 설명한다.
  • 클로즈 프롬프트와 프리픽스 프롬프트를 포괄하는 통일된 기호를 정의하고 Z-값의 정답 공간을 제시한다.
  • 프롬프트 형태(클로즈/프리픽스), 수동 대 자동 프롬프트 학습, 이산 대 연속 프롬프트 등으로 프롬프트 방법을 분류한다.
  • 학습 목표, 노이징 및 방향성에 따라 사전 학습된 언어 모델 계열을 조사하여 프롬프트를 위한 적합성을 평가한다.
  • 설계 고려사항(프롬프트 엔지니어링, 정답 엔지니어링, 다중 프롬프트 학습)과 학습 전략(프롬프트 없는 미세 조정, 조정 없이 프롬 prompting, 프롬프트/LM 조정)을 체계적으로 검토한다.
  • 분류, 정보 추출, 질의응답, 생성, 다중 모달 등 폭넓은 응용 분야를 요약하고 이를 프롬프트 선택과 연결한다.
  • 전문 분석적 통찰과 시점을 제공하여 분야 전반의 경향과 전이 가능성을 강조한다.
  • 초보자의 진입을 돕기 위해 NLPedia–Pretrain 및 관련 유형학과 같은 자원을 제공한다.

실험 결과

연구 질문

  • RQ1프롬프트 기반 NLP 방법을 통일하는 핵심 개념과 수학적 형식은 무엇인가?
  • RQ2프롬프트 전략은 작업 전반에 걸쳐 서로 다른 사전 학습된 언어 모델과 목표에 어떻게 상호 작용하는가?
  • RQ3프롬프트 성능에 영향을 미치는 주요 설계 선택(프롬프트, 정답 공간, 학습 전략)은 무엇인가?
  • RQ4현재 프롬프트 기반 NLP의 응용, 도전과제 및 연구 방향은 무엇인가?
  • RQ5프롬프트 패러다임에 진입하는 연구자와 초보자를 지원할 수 있는 자원은 무엇인가?

주요 결과

  • 프롬프트 기반 학습은 사전 학습된 LM의 입력 샘플링을 재구성함으로써 few-shot 또는 zero-shot 적응을 가능하게 한다.
  • 두 가지 주요 변화가 프롬프트를 뒷받침한다: (i) 막대한 비지도식 사전 학습의 활용, (ii) 태스크별 감독 없이도 모델의 동작을 이끌어내기 위해 프롬프트를 통해 다운스트림 태스크를 재구성하는 것.
  • 프롬프트는 클로즈 또는 프리픽스 형태일 수 있으며 수동 또는 자동으로 학습될 수 있다(이산 대 연속 프롬프트).
  • 다른 사전 학습 LM 계열(left-to-right, masked, prefix/encoder-decoder)은 서로 다른 프롬프트 설계 및 다운스트림 태스크와 정렬된다.
  • 다중 프롬프트 및 프롬프트 구성 기법은 태스크 간의 강건성과 적용 범위를 더욱 향상시킨다.
  • 이 설문은 학습 전략(프롬프트 없는 미세 조정, 조정-프리 프롬핑, 프롬프트/LM 조정)을 개략하고 프롬프트 방법을 다양한 NLP 태스크 및 평가 도전에 연결한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.