QUICK REVIEW

[논문 리뷰] Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing

Pengfei Liu, Weizhe Yuan|arXiv (Cornell University)|2021. 07. 28.

Topic Modeling인용 수 513

한 줄 요약

프롬프트 기반 학습을 NLP에 조직적으로 다룬 포괄적 설문조사로, 프롬프트의 기초, 모델 계열, 설계 전략, 학습 방법, 응용 분야, 과제 및 메타 분석, 신규 진입자들을 돕기 위한 자료를 상세히 제시한다.

ABSTRACT

This paper surveys and organizes research works in a new paradigm in natural language processing, which we dub "prompt-based learning". Unlike traditional supervised learning, which trains a model to take in an input x and predict an output y as P(y|x), prompt-based learning is based on language models that model the probability of text directly. To use these models to perform prediction tasks, the original input x is modified using a template into a textual string prompt x' that has some unfilled slots, and then the language model is used to probabilistically fill the unfilled information to obtain a final string x, from which the final output y can be derived. This framework is powerful and attractive for a number of reasons: it allows the language model to be pre-trained on massive amounts of raw text, and by defining a new prompting function the model is able to perform few-shot or even zero-shot learning, adapting to new scenarios with few or no labeled data. In this paper we introduce the basics of this promising paradigm, describe a unified set of mathematical notations that can cover a wide variety of existing work, and organize existing work along several dimensions, e.g.the choice of pre-trained models, prompts, and tuning strategies. To make the field more accessible to interested beginners, we not only make a systematic review of existing works and a highly structured typology of prompt-based concepts, but also release other resources, e.g., a website http://pretrain.nlpedia.ai/ including constantly-updated survey, and paperlist.

연구 동기 및 목표

전통적인 감독 학습에서 벗어난 프롬프트 기반 학습 패러다임을 소개한다.
다양한 연구를 포괄하는 프롬프트 개념과 기호에 대한 형식적이고 통일된 설명을 제공한다.
사전 학습 모델, 프롬프트, 튜닝 전략 등의 차원에 따라 기존 연구를 정리한다.
학습 전략, 응용 분야 및 프롬프트 관련 도전과제를 조사하여 향후 연구를 안내한다.
신규 진입자들이 프롬프트 기반 NLP 연구에 진입하도록 큐레이션된 자원과 구조화된 유형학을 제공한다.

제안 방법

프롬프트 추가, 정답 탐색, 정답 매핑의 3단계 과정으로 프롬프트를 형식적으로 설명한다.
클로즈 프롬프트와 프리픽스 프롬프트를 포괄하는 통일된 기호를 정의하고 Z-값의 정답 공간을 제시한다.
프롬프트 형태(클로즈/프리픽스), 수동 대 자동 프롬프트 학습, 이산 대 연속 프롬프트 등으로 프롬프트 방법을 분류한다.
학습 목표, 노이징 및 방향성에 따라 사전 학습된 언어 모델 계열을 조사하여 프롬프트를 위한 적합성을 평가한다.
설계 고려사항(프롬프트 엔지니어링, 정답 엔지니어링, 다중 프롬프트 학습)과 학습 전략(프롬프트 없는 미세 조정, 조정 없이 프롬 prompting, 프롬프트/LM 조정)을 체계적으로 검토한다.
분류, 정보 추출, 질의응답, 생성, 다중 모달 등 폭넓은 응용 분야를 요약하고 이를 프롬프트 선택과 연결한다.
전문 분석적 통찰과 시점을 제공하여 분야 전반의 경향과 전이 가능성을 강조한다.
초보자의 진입을 돕기 위해 NLPedia–Pretrain 및 관련 유형학과 같은 자원을 제공한다.

실험 결과

연구 질문

RQ1프롬프트 기반 NLP 방법을 통일하는 핵심 개념과 수학적 형식은 무엇인가?
RQ2프롬프트 전략은 작업 전반에 걸쳐 서로 다른 사전 학습된 언어 모델과 목표에 어떻게 상호 작용하는가?
RQ3프롬프트 성능에 영향을 미치는 주요 설계 선택(프롬프트, 정답 공간, 학습 전략)은 무엇인가?
RQ4현재 프롬프트 기반 NLP의 응용, 도전과제 및 연구 방향은 무엇인가?
RQ5프롬프트 패러다임에 진입하는 연구자와 초보자를 지원할 수 있는 자원은 무엇인가?

주요 결과

프롬프트 기반 학습은 사전 학습된 LM의 입력 샘플링을 재구성함으로써 few-shot 또는 zero-shot 적응을 가능하게 한다.
두 가지 주요 변화가 프롬프트를 뒷받침한다: (i) 막대한 비지도식 사전 학습의 활용, (ii) 태스크별 감독 없이도 모델의 동작을 이끌어내기 위해 프롬프트를 통해 다운스트림 태스크를 재구성하는 것.
프롬프트는 클로즈 또는 프리픽스 형태일 수 있으며 수동 또는 자동으로 학습될 수 있다(이산 대 연속 프롬프트).
다른 사전 학습 LM 계열(left-to-right, masked, prefix/encoder-decoder)은 서로 다른 프롬프트 설계 및 다운스트림 태스크와 정렬된다.
다중 프롬프트 및 프롬프트 구성 기법은 태스크 간의 강건성과 적용 범위를 더욱 향상시킨다.
이 설문은 학습 전략(프롬프트 없는 미세 조정, 조정-프리 프롬핑, 프롬프트/LM 조정)을 개략하고 프롬프트 방법을 다양한 NLP 태스크 및 평가 도전에 연결한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.