QUICK REVIEW

[논문 리뷰] SOLOIST: Few-shot Task-Oriented Dialog with A Single Pre-trained Auto-regressive Model

Baolin Peng, Chunyuan Li|arXiv (Cornell University)|2020. 05. 11.

Topic Modeling참고 문헌 42인용 수 88

한 줄 요약

SOLOIST는 작업 지향 대화를 위한 대화 상태 추적, 정책 학습, 응답 생성을 통합하는 단일 미리 훈련된 순차적 생성 기반 Transformer 모델을 제안한다. 전이 학습과 기계 학습을 활용하여, 몇 개의 작업별 예시만으로 CamRest 및 MultiWOZ에서 최신 기술 수준의 성능을 달성하며, 레이블링 비용을 크게 절감한다.

ABSTRACT

This paper presents a new method SOLOIST, which uses transfer learning to efficiently build task-oriented dialog systems at scale. We parameterize a dialog system using a Transformer-based auto-regressive language model, which subsumes different dialog modules (e.g., state tracker, dialog policy, response generator) into a single neural model. We pre-train, on large heterogeneous dialog corpora, a large-scale Transformer model which can generate dialog responses grounded in user goals and real-world knowledge for task completion. The pre-trained model can be efficiently adapted to accomplish a new dialog task with a handful of task-specific dialogs via machine teaching. Our experiments demonstrate that (i) SOLOIST creates new state-of-the-art results on two well-known benchmarks, CamRest and MultiWOZ, (ii) in the few-shot learning setting, the dialog systems developed by SOLOIST significantly outperform those developed by existing methods, and (iii) the use of machine teaching substantially reduces the labeling cost. We will release our code and pre-trained models for reproducible research.

연구 동기 및 목표

작업 지향 대화 시스템을 위한 확장 가능하고 통합된 프레임워크를 개발하여 작업별 모듈 설계에 대한 의존도를 줄이기.
미리 훈련된 모델에 기계 학습을 활용하여 소수의 레이블 데이터로도 레이블링 비용을 최소화하는 소수의 예시 학습을 위한 방법 개발.
대규모 이질적인 대화 코퍼스에서의 전이 학습을 통해 자원이 제한된 상황에서의 대화 시스템의 제로샷 및 소수의 예시 일반화 능력을 향상시키기.
대화 상태 추적, 정책 학습, 응답 생성을 단일 엔드 투 엔드 순차적 생성 모델로 통합하기.
CamRest 및 MultiWOZ와 같은 벤치마크 데이터셋에서 최소한의 피팅 데이터로 최신 기술 수준의 성능를 달성하기.

제안 방법

대화 상태 추적, 정책, 응답 생성을 위한 별도의 모듈 대신, 단일 Transformer 기반 순차적 생성 언어 모델을 사용하여 전체 대화 시스템을 매개변수화하기.
대규모 이질적인 대화 코퍼스에서 미리 훈련하여, 기반된 응답과 사용자 목표 이해 능력을 학습하기.
기계 학습을 활용하여 새로운 작업에 적응시키며, 미세 조정을 유도하기 위해 몇 개의 작업별 대화 예시만 사용하기.
사용자 목표와 실제 세계 지식에 조건부인 응답을 생성하기 위해 단일 시퀀스 투 시퀀스 순차적 생성 헤드를 사용하기.
사용자 목표와 외부 지식을 입력 프롬프트에 명시적으로 통합하여, 기반된 응답과 작업 준수 가능한 응답을 보장하기.
전이 학습을 활용하여 소수의 레이블 데이터로도 새로운 도메인에 신속하게 적응할 수 있도록 하기.

실험 결과

연구 질문

RQ1단일 미리 훈련된 순차적 생성 모델이 작업 지향 대화에서 대화 상태 추적, 정책 학습, 응답 생성을 효과적으로 통합할 수 있는가?
RQ2기존 방법들과 비교하여 SOLOIST는 표준 벤치마크에서 소수의 예시 설정에서 어떻게 성능을 내는가?
RQ3기계 학습을 통해 얼마나 많은 레이블링 비용을 절감할 수 있으며, 성능 유지 또는 향상에 기여하는가?
RQ4대규모 이질적인 대화 데이터에서의 전이 학습이 자원이 제한된 대화 상황에서의 일반화 능력을 향상시키는 데 얼마나 기여하는가?
RQ5SOLOIST의 통합 아키텍처는 소수의 예시 조건에서 CamRest 및 MultiWOZ에서 최신 기술 수준의 결과를 달성하는가?

주요 결과

SOLOIST는 소수의 예시 설정에서 CamRest 및 MultiWOZ 벤치마크에서 새로운 최신 기술 수준의 성능를 달성한다.
기존 방법들보다 소수의 예시 학습에서 뛰어난 일반화 능력을 보이며, 최소한의 레이블 데이터로도 뛰어난 성능를 발휘한다.
기계 학습을 통해 새로운 대화 작업에 필요한 레이블링 비용을 줄이면서도 높은 성능를 유지한다.
통합된 순차적 생성 모델은 별도의 모듈 훈련 없이도 복잡한 대화 동역학을 효과적으로 포착한다.
대규모 이질적인 대화 코퍼스에서의 미리 훈련은 강력한 제로샷 및 소수의 예시 적응 능력을 가능하게 한다.
사용자 목표와 실제 세계 지식에 조건부인 모델은 기반된, 작업 준수 가능한 응답을 생성한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.