QUICK REVIEW

[논문 리뷰] Adversarial Generation of Natural Language

Sai Rajeswar, Sandeep Subramanian|arXiv (Cornell University)|2017. 05. 31.

Multimodal Machine Learning Applications참고 문헌 38인용 수 100

한 줄 요약

해당 논문은 판별기가 연속 출력 분포를 입력으로 받도록 하는 GAN 기반의 간단한 자연어 생성 접근법을 제시하며, CFG/PCFG 작업 및 중국시에서 강력한 성과를 달성하고, WGAN/WGAN-GP 및 조건부 생성 변형이 포함되어 있다.

ABSTRACT

Generative Adversarial Networks (GANs) have gathered a lot of attention from the computer vision community, yielding impressive results for image generation. Advances in the adversarial generation of natural language from noise however are not commensurate with the progress made in generating images, and still lag far behind likelihood based methods. In this paper, we take a step towards generating natural language with a GAN objective alone. We introduce a simple baseline that addresses the discrete output space problem without relying on gradient estimators and show that it is able to achieve state-of-the-art results on a Chinese poem generation dataset. We present quantitative results on generating sentences from context-free and probabilistic context-free grammars, and qualitative language modeling results. A conditional version is also described that can generate sequences conditioned on sentence characteristics.

연구 동기 및 목표

GAN으로 현실적인 언어 생성을 학습하는 동기를 제공한다(이산 출력의 도전 과제에도 불구하고).
판별기가 생성기로부터 얻은 연속 출력 분포를 이용해 그라디언트 추정기를 피하는 기준선을 제시한다.
단어 수준 및 문자 수준 모델에서 CFG/PCFG와 실제 언어 데이터셋에 대해 접근법을 평가한다.
longer 시퀀스 생성을 위한 순환 및 합성곱 아키텍처를 모두 탐구하고 커리큘럼 학습 전략을 제시한다.
감정, 질문과 같은 속성 조건화를 통해 조건부 텍스트 생성을 시연한다.

제안 방법

생성기가 어휘에 대한 확률 분포의 시퀀스를 생성하는 GAN 프레임워크를 사용한다.
판별기는 생성기로부터의 확률 시퀀스와 실제 데이터를 원-핫 벡터로 처리하여 진짜/가짜를 구분한다.
생성기와 판별기에 대해 순환(LSTM/피홀 вариant) 또는 합성곱 아키텍처 중 하나를 채택한다.
훈련 안정성과 그라디언트 품질을 개선하기 위해 Wasserstein GAN(WGAN) 및 WGAN-GP 목표를 적용한다.
생성 시퀀스 길이를 점진적으로 증가시키기 위한 커리큘럼 학습을 적용한다.
속성 조건화(감정, 질문)를 생성기와 판별기에 추가하여 조건부 생성 시연한다.

실험 결과

연구 질문

RQ1판별기가 이산 샘플이 아닌 연속 확률 분포를 보는 상황에서 GAN이 자연어를 효과적으로 생성할 수 있는가?
RQ2다양한 GAN 목표(GAN, LSGAN, WGAN, WGAN-GP)가 언어 생성에 대해 어떻게 비교되는가?
RQ3순환 및 합성곱 아키텍처가 GAN 목표하에서 plausibly 긴 시퀀스를 생성할 수 있는가?
RQ4감정이나 의문 형태와 같은 높은 수준의 속성에 조건화된 텍스트를 생성할 수 있는가?

주요 결과

WGAN 및 WGAN-GP 목표가 언어 생성에 대해 강력한 훈련 신호와 더 나은 그라디언트 동작을 제공한다.
제안된 연속-판별기 설정이 CFG/PCFG 작업 및 실제 언어 데이터셋에서 현실적인 언어를 생성한다.
WGAN-WGAN-GP 변형이 여러 평가 설정에서 순수 확률 추정(MLE) 기반 기준선보다 우수하다.
본 접근법은 prior GAN 기반 방법들과 비교하여 중국 시 생성에서 경쟁적이거나 우수한 성과를 보인다.
조건부 생성이 감정 및 질문 형식과 같은 목표 속성을 가진 문장을 성공적으로 생성한다.
그라디언트 패널티 GAN 목표를 갖는 합성곱 아키텍처가 더 긴 시퀀스에서도 맥락을 효과적으로 유지한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.