QUICK REVIEW

[논문 리뷰] Generalization and Equilibrium in Generative Adversarial Nets (GANs)

Sanjeev Arora, Rong Ge|arXiv (Cornell University)|2017. 03. 02.

Generative Adversarial Networks and Image Synthesis인용 수 211

한 줄 요약

본 논문은 GAN 일반화가 표준 분포 거리에서 일반화될 수 없지만 신경망 거리에서 일반화 보장을 제공하며, 생성기 혼합을 통한 근사 균형의 존재를 증명하고 MIX+GAN을 실용적인 안정화 기술로 제시한다.

ABSTRACT

We show that training of generative adversarial network (GAN) may not have good generalization properties; e.g., training may appear successful but the trained distribution may be far from target distribution in standard metrics. However, generalization does occur for a weaker metric called neural net distance. It is also shown that an approximate pure equilibrium exists in the discriminator/generator game for a special class of generators with natural training objectives when generator capacity and training set sizes are moderate. This existence of equilibrium inspires MIX+GAN protocol, which can be combined with any existing GAN training, and empirically shown to improve some of them.

연구 동기 및 목표

GAN 학습이 표준 분포 거리(JS, Wasserstein 등)에서 다항 샘플로 일반화되지 않을 수 있음을 입증한다.
GAN에 대한 계산가능한 일반화 지표로 신경망 거리를 도입한다.
GAN 게임에서 생성기 혼합을 통해 근사 균형의 존재를 입증한다.
실용적인 학습 프레임워크로 MIX+GAN을 제안하고 혼합을 기존 GAN 목적함수와 결합시키고 다양성 유도 엔트로피 정규화를 사용하여 실험적으로 검증한다.

제안 방법

신경망 판별기 및 생성기를 사용하는 GAN 학습과 일반적인 목적함수를 정의한다.
통합 발산 척도로서 F-distance와 신경망 거리를 도입한다.
다항 샘플 복잡도로 신경망 거리에 대한 일반화 보장을 증명한다.
무한한 생성기 혼합이 GAN 게임에서 거의 최적에 가까운 균형을 달성할 수 있음을 보여준다.
근사 순수 균형을 실현하기 위한 유한 혼합 구성과 네트워크 규모에 대한 상한을 도출한다.
다양성을 장려하기 위해 엔트로피 정규화를 활용하고 기존 GAN 목적함수와 혼합을 결합하는 실용적 학습 프로토콜로 MIX+GAN을 소개한다.

실험 결과

연구 질문

RQ1GAN 학습이 다항 샘플로 표준 거리 지표(JS, Wasserstein) 하에서 일반화될 수 있는가?
RQ2더 약한 지표인 신경망 거리(neural net distance)가 GAN의 일반화 보장을 제공할 수 있는가?
RQ3GAN 게임에서 균형이 존재하는가, 그리고 실용적 네트워크 크기로 이를 구현할 수 있는가?
RQ4생성기의 혼합이 근사 균형을 달성할 수 있으며 이를 단일 네트워크(순수 균형)로 구현할 수 있는가?
RQ5MIX+GAN 프레임워크가 학습을 안정화하고 실험적으로 성능을 향상시키는가?

주요 결과

표준 JS 발산 및 Wasserstein 거리는 다항 샘플로 일반화되지 않는다.
신경망 거리는 다항 샘플로 일반화를 누리며, GAN 학습에 대한 대리 보장을 제공한다.
생성기의 유한 혼합을 통해 근사 균형이 존재하며, modest한 네트워크 규모 증가로 순수 균형과 유사한 구성이 가능하다.
MIX+GAN 프레임워크는 학습을 안정화하고 CIFAR-10, MNIST, CelebA와 같은 데이터세트에서 성능 향상을 보인다.
실험적 결과는 MIX+DCGAN이 여러 베이스라인보다 높은 Inception Scores를 달성함을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.