QUICK REVIEW

[논문 리뷰] Generative Adversarial Networks as Variational Training of Energy Based Models

Shuangfei Zhai, Yu Cheng|arXiv (Cornell University)|2016. 11. 06.

Generative Adversarial Networks and Image Synthesis참고 문헌 14인용 수 18

한 줄 요약

이 논문은 변분 기반 에너지 모델(EBM)의 훈련으로 재구성된 변분 GANs(VGANs)를 제안한다. 이는 깊이 있는 EBM의 안정적인 훈련을 위해 MCMC 샘플링이 필요 없도록 하며, 높은 품질의 다양성 있는 이미지 생성과 준지도 학습에서의 효과적인 데이터 증강을 가능하게 한다. 음의 로그우도의 변분 하한을 최소화하고 전이 기반 생성자로 변분 대비 분산을 도입함으로써, VGANs는 안정적인 훈련을 달성한다.

ABSTRACT

In this paper, we study deep generative models for effective unsupervised learning. We propose VGAN, which works by minimizing a variational lower bound of the negative log likelihood (NLL) of an energy based model (EBM), where the model density $p(\mathbf{x})$ is approximated by a variational distribution $q(\mathbf{x})$ that is easy to sample from. The training of VGAN takes a two step procedure: given $p(\mathbf{x})$, $q(\mathbf{x})$ is updated to maximize the lower bound; $p(\mathbf{x})$ is then updated one step with samples drawn from $q(\mathbf{x})$ to decrease the lower bound. VGAN is inspired by the generative adversarial networks (GANs), where $p(\mathbf{x})$ corresponds to the discriminator and $q(\mathbf{x})$ corresponds to the generator, but with several notable differences. We hence name our model variational GANs (VGANs). VGAN provides a practical solution to training deep EBMs in high dimensional space, by eliminating the need of MCMC sampling. From this view, we are also able to identify causes to the difficulty of training GANs and propose viable solutions. \footnote{Experimental code is available at https://github.com/Shuangfei/vgan}

연구 동기 및 목표

이차적 분할 함수와 고차원 적분의 비가역성으로 인해 깊이 있는 에너지 기반 모델(EBM)의 훈련이 불안정하고 어려운 문제를 해결하기 위해.
생성 대비 네트워크(GANs)와 EBM에서의 변분 추론 간의 체계적인 연결 고리를 제공하여, GANs가 변분 훈련의 한 형태임을 밝혀내기 위해.
생성자 분포의 누락된 엔트로피 항을 규명하고 전이 기반 모델링을 통해 해결책을 제안함으로써 GANs의 모드 붕괴 문제를 해결하기 위해.
마르코프 체인 몽테카를로(MCMC) 샘플링이 필요 없이 고차원 공간에서 깊이 있는 EBM의 실용적이고 확장 가능한 훈련을 가능하게 하기 위해.
학습된 전이 분포가 준지도 학습에서의 데이터 증강에 어떻게 활용될 수 있는지 보여주며, 적은 수의 레이블이 있는 경우 분류 정확도를 향상시키기 위해.

제안 방법

판별자 출력을 에너지 함수로 해석함으로써 GANs를 EBM의 변분 훈련으로 재구성한다: $ E(\mathbf{x}) = -\log D(\mathbf{x}) $, 생성자는 모델 분포에 대한 변분 근사로 간주된다.
EBM의 음의 로그우도(NLL)에 대한 변분 하한을 도입하고, 이는 두 단계의 번갈아가는 최적화를 통해 최소화된다: 먼저 변분 분포 $ q(\mathbf{x}) $ 를 갱신하고, 그 다음 $ q(\mathbf{x}) $ 에서 샘플링한 자료를 사용해 에너지 함수 $ E(\mathbf{x}) $ 를 갱신한다.
수치적 안정성을 향상시키고 훈련 중 기울기 폭발을 방지하기 위해 유계이고 명시적으로 다중모달인 에너지 함수를 제안한다.
입력 $ \mathbf{x} $ 에서 생성된 $ \mathbf{\tilde{x}} $ 로의 마르코프 전이를 모델링하는 전이 기반 생성자 모델 $ p_z(\mathbf{\tilde{x}}|\mathbf{x}) $ 를 도입하며, 이는 RBM에서의 대비 분산과 유사하다.
학습된 전이 분포 $ p_z(\mathbf{\tilde{x}}|\mathbf{x}) $ 를 준지도 학습에서 데이터 증강 수단으로 활용하여 입력 데이터의 현실적인 변형을 생성한다.
이중 단계 훈련 절차를 사용한다: 먼저 변분 하한 최적화를 통해 EBM을 훈련하고, 그 다음 전이 모델을 사용해 생성자와 판별자를 GAN 유사 구조로 미세조정한다.

실험 결과

연구 질문

RQ1GANs는 깊이 있는 에너지 기반 모델을 훈련하기 위한 변분 추론의 한 형태로 해석될 수 있는가?
RQ2기본 GANs에서 훈련 불안정성과 모드 붕괴의 원인은 무엇이며, 이는 생성자 분포의 누락된 엔트로피 항과 관련이 있는가?
RQ3고차원 공간에서 MCMC 샘플링 없이 EBMs의 비가역적 분할 함수를 효과적으로 다룰 수 있는가?
RQ4학습된 전이 분포 $ p_z(\mathbf{\tilde{x}}|\mathbf{x}) $ 는 데이터 다양체를 효과적으로 모델링하고 현실적이며 다양한 샘플을 생성할 수 있는가?
RQ5학습된 전이 모델이 준지도 분류 성능 향상에 있어 데이터 증강 전략으로 얼마나 효과적으로 기능할 수 있는가?

주요 결과

VGANs는 MCMC 샘플링 없이 고차원 이미지 공간에서 깊이 있는 EBM를 안정적이고 효과적으로 훈련시켰다.
제안된 유계이고 다중모달인 에너지 함수는 훈련 안정성을 크게 향상시키고 기울기 폭발을 방지했다.
전이 기반 생성자 모델 $ p_z(\mathbf{\tilde{x}}|\mathbf{x}) $ 는 엔트로피 항에 대한 변분 근사를 포함함으로써 모드 붕괴를 효과적으로 완화했다.
MNIST와 SVHN에서, 기반 모델 대비 전이 모델을 데이터 증강으로 사용할 경우 테스트 오차율이 각각 최대 1.7% (MNIST-1000)와 18% (SVHN-1000) 감소했으며, 다양한 설정에서 일관된 성능 향상을 보였다.
학습된 전이 모델을 사용한 마르코프 체인 샘플링은 이미지 간에 부드럽고 현실적인 전이를 생성하여 효과적인 다양체 학습을 보여주었다.
MNIST, CIFAR10, SVHN에서 이미지 생성 품질과 다양성 측면에서 최신 기술 수준의 성능을 달성하였으며, 선명하고 현실적인 샘플을 생성했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.