Skip to main content
QUICK REVIEW

[논문 리뷰] Adversarial Variational Bayes: Unifying Variational Autoencoders and Generative Adversarial Networks

Lars Mescheder, Sebastian Nowozin|arXiv (Cornell University)|2017. 01. 17.
Generative Adversarial Networks and Image Synthesis참고 문헌 29인용 수 264
한 줄 요약

AVB는 보조 판별기를 도입함으로써 임의로 표현력이 높은 추론 모델을 가진 VAE의 학습을 가능하게 하고, 비모수적 극한에서 VAE와 GAN을 이론적으로 보장과 함께 하나로 통합합니다.

ABSTRACT

Variational Autoencoders (VAEs) are expressive latent variable models that can be used to learn complex probability distributions from training data. However, the quality of the resulting model crucially relies on the expressiveness of the inference model. We introduce Adversarial Variational Bayes (AVB), a technique for training Variational Autoencoders with arbitrarily expressive inference models. We achieve this by introducing an auxiliary discriminative network that allows to rephrase the maximum-likelihood-problem as a two-player game, hence establishing a principled connection between VAEs and Generative Adversarial Networks (GANs). We show that in the nonparametric limit our method yields an exact maximum-likelihood assignment for the parameters of the generative model, as well as the exact posterior distribution over the latent variables given an observation. Contrary to competing approaches which combine VAEs with GANs, our approach has a clear theoretical justification, retains most advantages of standard Variational Autoencoders and is easy to implement.

연구 동기 및 목표

  • 적대적 학습을 사용하여 Variational Autoencoders에서 임의로 표현력이 풍부한 추론 모형을 가능하게 한다.
  • 비모수적 극한에서 AVB가 진짜 사후분포와 진정한 최대가능도 매개변수를 복원한다는 이론적 보장을 제공한다.
  • AVB가 더 풍부한 사후 근사치와 경쟁력 있거나 최첨단 수준의 생성 모델링 결과를 산출한다는 것을 보여준다.

제안 방법

  • log qφ(z|x) − log p(z)를 근사시키기 위해 보조 판별 네트워크 T(x, z)를 도입한다.
  • 변분 바운드를 최대화하기 위해 인코더/디코더(θ, φ)와 판별기 T 사이의 이인 게임을 형식화한다.
  • 가능한 경우 재매개화를 통해 기울기를 도출하고 ∇φ Eqφ(z|x)[∇φ T*(x, z)] 항이 소거됨을 보인다(제2 성명).
  • θ, φ 및 ψ(판별기)의 확률적 그래디언트 업데이트를 수행하기 위한 알고리즘 1(AVB)을 제안한다.
  • 사전 분포 p(z) 대신 알려진 밀도 rα(z|x)와 qφ(z|x)를 대조함으로써 학습 안정화를 위한 Adaptive Contrast(AC)를 도입한다.
  • 낼 Nash 균형에서 T*(x,z) = log qφ*(z|x) − log p(z)이며 (θ*, φ*)가 ELBO의 전역 최적점임을 보이는 이론적 결과를 제공한다.

실험 결과

연구 질문

  • RQ1VAE가 임의로 표현력이 높은 추론 모델을 적대적 목표로 훈련시키면서도 최대우도(max-likelihood) 목표를 보존할 수 있는가?
  • RQ2AVB 및 그 변형들이 어떤 조건에서 진짜 사후분포와 최대가능도 매개변수를 복원하는가?

주요 결과

지표 1지표 2지표 3지표 4
VAE-1.56888.5e-3-1.697 (ELBO approx) | KL ≈ 0.165
AVB-1.4035.77e-3-1.421 | KL ≈ 0.026
  • AVB는 VAE용으로 블랙박스이면서도 고도로 표현력 있는 추론 모델을 가능하게 하며 사후 표현력을 향상시킨다.
  • 비모수적 극한에서 AVB는 생성 모델의 진짜 사후 및 진짜 최대가능도 매개변수(θ*, φ*)를 복원한다.
  • Adaptive Contrast를 사용하는 AVB는 더 풍부한 사후 분포를 얻고, 가우시안 추론 VAE보다 종종 더 실제에 근접한 사후를 제공한다. 예: 합성 데이터와 Eight Schools 예제에서.
  • MNIST에서 AVB 변형은 적절한 디코더 아키텍처와 매치될 때, 이전 VAE 접근법 및 다른 베이스라인들과 비교해 경쟁력을 가지거나 최첨단 로그가능도 추정치를 달성한다.
  • 실험 결과 AVB가 표준 대각 가우시안 사후를 가진 VAE보다 더 선명한 재구성과 더 정확한 잠재 표현을 생성한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.