QUICK REVIEW

[논문 리뷰] Adversarial Variational Bayes: Unifying Variational Autoencoders and Generative Adversarial Networks

Lars Mescheder, Sebastian Nowozin|arXiv (Cornell University)|2017. 01. 17.

Generative Adversarial Networks and Image Synthesis참고 문헌 19인용 수 160

한 줄 요약

AVB는 보조 판별기를 사용하여 VAE에 대한 블랙박스 추론 모델을 도입하고, VAE와 GAN을 통합하며 비모수 극한에서 정확한 사후분포와 최대가능도 추정이 가능하게 한다.

ABSTRACT

Variational Autoencoders (VAEs) are expressive latent variable models that can be used to learn complex probability distributions from training data. However, the quality of the resulting model crucially relies on the expressiveness of the inference model. We introduce Adversarial Variational Bayes (AVB), a technique for training Variational Autoencoders with arbitrarily expressive inference models. We achieve this by introducing an auxiliary discriminative network that allows to rephrase the maximum-likelihood-problem as a two-player game, hence establishing a principled connection between VAEs and Generative Adversarial Networks (GANs). We show that in the nonparametric limit our method yields an exact maximum-likelihood assignment for the parameters of the generative model, as well as the exact posterior distribution over the latent variables given an observation. Contrary to competing approaches which combine VAEs with GANs, our approach has a clear theoretical justification, retains most advantages of standard Variational Autoencoders and is easy to implement.

연구 동기 및 목표

적대적 학습을 사용하여 Variational Autoencoders용 임의로 표현력이 높은 추론 모델을 가능하게 한다.
비모수 한계에서 참 사후분포 및 최대가능도에 수렴한다는 이론적 보장을 제공한다.
합성 데이터 및 실제 데이터 집합에서 사후 근사 및 생성 성능의 향상을 보여준다.

제안 방법

log q_phi(z|x) - log p(z)를 암시적으로 나타내기 위해 보조 판별 네트워크 T(x, z)를 도입한다.
판별자 목표(3.3)를 통해 생성 모델과 추론 모델 간의 이진(두 플레이어) 게임을 형식화한다.
재매개화(reparameterization)를 사용하여 theta와 phi에 대한 기울도를 도출하고 T*의 phi에 대한 기울도 독립성을 보인다(정리 2).
실제에서 theta, phi, 그리고 판별자 psi를 함께 업데이트하기 위한 알고리즘 1 (AVB)을 제안한다.
학습을 안정화하기 위해 알려진 밀도를 갖는 보조 r_alpha(z|x)와 q_phi(z|x)를 비교하는 Adaptive Contrast (AC)를 제안한다.
이론적 결과를 제시한다: Nash 균형은 최대가능도 최적점 및 진정한 사후분포에 대응한다(정리 1–4).

실험 결과

연구 질문

RQ1블랙박스이면서 매우 표현력이 높은 추론 모델을 VAE 프레임워크 내에서 적대적 학습으로 학습시킬 수 있는가?
RQ2AVB가 비모수 한계에서 참 사후분포와 최대가능도 매개변수를 복원하는가?
RQ3표준 VAEs와 관련 방법들과 비교했을 때 AVB는 변분 추론과 표현력이 높은 생성 모델 학습에서 어떤 성능을 보이는가?
RQ4Adaptive Contrast와 같은 안정화 향상이 데이터셋 전반에 걸쳐 학습 및 결과를 향상시키는가?
RQ5합성 예제와 MNIST와 같은 벤치마크에서 AVB와 AC가 최첨단 방법과 비교하여 어떤 성능을 보이는가?

주요 결과

AVB는 적대적 학습을 통해 VAEs용 임의로 유연한 추론 모델을 가능하게 한다.
비모수 한계에서 AVB는 생성 모델에 대한 참 사후분포와 정확한 최대가능도를 복원한다(이론적 결과).
Adaptive Contrast를 사용하는 AVB는 MNIST 유사 데이터 및 합성 작업에서 로그가능도 추정치 및 재구성 품질이 향상된다.
Eight Schools 예에서 입증되듯이 AVB는 가우시안 추론 VAE보다 다모드(posteriors)를 더 잘 포착한다.
실험 결과 AVB가 MNIST에서 기본 VAE 및 변형들과 비교하여 경쟁력 있거나 우수한 로그가능도 및 샘플 품질을 달성함을 보인다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.