Skip to main content
QUICK REVIEW

[논문 리뷰] Hierarchical Implicit Models and Likelihood-Free Variational Inference

Dustin Tran, Rajesh Ranganath|arXiv (Cornell University)|2017. 02. 28.
Gaussian Processes and Bayesian Inference참고 문헌 55인용 수 101
한 줄 요약

본 논문은 계층적 암시 모델(HIM)과 가능도-없는 변분 추론(LFVI)을 도입하여 시뮬레이터 기반 및 암시적 밀도 모델에서 확장 가능한 베이지안 추론을 가능하게 하며, 생태학 시뮬레이터, Bayesian GAN, 심층 시퀀스 모델에 적용됩니다.

ABSTRACT

Implicit probabilistic models are a flexible class of models defined by a simulation process for data. They form the basis for theories which encompass our understanding of the physical world. Despite this fundamental nature, the use of implicit models remains limited due to challenges in specifying complex latent structure in them, and in performing inferences in such models with large data sets. In this paper, we first introduce hierarchical implicit models (HIMs). HIMs combine the idea of implicit densities with hierarchical Bayesian modeling, thereby defining models via simulators of data with rich hidden structure. Next, we develop likelihood-free variational inference (LFVI), a scalable variational inference algorithm for HIMs. Key to LFVI is specifying a variational family that is also implicit. This matches the model's flexibility and allows for accurate approximation of the posterior. We demonstrate diverse applications: a large-scale physical simulator for predator-prey populations in ecology; a Bayesian generative adversarial network for discrete data; and a deep implicit model for text generation.

연구 동기 및 목표

  • 암시적 밀도를 계층적 베이지안 구조와 결합하는 계층적 암시 모델(HIM)을 정의한다.
  • 암시적 변분 가족과 밀도비율 추정을 사용하는 가능도-없는 변분 추론(LFVI)을 개발한다.
  • 대규모 암시적 모델과 시뮬레이터에 대해 확장 가능하고 데이터 효율적인 베이지안 추론을 가능하게 한다.
  • 생태학적 Lotka-Volterra 시뮬레이터, 베이지안 GAN, 그리고 심층 암시적 시퀀스 모델에 대한 응용을 시연한다.

제안 방법

  • HIMs를 데이터 생성 프로세스가 확실한 결정적 함수 g를 통해 노이즈 ε를 가진 z와 beta로부터 x를 생성하는 시뮬레이터인 계층적 모형으로 정의한다.
  • 가능도 없는 변분 가족과 비율 추정을 사용하여 tractable densities가 필요 없이 KL 목적함수를 근사하는 LFVI를 도입한다.
  • ELBO에서 필요한 로그 밀도 비율 p/q를 추정하기 위해 proper scoring rule(예: 로그 손실)로 학습된 비율 추정 네트워크 r(x,z,beta)을 사용한다.
  • 전역 변수와 국소 변수에 대해 재매개가능한 변분 근사를 채택하여 미분 가능하고 확률적 그래디언트 최적화를 가능하게 한다.
  • 미니배치 확률적 그래디언트를 사용하여 비율 추정기와 변분 매개변수를 번갈아 업데이트하는 블랙박스 알고리즘(Algorithm 1)을 제공한다.
  • 대규모 데이터세트에 대한 확장성과 이산 및 연속 데이터에 대한 적용 가능성을 시연한다.

실험 결과

연구 질문

  • RQ1계층적 암시 모델이 풍부한 잠재 구조를 지원하면서도 확장 가능한 가능도-없는 추론에 여전히 적합할까?
  • RQ2가능성이 계산 불가능하지만 시뮬레이션은 가능한 상황에서 정확한 변분 추론을 어떻게 수행할 수 있을까?
  • RQ3가능도-없는 변분 추론이 대규모 데이터와 복잡한 암시적 모델(예: GAN, 생태 시뮬레이터, 노이즈가 주입된 RNN)까지 확장될 수 있을까?

주요 결과

  • LFVI가 밀도비율 추정과 암시적 변분 가족을 사용하여 HIMs의 확장 가능한 추론을 가능하게 한다.
  • 가중치에 대한 사전이 있는 베이지안 GAN은 다수의 데이터셋에서 베이지안 신경망과 경쟁력을 보인다.
  • Lotka-Volterra 포식자-피식자 시뮬레이터는 ABC 기반 방법보다 더 정확하고 더 큰 규모로 학습될 수 있다.
  • 은닉 유닛에 노이즈를 주입하면 맥락 자유 문법과 일치하는 샘플을 생성할 수 있는 심층 암시적 시퀀스 모델이 얻어진다.
  • BFI 접근법은 Crabs, Pima, Covertype, MNIST와 같은 소형에서 중형 데이터세트에서 경쟁력 있는 예측 성능을 보여준다.
  • 비율 추정 접근법은 대규모 실제 애플리케이션에서 안정성 문제와 함께 여전히 실용적인 고려 사항이다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.