QUICK REVIEW

[논문 리뷰] Structured Disentangled Representations

Babak Esmaeili, Hao Wu|arXiv (Cornell University)|2018. 04. 06.

Generative Adversarial Networks and Image Synthesis참고 문헌 34인용 수 58

한 줄 요약

본 논문은 두 수준의 목표를 가진 계층적으로 인자화된 VAE(HFVAEs)를 제안하며, 블록 간 독립성과 블록 내 독립성을 제어하여 이산적 요인의 해방을 가능하게 하고 보지 못한 요인 조합에 대한 일반화 성능을 향상시킨다.

ABSTRACT

Deep latent-variable models learn representations of high-dimensional data in an unsupervised manner. A number of recent efforts have focused on learning representations that disentangle statistically independent axes of variation by introducing modifications to the standard objective function. These approaches generally assume a simple diagonal Gaussian prior and as a result are not able to reliably disentangle discrete factors of variation. We propose a two-level hierarchical objective to control relative degree of statistical independence between blocks of variables and individual variables within blocks. We derive this objective as a generalization of the evidence lower bound, which allows us to explicitly represent the trade-offs between mutual information between data and representation, KL divergence between representation and prior, and coverage of the support of the empirical data distribution. Experiments on a variety of datasets demonstrate that our objective can not only disentangle discrete variables, but that doing so also improves disentanglement of other variables and, importantly, generalization even to unseen combinations of factors.

연구 동기 및 목표

깊은 생성 모델에서 해방된 표현의 필요성을 제시한다.
변수 블록 간의 독립성과 블록 내 독립성을 제어하기 위한 두 수준의 계층적 목표를 개발한다.
데이터-표현 상호 정보, 사전 일치 및 데이터 분포 커버리지 간의 trade-off를 명시적으로 관리하도록 VAE 목표를 일반화한다.
이산 요인의 해방이 다른 변수의 해방 및 일반화 향상으로 이어질 수 있음을 보인다.

제안 방법

VAE 목표를 생성 모델과 추론 모델 간의 KL 발산으로 재해석한다.
VAE 목표를 데이터–z 식별성, 상호 정보 제어, 주변 분포 일관성을 나타내는 네 가지 항으로 분해한다.
블록 내 및 개별 변수 간의 총상관(TC)을 통한 통계적 독립성을 강제하기 위한 두 수준의 계층적 분해를 도입한다.
항 간의 트레이드오프와 그 효과를 설명하기 위한 일반화된 VAE 목표의 통합적 관점을 제공한다.
HFVAE가 이산 요인을 해방시키고 보지 못한 요인 조합에 대한 일반화를 개선할 수 있음을 시연한다.

실험 결과

연구 질문

RQ1두 수준의 계층적 목표가 이산 요인의 해방을 가능하게 하고 연속 변수의 해방을 향상시킬 수 있는가?
RQ2블록 내 및 변수 내의 총상관을 명시적으로 제어하는 것이 보지 못한 요인 조합에 대한 일반화를 향상시키는가?
RQ3상호 정보, 사전 매칭, 데이터 분포 커버리지 간의 트레이드오프가 해방 품질에 어떤 영향을 미치는가?
RQ4HFVAE는 학습 데이터에 없는 잠재 특징 조합을 회복하는가?

주요 결과

HFVAEs는 이산 변수의 해방을 가능하게 하고 다른 변수의 해방도 향상시킬 수 있다.
계층적 목표는 보이지 않는 잠재 요인 조합에 대한 일반화를 더 잘 수행한다.
이 방법은 VAE 목표 수정에서의 트레이드오프에 대한 통합적 관점을 제공한다.
dSprites, MNIST, Fashion-MNIST, CelebA, 20Newsgroups와 같은 데이터셋에 대한 실증적 결과는 해방 및 일반화의 개선을 뒷받침한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.