Skip to main content
QUICK REVIEW

[论文解读] Isolating Sources of Disentanglement in Variational Autoencoders

Ricky T. Q. Chen, Xuechen Li|arXiv (Cornell University)|Feb 14, 2018
Generative Adversarial Networks and Image Synthesis参考文献 46被引用 145
一句话总结

本文将 ELBO 分解以分离出 total-correlation 项,提出 beta-TCVAE 作为对 beta-VAE 的无额外超参数的即插即用改进,并提出 MIG,一种 classifier-free 的去纠缠度量。它在不同数据集上经验性地将总相关性与解缠之间联系起来。

ABSTRACT

We decompose the evidence lower bound to show the existence of a term measuring the total correlation between latent variables. We use this to motivate our $β$-TCVAE (Total Correlation Variational Autoencoder), a refinement of the state-of-the-art $β$-VAE objective for learning disentangled representations, requiring no additional hyperparameters during training. We further propose a principled classifier-free measure of disentanglement called the mutual information gap (MIG). We perform extensive quantitative and qualitative experiments, in both restricted and non-restricted settings, and show a strong relation between total correlation and disentanglement, when the latent variables model is trained using our framework.

研究动机与目标

  • 通过分解 ELBO 以识别总相关性项来激励并量化 VAE 的解缠。
  • 提出一种训练方法,在不引入新的超参数的情况下对分解项进行加权。
  • 引入 beta-TCVAE 作为 beta-VAE 的无缝替代,具有自动解缠的好处。
  • 提出一个无分类器、信息理论的度量 (MIG) 来评估潜在分布的解缠。

提出的方法

  • 推导出一个 ELBO 分解,揭示 index-code MI、total correlation,以及维度级 KL 项。
  • 提出 minibatch 加权采样以估计分解项,且不需要额外的超参数。
  • 将 beta-TCVAE 定义为一个特殊情况,其中 alpha=gamma=1,beta 控制 TC 惩罚。
  • 提供一种替代的训练方法来估计 TC,而不需要鉴别器。

实验结果

研究问题

  • RQ1在 ELBO 中惩罚总相关性项是否会促进 VAE 的解缠?
  • RQ2beta-TCVAE 在不增加训练复杂性的情况下,是否能实现比 beta-VAE 更好的解缠?
  • RQ3是否存在一个鲁棒的、无分类器的度量来量化潜在分布的解缠?
  • RQ4总相关性如何在不同数据集和采样偏差下与解缠相关?

主要发现

  • 在若干数据集上,beta-TCVAE 比 beta-VAE 产生更易解释的解缠表征。
  • 在 beta-TCVAE 下,总相关性与解缠呈负相关,支持 TC 惩罚的作用。
  • MIG 提供一个无分类器、轴对齐、可推广至各种潜在分布的解缠度量。
  • 提出的 minibatch 加权允许在 TC 加权下进行训练且不需要额外的超参数。
  • 在目标函数相似的情况下,当密度比技巧难以训练时,FactorVAE 可能被超越,突出 beta-TCVAE 的鲁棒性。
  • 即使在非均匀或相关因子采样下,beta-TCVAE 仍然有效,提升了对比基线的可解释性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。