QUICK REVIEW

[论文解读] Isolating Sources of Disentanglement in Variational Autoencoders

Ricky T. Q. Chen, Xuechen Li|arXiv (Cornell University)|Feb 14, 2018

Generative Adversarial Networks and Image Synthesis参考文献 46被引用 145

一句话总结

本文将 ELBO 分解以分离出 total-correlation 项，提出 beta-TCVAE 作为对 beta-VAE 的无额外超参数的即插即用改进，并提出 MIG，一种 classifier-free 的去纠缠度量。它在不同数据集上经验性地将总相关性与解缠之间联系起来。

ABSTRACT

We decompose the evidence lower bound to show the existence of a term measuring the total correlation between latent variables. We use this to motivate our $β$-TCVAE (Total Correlation Variational Autoencoder), a refinement of the state-of-the-art $β$-VAE objective for learning disentangled representations, requiring no additional hyperparameters during training. We further propose a principled classifier-free measure of disentanglement called the mutual information gap (MIG). We perform extensive quantitative and qualitative experiments, in both restricted and non-restricted settings, and show a strong relation between total correlation and disentanglement, when the latent variables model is trained using our framework.

研究动机与目标

通过分解 ELBO 以识别总相关性项来激励并量化 VAE 的解缠。
提出一种训练方法，在不引入新的超参数的情况下对分解项进行加权。
引入 beta-TCVAE 作为 beta-VAE 的无缝替代，具有自动解缠的好处。
提出一个无分类器、信息理论的度量 (MIG) 来评估潜在分布的解缠。

提出的方法

推导出一个 ELBO 分解，揭示 index-code MI、total correlation，以及维度级 KL 项。
提出 minibatch 加权采样以估计分解项，且不需要额外的超参数。
将 beta-TCVAE 定义为一个特殊情况，其中 alpha=gamma=1，beta 控制 TC 惩罚。
提供一种替代的训练方法来估计 TC，而不需要鉴别器。

实验结果

研究问题

RQ1在 ELBO 中惩罚总相关性项是否会促进 VAE 的解缠？
RQ2beta-TCVAE 在不增加训练复杂性的情况下，是否能实现比 beta-VAE 更好的解缠？
RQ3是否存在一个鲁棒的、无分类器的度量来量化潜在分布的解缠？
RQ4总相关性如何在不同数据集和采样偏差下与解缠相关？

主要发现

在若干数据集上，beta-TCVAE 比 beta-VAE 产生更易解释的解缠表征。
在 beta-TCVAE 下，总相关性与解缠呈负相关，支持 TC 惩罚的作用。
MIG 提供一个无分类器、轴对齐、可推广至各种潜在分布的解缠度量。
提出的 minibatch 加权允许在 TC 加权下进行训练且不需要额外的超参数。
在目标函数相似的情况下，当密度比技巧难以训练时，FactorVAE 可能被超越，突出 beta-TCVAE 的鲁棒性。
即使在非均匀或相关因子采样下，beta-TCVAE 仍然有效，提升了对比基线的可解释性。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。