[论文解读] Isolating Sources of Disentanglement in Variational Autoencoders
本文将 ELBO 分解以分离出 total-correlation 项,提出 beta-TCVAE 作为对 beta-VAE 的无额外超参数的即插即用改进,并提出 MIG,一种 classifier-free 的去纠缠度量。它在不同数据集上经验性地将总相关性与解缠之间联系起来。
We decompose the evidence lower bound to show the existence of a term measuring the total correlation between latent variables. We use this to motivate our $β$-TCVAE (Total Correlation Variational Autoencoder), a refinement of the state-of-the-art $β$-VAE objective for learning disentangled representations, requiring no additional hyperparameters during training. We further propose a principled classifier-free measure of disentanglement called the mutual information gap (MIG). We perform extensive quantitative and qualitative experiments, in both restricted and non-restricted settings, and show a strong relation between total correlation and disentanglement, when the latent variables model is trained using our framework.
研究动机与目标
- 通过分解 ELBO 以识别总相关性项来激励并量化 VAE 的解缠。
- 提出一种训练方法,在不引入新的超参数的情况下对分解项进行加权。
- 引入 beta-TCVAE 作为 beta-VAE 的无缝替代,具有自动解缠的好处。
- 提出一个无分类器、信息理论的度量 (MIG) 来评估潜在分布的解缠。
提出的方法
- 推导出一个 ELBO 分解,揭示 index-code MI、total correlation,以及维度级 KL 项。
- 提出 minibatch 加权采样以估计分解项,且不需要额外的超参数。
- 将 beta-TCVAE 定义为一个特殊情况,其中 alpha=gamma=1,beta 控制 TC 惩罚。
- 提供一种替代的训练方法来估计 TC,而不需要鉴别器。
实验结果
研究问题
- RQ1在 ELBO 中惩罚总相关性项是否会促进 VAE 的解缠?
- RQ2beta-TCVAE 在不增加训练复杂性的情况下,是否能实现比 beta-VAE 更好的解缠?
- RQ3是否存在一个鲁棒的、无分类器的度量来量化潜在分布的解缠?
- RQ4总相关性如何在不同数据集和采样偏差下与解缠相关?
主要发现
- 在若干数据集上,beta-TCVAE 比 beta-VAE 产生更易解释的解缠表征。
- 在 beta-TCVAE 下,总相关性与解缠呈负相关,支持 TC 惩罚的作用。
- MIG 提供一个无分类器、轴对齐、可推广至各种潜在分布的解缠度量。
- 提出的 minibatch 加权允许在 TC 加权下进行训练且不需要额外的超参数。
- 在目标函数相似的情况下,当密度比技巧难以训练时,FactorVAE 可能被超越,突出 beta-TCVAE 的鲁棒性。
- 即使在非均匀或相关因子采样下,beta-TCVAE 仍然有效,提升了对比基线的可解释性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。