Skip to main content
QUICK REVIEW

[論文レビュー] Isolating Sources of Disentanglement in Variational Autoencoders

Ricky T. Q. Chen, Xuechen Li|arXiv (Cornell University)|Feb 14, 2018
Generative Adversarial Networks and Image Synthesis参考文献 46被引用数 145
ひとこと要約

本論文は ELBO を分解して total-correlation term を分離し、追加のハイパーパラメータなしで beta-VAE を改良するプラグインとして beta-TCVAE を導入し、分類器を使用しない disentanglement 指標である MIG を提案します。そして total correlation をデータセット間の disentanglement に経験的に結びつけます。

ABSTRACT

We decompose the evidence lower bound to show the existence of a term measuring the total correlation between latent variables. We use this to motivate our $β$-TCVAE (Total Correlation Variational Autoencoder), a refinement of the state-of-the-art $β$-VAE objective for learning disentangled representations, requiring no additional hyperparameters during training. We further propose a principled classifier-free measure of disentanglement called the mutual information gap (MIG). We perform extensive quantitative and qualitative experiments, in both restricted and non-restricted settings, and show a strong relation between total correlation and disentanglement, when the latent variables model is trained using our framework.

研究の動機と目的

  • ELBO を分解して total correlation 項を特定することにより、VAE における disentanglement を動機づけ、定量化する。
  • 新たなハイパーパラメータを導入せず、分解項の重み付けを行うトレーニング手法を提案する。
  • beta-TCVAE を beta-VAE のプラグイン置換として導入し、自動的な disentanglement の利得を提供する。
  • 潜在分布全体の disentanglement を評価する分類器なしの情報理論的指標(MIG)を提案する。

提案手法

  • index-code MI、total correlation、および次元ごとの KL 項を明らかにする ELBO 分解を導出する。
  • 追加のハイパーパラメータなしで分解項を推定するための minibatch-weighted sampling を提案する。
  • beta-TCVAE を alpha=gamma=1 の特別な場合として定義し、beta が TC ペナルティを制御する。
  • 識別器なしで TC を推定する代替のトレーニング手法を提供する。

実験結果

リサーチクエスチョン

  • RQ1ELBO の total correlation 項をペナルティすると、VAE における disentanglement は促進されるか?
  • RQ2beta-TCVAE はトレーニングの複雑さを追加せずに beta-VAE より良い disentanglement を達成できるか。
  • RQ3潜在分布全体を横断して、分類器なしで頑健に disentanglement を定量化できる指標はあるか。
  • RQ4total correlation はデータセットとサンプリングバイアスの下で disentanglement とどのように相関するか。

主な発見

  • beta-TCVAE はいくつかのデータセットで beta-VAE より解釈性の高い disentangled 表現を生む。
  • beta-TCVAE の下で total correlation は disentanglement と負の相関を示し、TC ペナルティの役割を裏付ける。
  • MIG は分類器なしで、軸に整列し、さまざまな潜在分布に適用可能な一般化可能な disentanglement 測度を提供する。
  • 提案された minibatch weighting により、追加のハイパーパラメータなしで TC ウェイティングを用いた訓練が可能になる。
  • 同様の目的を持つ FactorVAE は、密度比の工夫が難しい場合に劣ることがあり、beta-TCVAE の頑健性を際立たせる。
  • beta-TCVAE は非均一または従属する因子サンプリング下でも有効で、ベースラインより解釈性を向上させる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。