QUICK REVIEW

[論文レビュー] Improving Explorability in Variational Inference with Annealed Variational Objectives

Chin-Wei Huang, Shawn Tan|arXiv (Cornell University)|Sep 6, 2018

Generative Adversarial Networks and Image Synthesis被引用数 20

ひとこと要約

本稿では、温度調整によるエネルギー温度調整を組み込んだアンネールド目的関数を用いて、階層的変分推論における探索性を向上させる、Annealed Variational Objectives (AVO) を提案する。訓練中に温度を徐々に低下させることで、近似事後分布がより効果的に多モーダル構造を探索できるようになり、周辺尤度推定の精度が向上し、beta-アンネーリングスケジュールに対してより頑健になる。MNIST および Omniglot における定性的・定量的評価でも、標準的な ELBO より優れた性能を示した。

ABSTRACT

Despite the advances in the representational capacity of approximate distributions for variational inference, the optimization process can still limit the density that is ultimately learned. We demonstrate the drawbacks of biasing the true posterior to be unimodal, and introduce Annealed Variational Objectives (AVO) into the training of hierarchical variational methods. Inspired by Annealed Importance Sampling, the proposed method facilitates learning by incorporating energy tempering into the optimization objective. In our experiments, we demonstrate our method's robustness to deterministic warm up, and the benefits of encouraging exploration in the latent space.

研究の動機と目的

変分推論における制限、すなわち高い表現能力を有しても最適化のバイアスにより近似事後分布が単一モード・過信的解に偏る問題に対処すること。
アンネールド目的関数によるエネルギー温度調整を導入することで、階層的変分推論 (HVI) の探索的行動を改善すること。
アンネーリングされた変分目的関数が、より豊かな変分族に依存せずに、複雑な多モーダル事後分布の学習を向上させることを示すこと。
AVO が、通常は性能を低下させることが多い決定論的 beta-アンネーリングスケジュールに対して頑健であることを示すこと。
分布族の拡張とは直交するが、アモアタイズド変分推論における最適化由来のバイアスに直接的に対処する手法を提供すること。

提案手法

温度パラメータ T を用いて変分自由エネルギー目的関数を変更することで、Annealed Variational Objectives (AVO) を導入し、α = 1/T がエネルギー温度調整の度合いを制御する。
KL 収束項にエネルギー温度調整を適用：E_q[log q(z) - α log f(z)] で、α を初期は小さく（高温）にし、最終的に 1 に増加（低温）させることで、初期段階でエネルギーの地形を滑らかにする。
各層が事後分布を段階的に精緻化する階層的変分推論 (HVI) フレームワークを採用し、各レベルに AVO を適用する。
α を初期値から 1 へ線形にアンネーリングするスケジュールを採用し、初期には多様なモードを探索可能にし、後段では事後分布を精緻化する。
VAE などのニューラルネットワークによるアモアタイズド推論と組み合わせ、計算効率を維持しつつ、事後分布の近似を改善する。
真のエネルギー関数からの負のKL距離とテスト集合における尤度を評価指標とし、不確実性推定が困難なエントロピーの推定には重要度サンプリングを用いる。

実験結果

リサーチクエスチョン

RQ1アンネールド目的関数によるエネルギー温度調整は、多モーダル事後分布設定下における階層的変分推論の探索的行動を向上させ得るか？
RQ2AVO は、決定論的ウォームアップスケジュールに対して、標準的な ELBO や beta-アンネーリングと比較して、どの程度頑健か？
RQ3AVO による探索促進は、実世界のデータセットにおいて、より良い周辺尤度推定とより小さい変分ギャップをもたらすか？
RQ4AVO は、標準的な変分推論が直面する単一モードへのバイアスをどの程度軽減できるか？
RQ5AVO は、モデルの複雑さを増加させることなく、VAE におけるテスト尤度と一般化性能を向上させ得るか？

主な発見

HVI-AVO は、多モーダルエネルギー関数の4つのモードをすべて捉えられるが、HVI-ELBO はすべてのモードを探索できず、単一モードに収束する。
MNIST および Omniglot において、HVI-AVO は標準 ELBO よりも低い変分ギャップ（例：3.24 対 7.71）とより良いテスト尤度（85.51 対 86.40）を達成しており、事後分布近似の向上が示された。
HVI-AVO は、さまざまな beta-アンネーリングスケジュールに対しても一貫した性能を維持するが、HVI-ELBO は長期間のアンネーリングで著しく性能が低下するため、頑健性が確認された。
Omniglot 実験では、HVI-AVO はテスト尤度 85.51 を達成し、標準 VAE ベースラインを上回り、初期 ELBO 値が高かったにもかかわらず、一般化性能が向上した。
ELBO とテスト尤度の乖離が小さくなったことから、近似事後分布が真の事後分布をより代表的かつ偏りが少ない状態に近づいていることが示された。
AVO は、複雑な変分族を必要とせず、最適化ダイナミクスがアモアタイズド変分推論における重要なボトルネックであることを示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。