[論文レビュー] Approximate Inference with Amortised MCMC
本稿では、MCMCダイナミクスを教師として活用し、ニューラルネットワークが近似的な事後分布サンプルを生成するための、新たなフレームワークであるアモルタイズドMCMCを提案する。繰り返しMCMCによってサンプルを精錬し、そのフィードバックをもとにネットワークを更新することで、事後分布の近似を柔軟かつ高品質に実現でき、特に計算が困難な分布に対しても有効である。画像生成と欠損データ補完の両分野において、最先端の性能を示した。
We propose a novel approximate inference algorithm that approximates a target distribution by amortising the dynamics of a user-selected MCMC sampler. The idea is to initialise MCMC using samples from an approximation network, apply the MCMC operator to improve these samples, and finally use the samples to update the approximation network thereby improving its quality. This provides a new generic framework for approximate inference, allowing us to deploy highly complex, or implicitly defined approximation families with intractable densities, including approximations produced by warping a source of randomness through a deep neural network. Experiments consider image modelling with deep generative models as a challenging test for the method. Deep models trained using amortised MCMC are shown to generate realistic looking samples as well as producing diverse imputations for images with regions of missing pixels.
研究の動機と目的
- 変分推論における滑らかな密度関数の必要性を回避する、汎用的でスケーラブルな近似的ベイズ推論フレームワークの開発。
- 特に密度関数が計算不能な分布(例:深層ノーマライジングフロー)を含む、複雑な暗黙的定義された近似的分布を、明示的な密度計算を避けてアモルタイズド推論に統合することの実現。
- MCMCによる精錬と繰り返しのネットワーク適応を通じて、深層生成モデルやベイジアンニューラルネットワークにおける事後分布近似の品質を向上させること。
- 標準的な変分推論が多峰性を持つ事後分布を捉えきれないという限界を、MCMCが複雑なターゲット分布を探索できる能力を活用することで克服すること。
提案手法
- 本手法は、学生-教師フレームワークを採用する:ニューラルネットワーク(学生)が初期サンプルを生成し、それらがMCMCサンプラー(教師)によって精錬される。
- MCMCサンプラーは、ユーザーが指定した遷移カーネルを適用して初期サンプルを改善し、より高品質な事後分布近似を生成する。
- 学生ネットワークは、敵対的に推定された発散とエネルギーマッチングを用いて更新され、出力とMCMCで精錬されたサンプルとの乖離を最小化する。
- 本フレームワークは汎用的であり、任意のMCMCカーネルと任意の近似的サンプラー族(密度関数が計算不能な場合を含む)と併用可能である。
- MCMCのコストを、MCMC遷移からのフィードバックを通じて時間とともに改善するパrametricなプロポーザルネットワークを学習することで、MCMCのコストをアモルタイズ化する。
- 本手法は、事後分布サンプリングと尤度推定の両方をサポートし、ベイジアンニューラルネットワークや深層生成モデルへの応用が可能である。
実験結果
リサーチクエスチョン
- RQ1MCMCダイナミクスを効果的にアモルタイズ化し、滑らかな密度関数が不要な状況でも、柔軟で高容量の事後分布近似器を学習可能か?
- RQ2アモルタイズドMCMCは、標準的な変分推論と比較して、事後分布の品質と尤度推定の正確性において優れているか?
- RQ3画像生成や欠損データ補完タスクにおいて、アモルタイズドMCMCは、単峰性の変分近似と比較して、多峰性の事後分布をより効果的に捉えられるか?
- RQ4本手法は、深層生成モデルにおけるサンプルの多様性と再構成忠実度をどの程度向上させるか?
主な発見
- 提案されたアモルタイズドMCMC手法は、MNISTデータセットにおいてテスト尤度が-85.6 natsを達成し、標準的なVAEを著しく上回り、最良の変分ベースラインと同等の性能を示した。
- ハミルトニアン断熱重要度サンプリング(HAIS)を用いた実験で、IWAEに基づく尤度推定が著しくバイアスを含むことが判明した一方、AMCモデルは真の尤度推定において優れた性能を示した。
- 欠損データ補完タスクでは、AMCで学習されたモデルが、局所最適解に閉じ込められるVAEとは異なり、多様で高品質な再構成を生成し、複数の妥当な補完を探索できた。
- 訓練データセット内の最近傍のラベル分布のエントロピーは、AMCモデル(例:CNN-Bでは1.8)がVAE(エントロピー~1.0)よりも高かった。これは、AMCモデルによる補完画像の多様性がより高いことを示している。
- T=50のMCMCステップを用いた最良のAMCモデルは、恒常的MCMCベースラインよりもテスト尤度で0.6 natの改善を達成し、アモルタイズド精錬の有効性を裏付けた。
- 本手法は、深層生成モデリングにおいて現実的で多様なサンプルを生成でき、計算リソースが限られた状況下でも、ベイジアンニューラルネットワーク分類における効果的な事後分布近似を実現した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。