QUICK REVIEW

[論文レビュー] Adversarial Message Passing For Graphical Models

Theofanis Karaletsos|arXiv (Cornell University)|Dec 15, 2016

Gaussian Processes and Bayesian Inference参考文献 28被引用数 20

ひとこと要約

この論文は、局所的敵対ネットワークを用いた、尤度フリーなベイズ推論のための新規フレームワークである敵対的メッセージスイーピングを導入する。尤度の明示的評価を局所的識別とメッセージスイーピングに置き換えることで、尤度が計算不能または微分不能な成分を含む複雑なモデルに対しても、パrametricな仮定なしに正確な事後分布近似が可能になる、分散型で効率的な推論を実現する。

ABSTRACT

Bayesian inference on structured models typically relies on the ability to infer posterior distributions of underlying hidden variables. However, inference in implicit models or complex posterior distributions is hard. A popular tool for learning implicit models are generative adversarial networks (GANs) which learn parameters of generators by fooling discriminators. Typically, GANs are considered to be models themselves and are not understood in the context of inference. Current techniques rely on inefficient global discrimination of joint distributions to perform learning, or only consider discriminating a single output variable. We overcome these limitations by treating GANs as a basis for likelihood-free inference in generative models and generalize them to Bayesian posterior inference over factor graphs. We propose local learning rules based on message passing minimizing a global divergence criterion involving cooperating local adversaries used to sidestep explicit likelihood evaluations. This allows us to compose models and yields a unified inference and learning framework for adversarial learning. Our framework treats model specification and inference separately and facilitates richly structured models within the family of Directed Acyclic Graphs, including components such as intractable likelihoods, non-differentiable models, simulators and generally cumbersome models. A key result of our treatment is the insight that Bayesian inference on structured models can be performed only with sampling and discrimination when using nonparametric variational families, without access to explicit distributions. As a side-result, we discuss the link to likelihood maximization. These approaches hold promise to be useful in the toolbox of probabilistic modelers and enrich the gamut of current probabilistic programming applications.

研究の動機と目的

尤度が計算不能または微分不能な複雑で構造化されたモデルにおけるベイズ推論の課題に対処すること。
生成的敵対ネットワーク（GANs）を生成モデリングの範囲を超えて、推論と学習のための統一フレームワークへと一般化すること。
要因グラフにおける分散型・局所的推論を可能にするために、グローバルな乖離基準を最小化する協調的局所的敵対者を導入すること。
モデル仕様と推論を分離することで、シミュレータ、暗黙的尤度、非パラメトリックな変分族を柔軟に組み合わせたモデルの構築を可能にすること。
事後分布推論が、確率密度関数への明示的アクセスなしに、サンプリングと識別のみで実行可能であることを示すこと。

提案手法

各ノードがそのサンプル値が真の事後分布と整合的かどうかを評価する局所的識別器を用いる、局所的メッセージスイーピングアルゴリズムを提案する。
グローバルな乖離基準として、特にジェンセン・シャノン発散（JSD）を用い、局所的敵対者を近似事後分布と真の事後分布の乖離を最小化する方向へ誘導する。
ノイズベクトルの非線形変換としてパrameter化することで、非パラメトリックな変分族を用いる：$ q^*(x|\tilde{\text{pa}}(x)) = \int p(\epsilon) f_{vf}(\tilde{\text{pa}}(x), \epsilon) d\epsilon $。
サンプルは $ x^l = f_{vf}(\tilde{\text{pa}}(x), \epsilon_l) $ を介して生成され、$ f_{vf} $ の能力に制限される以外は任意の分布形をとることを可能にする、柔軟なサンプリング機構を導入する。
敵対的学習と尤度最大化の間の関係を確立し、敵対的訓練を通じて暗黙的尤度最大化が暗黙的に行われることを示す。
非パラメトリック推論を可能にするために、再生成核ヒルバート空間における乖離最小化を可能にするMMD（最大平均乖離）フレームワークを適応応用する。

実験結果

リサーチクエスチョン

RQ1敵対的学習は、生成モデリングを越えて、構造化されたグラフモデルにおけるベイズ的事後分布推論にも一般化可能か？
RQ2尤度の明示的評価なしに、局所的で分散型の敵対者を用いて、グローバルな乖離基準を最小化する方法は何か？
RQ3非パラメトリックな変分族を用いることで、パラメトリックな形を必要とせずに、複雑な事後分布をどの程度正確に表現できるか？
RQ4敵対的メッセージスイーピングと確率的モデルにおける暗黙的尤度最大化の関係は何か？
RQ5このフレームワークは、尤度が計算不能なモデル、シミュレータ、または微分不能な成分を含むモデルにおいて、どのように推論を可能にするか？

主な発見

フレームワークは、尤度の明示的評価を一切行わず、サンプリングと局所的識別に依存することで、計算不能または微分不能な成分を含む有向非巡回グラフモデルにおける尤度フリーなベイズ推論を可能にする。
協調的局所的敵対者を用いることで、グローバルに収束する推論が達成され、グローバルな同時分布の識別を必要としない。
モデル仕様と推論を分離することで、シミュレータや暗黙的尤度を含む、構造が複雑なモデルをサポートする。
ノイズの非線形変換によって定義される非パラメトリックな変分族を用いることで、事後分布の明示的パラメトリックな形の必要性がなくなる。
敵対的訓練を通じて暗黙的尤度最大化が行われるため、GAN風の学習とベイズ推論の目的が結びつく。
実験結果は、尤度が計算不能または存在しないモデルですら、標準的な変分推論と同等の精度の事後分布近似が達成できることを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。