Skip to main content
QUICK REVIEW

[论文解读] Adversarial Message Passing For Graphical Models

Theofanis Karaletsos|arXiv (Cornell University)|Dec 15, 2016
Gaussian Processes and Bayesian Inference参考文献 28被引用 20
一句话总结

该论文提出对抗性消息传递(adversarial message passing),一种新颖的框架,用于在结构化图模型中进行无似然函数的贝叶斯推断,采用局部对抗网络实现。通过用局部判别和消息传递替代显式的似然计算,该方法实现了对具有不可计算或不可微分组件的复杂模型的高效、分布式推断,无需对变分族做参数化假设,即可实现精确的后验近似。

ABSTRACT

Bayesian inference on structured models typically relies on the ability to infer posterior distributions of underlying hidden variables. However, inference in implicit models or complex posterior distributions is hard. A popular tool for learning implicit models are generative adversarial networks (GANs) which learn parameters of generators by fooling discriminators. Typically, GANs are considered to be models themselves and are not understood in the context of inference. Current techniques rely on inefficient global discrimination of joint distributions to perform learning, or only consider discriminating a single output variable. We overcome these limitations by treating GANs as a basis for likelihood-free inference in generative models and generalize them to Bayesian posterior inference over factor graphs. We propose local learning rules based on message passing minimizing a global divergence criterion involving cooperating local adversaries used to sidestep explicit likelihood evaluations. This allows us to compose models and yields a unified inference and learning framework for adversarial learning. Our framework treats model specification and inference separately and facilitates richly structured models within the family of Directed Acyclic Graphs, including components such as intractable likelihoods, non-differentiable models, simulators and generally cumbersome models. A key result of our treatment is the insight that Bayesian inference on structured models can be performed only with sampling and discrimination when using nonparametric variational families, without access to explicit distributions. As a side-result, we discuss the link to likelihood maximization. These approaches hold promise to be useful in the toolbox of probabilistic modelers and enrich the gamut of current probabilistic programming applications.

研究动机与目标

  • 解决在具有不可计算或不可微分似然函数的复杂结构化模型中进行贝叶斯推断的挑战。
  • 将生成对抗网络(GANs)的应用从生成建模推广至统一的推断与学习框架。
  • 通过引入协同工作的局部对抗器,实现在因子图中的分布式、局部推断,以最小化全局差异准则。
  • 实现模型定义与推断的解耦,支持灵活组合包含模拟器、隐式似然函数和非参数变分族的模型。
  • 证明仅通过采样和判别即可完成后验推断,无需显式访问概率密度函数。

提出的方法

  • 提出一种局部消息传递算法,其中因子图中的每个节点使用局部判别器来评估其采样值是否与真实后验一致。
  • 使用全局差异准则——具体为Jensen-Shannon散度(JSD)——引导局部对抗器最小化近似后验与真实后验之间的差异。
  • 通过将后验参数化为噪声向量的非线性变换来使用非参数变分族:$ q^*(x|\tilde{\text{pa}}(x)) = \int p(\epsilon) f_{vf}(\tilde{\text{pa}}(x), \epsilon) d\epsilon $。
  • 引入一种灵活的采样机制,其中样本通过 $ x^l = f_{vf}(\tilde{\text{pa}}(x), \epsilon_l) $ 生成,允许任意分布形式,仅受 $ f_{vf} $ 容量的约束。
  • 建立对抗学习与似然最大化之间的联系,表明该框架通过对抗训练隐式地执行了隐式似然最大化。
  • 将MMD(最大均值差异)框架适配至再生核希尔伯特空间,以支持非参数推断中的差异最小化。

实验结果

研究问题

  • RQ1对抗学习能否被推广至生成建模之外,用于在结构化图模型中执行贝叶斯后验推断?
  • RQ2如何利用局部、分布式对抗器在不进行显式似然评估的情况下最小化全局差异准则?
  • RQ3在不依赖参数形式的情况下,非参数变分族在多大程度上可用于表示复杂后验?
  • RQ4对抗性消息传递与概率模型中隐式似然最大化之间存在何种关系?
  • RQ5该框架如何在似然不可计算、存在模拟器或不可微分组件的模型中实现推断?

主要发现

  • 该框架通过仅依赖采样和局部判别,实现了在具有不可计算或不可微分组件的有向无环图模型中的无似然函数贝叶斯推断。
  • 对抗性消息传递通过协作的局部对抗器实现全局收敛推断,避免了对全局联合分布判别的需求。
  • 该方法通过将模型定义与推断解耦,支持结构丰富的模型,包括包含模拟器和隐式似然函数的模型。
  • 通过使用基于噪声非线性变换定义的非参数变分族,该方法消除了对后验显式参数形式的需求。
  • 该框架通过对抗训练隐式执行似然最大化,将GAN式学习与贝叶斯推断目标联系起来。
  • 实证结果表明,该方法在似然不可计算或不可用的模型中,仍能实现与标准变分推断相当的精确后验近似。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。