Skip to main content
QUICK REVIEW

[論文レビュー] Truncated Variational Expectation Maximization

Jörg Lücke|arXiv (Cornell University)|Oct 10, 2016
Bayesian Methods and Mixture Models被引用数 3
ひとこと要約

本稿では、状態空間の部分集合内で正確な事後分布に比例し、それ以外ではゼロである分布(切断分布)を変分近似として用いる、新たな変分EMフレームワーク「Truncated Variational Expectation Maximization (TV-EM)」を提案する。これらの部分集合を学習可能なパラメータとみなすことにより、TV-EMは変分下界の効率的で単調な最適化を可能にし、標準EMとハードEMの間を補間することで、両者よりより正確で計算的にも効率的な代替手法を提供する。

ABSTRACT

We derive a novel variational expectation maximization approach based on truncated posterior distributions. Truncated distributions are proportional to exact posteriors within subsets of a discrete state space and equal zero otherwise. The treatment of the distributions' subsets as variational parameters distinguishes the approach from previous variational approaches. The specific structure of truncated distributions allows for deriving novel and mathematically grounded results, which in turn can be used to formulate novel efficient algorithms to optimize the parameters of probabilistic generative models. Most centrally, we find the variational lower bounds that correspond to truncated distributions to be given by very concise and efficiently computable expressions, while update equations for model parameters remain in their standard form. Based on these findings, we show how efficient and easily applicable meta-algorithms can be formulated that guarantee a monotonic increase of the variational bound. Example applications of the here derived framework provide novel theoretical results and learning procedures for latent variable models as well as mixture models. Furthermore, we show that truncated variation EM naturally interpolates between standard EM with full posteriors and EM based on the maximum a-posteriori state (MAP). The approach can, therefore, be regarded as a generalization of the popular `hard EM' approach towards a similarly efficient method which can capture more of the true posterior structure.

研究の動機と目的

  • 離散的 latent 変数を伴う確率的生成モデルに対して、標準EMおよびハードEMのより効率的で正確な代替手法を開発すること。
  • 既存の変分EMアプローチの限界を克服するため、変分近似として切断分布を導入すること。
  • 最適化中に変分下界が単調に増加することを保証する数学的に根拠のあるフレームワークを提供すること。
  • 標準EM、ハードEM、および変分EMといった既存手法を統一的かつ一般化する一貫したフレームワークとして統合すること。
  • 切断分布による構造的スパarsityを活用することで、潜在変数モデルにおける実用的でスケーラブルな推論と学習を可能にすること。

提案手法

  • 状態空間の部分集合内で真の事後分布に比例し、それ以外ではゼロである切断変分分布を提案する。
  • これらの切断分布のサポート(定義域)を学習可能なパラメータとみなすことにより、モデルパラメータと変分サポートの両方の最適化を可能にする。
  • 切断分布の下で変分下界(自由エネルギー)の簡潔で効率的に計算可能な表現を導出する。
  • 標準EMにおけるモデルパラメータの更新式が、切断変分フレームワーク下でも有効であることを確立する。
  • 繰り返しEステップおよびMステップを実行するメタアルゴリズムを導入し、切断事後分布を用いることで変分下界の単調増加を保証する。
  • ゼロ確率状態を扱うために部分的Eステップおよび補助分布を適用し、正の確率とゼロ確率の両方を含む混合ケースにおいても収束を保証する。

実験結果

リサーチクエスチョン

  • RQ1離散的 latent 変数を伴うモデルにおいて、変分EMをより効率的にしながらも正確性を維持することは可能か?
  • RQ2切断分布を、完全事後分布とMAP近似の両者に対する原理的代替として用いることは可能か?
  • RQ3切断分布を用いる場合に、変分下界に対してどのような数学的保証を提供できるか?
  • RQ4提案されたフレームワークは、標準EMおよびハードEMといった既存手法とどのように関係し、一般化されるか?
  • RQ5一部の変分分布がゼロ確率状態を含む場合でも、変分下界の単調最適化をフレームワークがサポートできるか?

主な発見

  • 切断分布における変分下界は、迅速な最適化を可能にする簡潔で効率的に計算可能な式として与えられる。
  • 最適化中に変分下界が単調に増加することをフレームワークが保証し、局所的最大値への収束を保証する。
  • 各潜在状態の部分集合がMAP状態のみを含む場合、ハードEMはTV-EMの特別なケースとして正式に回復される。
  • 対数尤度と切断自由エネルギーの差が、切断変分分布と真の事後分布とのKLダイバージェンスの和に等しいことが示された。
  • この手法は、標準EM(完全事後分布)とハードEM(MAP状態)の間を自然に補間し、正確性と効率性の連続的トレードオフを提供する。
  • 理論的フレームワークは、深層生成モデルや時系列モデルを含む、任意の離散的 latent 変数を伴う有向グラフィカルモデルに適用可能である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。