Skip to main content
QUICK REVIEW

[論文レビュー] Variational Sequential Monte Carlo

Christian A. Naesseth, Scott W. Linderman|arXiv (Cornell University)|May 31, 2017
Gaussian Processes and Bayesian Inference参考文献 47被引用数 49
ひとこと要約

本稿では、変分推論と逐次モンテカルロを組み合わせることで、柔軟で正確かつスケーラブルなベイズ推論を可能にする、新たな変分推論フレームワークである変分逐次モンテカルロ(vSMC)を提案する。SMCの提案分布パラメータを変分パラメータとして扱い、下界に対する確率的勾配上昇法により最適化することで、特に長時間スパンを持つ複雑な逐次モデルにおいて、IWAE や構造的 VI よりもタイトな証拠下界を達成する。

ABSTRACT

Many recent advances in large scale probabilistic inference rely on variational methods. The success of variational approaches depends on (i) formulating a flexible parametric family of distributions, and (ii) optimizing the parameters to find the member of this family that most closely approximates the exact posterior. In this paper we present a new approximating family of distributions, the variational sequential Monte Carlo (VSMC) family, and show how to optimize it in variational inference. VSMC melds variational inference (VI) and sequential Monte Carlo (SMC), providing practitioners with flexible, accurate, and powerful Bayesian inference. The VSMC family is a variational family that can approximate the posterior arbitrarily well, while still allowing for efficient optimization of its parameters. We demonstrate its utility on state space models, stochastic volatility models for financial data, and deep Markov models of brain neural circuits.

研究の動機と目的

  • 状態空間モデルやディープマーカーモデルのような複雑な逐次モデルにおける、柔軟で正確な変分推論手法の開発。
  • 長時間スパンの時系列における標準的変分推論や重要度重み付きオートエンコーダ(IWAE)の限界を克服し、事後分布の近似精度を向上させること。
  • 粒子数による計算コストと近似精度のトレードオフを原理的かつ一貫した方法で可能にすること。
  • SMC の提案分布を変分原理を用いて最適化することで、収束性と事後分布推定の質を向上させること。

提案手法

  • 各分布がパラメトリックな提案分布を伴う SMC 実行に対応する新たな変分族 vSMC を提案する。
  • SMC の提案分布パラメータを変分パラメータとして扱い、変分下界に対する確率的勾配上昇法により最適化する。
  • vSMC のための微分可能な下界(ELBO)を導出する。この下界は IWAE の下界を一般化し、エンドツーエンドの学習を可能にする。
  • SMC からの重み付き粒子軌道を、変分近似からのサンプルとして用いる。最終的な重みに従い、1つの粒子が選択される。
  • 再パラメトリゼーション勾配を用いて、確率的要因が存在する中でも提案分布パラメータの効率的最適化を可能にする。
  • アンモアタイズドおよび非アンモアタイズド推論を両方サポートし、深層モデルにおける複雑な提案分布のスケーラブルな学習を可能にする。

実験結果

リサーチクエスチョン

  • RQ1SMC を基礎とする変分族は、IWAE や構造的 VI よりも逐次モデルにおけるタイトな証拠下界を達成できるか?
  • RQ2vSMC の性能は粒子数にどのように依存するか?また、シーケンス長が延びるに従い、IWAE よりも優位性を維持できるか?
  • RQ3確率的ボラティリティモデルおよびディープマーカーモデルにおいて、vSMC はベースライン手法よりも効率的かつ正確な提案分布を学習できるか?
  • RQ4実世界の時系列データにおいて、ELBO と計算効率の両面で vSMC は IWAE をどの程度上回るか?
  • RQ5非線形ダイナミクスと高次元観測を持つ複雑なニューラル回路モデルに対しても、vSMC は効果的に適用可能か?

主な発見

  • 為替レートデータ119か月分の確率的ボラティリティモデルにおいて、vSMC は粒子数 N=16 の条件下で ELBO 6936.6 を達成し、IWAE(6913.3)および構造的 VI(6905.1)を上回った。
  • vSMC は粒子数の増加に伴い ELBO が著しく向上したが、IWAE は速やかに飽和した。これは、vSMC が N に対して優れたスケーラビリティを示していることを示している。
  • マカクザル運動皮質データのディープマーカーモデルにおいて、vSMC は IWAE と同等の ELBO を達成したが、収束が速く、学習効率が向上していた。
  • vSMC は長期間にわたり、高重量の多様な粒子を維持しており、標準的インポートランスサンプリングや IWAE が直面する粒子の劣化問題を回避していた。
  • トゥイガウシアン状態空間モデルにおいて、vSMC はほぼ真の周辺尤度に近い値を達成し、複雑な事後分布を正確に近似できる能力を示した。
  • vSMC は IWAE の下界を一般化しており、リサンプリングを省略した場合、IWAE は vSMC 下界の特別な場合であることが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。