Skip to main content
QUICK REVIEW

[論文レビュー] Stein Variational Gradient Descent: A General Purpose Bayesian Inference Algorithm

Qiang Liu, Dilin Wang|arXiv (Cornell University)|Aug 16, 2016
Gaussian Processes and Bayesian Inference参考文献 33被引用数 325
ひとこと要約

SVGD は、RKHS における関数勾配降下によって粒子の集合をターゲット分布へ移動させ、一般目的の変分推論法を提供し、1つの粒子で MAP に収束する。

ABSTRACT

We propose a general purpose variational inference algorithm that forms a natural counterpart of gradient descent for optimization. Our method iteratively transports a set of particles to match the target distribution, by applying a form of functional gradient descent that minimizes the KL divergence. Empirical studies are performed on various real world models and datasets, on which our method is competitive with existing state-of-the-art methods. The derivation of our method is based on a new theoretical result that connects the derivative of KL divergence under smooth transforms with Stein's identity and a recently proposed kernelized Stein discrepancy, which is of independent interest.

研究の動機と目的

  • 多様なモデルと大規模データセットに対応できる、一般的で使いやすい変分推論ツールの必要性を動機づける。
  • 逐次的ではなく、 explicit normalization constants を必要とせずに KL 発散を最適化する粒子ベースの変分フレームワークを開発する。
  • kernelized Stein discrepancy と RKHS を用いて閉形式の最適摂動方向を導出する。
  • 勾配降下を模倣し、モデル特有の VI 法を超えてスケールする実装可能なアルゴリズムを提供する。

提案手法

  • 変分ファミリーを、基準分布からの変換サンプル z=T(x) として表現する。
  • 小さな摂動 T(x)=x+εφ(x) を用い、Stein の恒等式を適用して KL 導出を Stein 演算子と関連付ける。
  • kernelized Stein discrepancy (KSD) を定義し、RKHS における閉形式の最適摂動 φ* を得る。
  • 最急降下方向 φ* は φ*_{q,p}(·)=E_{x~q}[k(x,·)∇_x log p(x)+∇_x k(x,·)] であることを導く。
  • 実用的な SVGD 更新 x_i^{ℓ+1} = x_i^ℓ + ε_ℓ φ̂^*(x_i^ℓ) を、粒子から推定された φ̂^*(x) を用いて提供する。
  • ∇_x log p のミニバッチ処理や核行列の処理を含む計算上の考慮事項を検討する。

実験結果

リサーチクエスチョン

  • RQ1正規化定数 Z を計算せずに、滑らかな変換を介して KL 発散をどう最小化できるか?
  • RQ2与えられた現在の分布に対して KL 発散の最も急な下降を生む RKHS における最適な摂動方向は何か?
  • RQ3単純で汎用的な粒子ベースの変分法は、さまざまなベイズモデルで競争力の性能を達成できるか?
  • RQ4単一粒子を用いたときに SVGD は MAP とどのように関連するか、複数粒子でどのようにスケールするか?
  • RQ5大規模データセット上で SVGD を実装する際の実践的な考慮事項(帯域幅、バッチ処理、効率性)は何か?

主な発見

  • 提案されたアルゴリズムは、 toy および実世界のモデルにおいて最先端手法と競合する結果を示す。
  • 単一粒子では、SVGD は MAP の勾配上昇に縮小し、従来の VI を超えた一般化を示している。
  • 粒子更新は、高確率領域への平滑化された勾配と、多様性を保つための反発項を組み合わせる。
  • Kernelized Stein discrepancy は、RKHS 単位球内での KL 最急降下の原理的かつ閉形式の方向を提供する。
  • ミニバッチ勾配推定と並列可能な粒子更新を通じて効率が得られ、SVGD は大規模データセットに対してスケーラブルである。
  • SVGD のコードは著者のリポジトリで公開されている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。