[論文レビュー] Rejection Sampling Variational Inference
本稿では、ガンマ分布やディリクレ分布などの受容棄却サンプリングに基づく分布に対して、棄却ステップを微分可能フレームワークに埋め込むことで、変分推論における新しい再パラメータ化勾配法を提案する。低分散勾配推定を可能にすることで、従来の手法と比較して確率的勾配変分推論における収束が高速化される。
Variational inference using the reparameterization trick has enabled large-scale approximate Bayesian inference in complex probabilistic models, leveraging stochastic optimization to sidestep intractable expectations. The reparameterization trick is applicable when we can simulate a random variable by applying a differentiable deterministic function on an auxiliary random variable whose distribution is fixed. For many distributions of interest (such as the gamma or Dirichlet), simulation of random variables relies on acceptance-rejection sampling. The discontinuity introduced by the accept-reject step means that standard reparameterization tricks are not applicable. We propose a new method that lets us leverage reparameterization gradients even when variables are outputs of a acceptance-rejection sampling algorithm. Our approach enables reparameterization on a larger class of variational distributions. In several studies of real and synthetic data, we show that the variance of the estimator of the gradient is significantly lower than other state-of-the-art methods. This leads to faster convergence of stochastic gradient variational inference.
研究の動機と目的
- ガンマ分布やディリクレ分布のような、受容棄却サンプリングを要する分布において、標準的な再パラメータ化勾配の限界を解消すること。
- 棄却ステップを微分可能にすることで、より広い分布のクラスに対して変分推論における確率的最適化を可能にすること。
- 既存の手法と比較して勾配推定器の分散を低減し、確率的勾配変分推論における収束を加速すること。
- 閉形式の逆累積分布関数を必要とせず、受容棄却サンプリングを再パラメータ化勾配と統合する一般的なフレームワークを構築すること。
提案手法
- 棄却判定を連続的かつ微分可能なプロセスとしてモデル化する微分可能再パラメータ化スキームを導入し、棄却インジケータの連続的リラクゼーションを用いる。
- 逆変換法を緩和形で活用し、棄却ステップを受容確率の連続的リラクゼーションによってパラメータ化する。
- 受容インジケータの連続的リラクゼーションを用いることで、バックプロパゲーションを棄却サンプリングプロセス全体に渡って可能にし、勾配計算を可能にする。
- 再パラメータ化による最適化を可能にする一方で、棄却サンプリングの計算効率を維持する。
- 補助変数と受容意思決定を同時に再パラメータ化し、全体のサンプリングプロセスを微分可能な変換として扱う。
実験結果
リサーチクエスチョン
- RQ1ガンマ分布やディリクレ分布のような、受容棄却サンプリングを要する分布に対し、再パラメータ化勾配を拡張することは可能か?
- RQ2受容棄却ステップをどのように微分可能にするか、これにより変分推論における勾配ベース最適化を可能にするか?
- RQ3提案手法は、複雑なモデルにおいて、既存の手法と比較して低分散勾配推定器を提供するか?
- RQ4本手法は、実世界および合成データにおける確率的勾配変分推論の収束速度を向上させることができるか?
主な発見
- 提案手法により、従来の再パラメータ化では取り扱えなかったガンマ分布やディリクレ分布のような分布に対しても再パラメータ化勾配が可能になった。
- 状態の最良手法と比較して、勾配推定器の分散が顕著に低減され、確率的最適化における収束が高速化された。
- 実データおよび合成データにおける実験結果から、変分推論の収束速度と安定性が一貫して向上した。
- 閉形式の逆累積分布関数を必要とせず、元の棄却サンプリングメカニズムを変更することなく、これらの利点を達成した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。