Skip to main content
QUICK REVIEW

[論文レビュー] Implicit Reparameterization Gradients

Michael Figurnov, Shakir Mohamed|arXiv (Cornell University)|May 22, 2018
Neural Networks and Applications参考文献 7被引用数 63
ひとこと要約

暗黙の再パラメータ化勾配を、暗黙的微分に基づいて導入し、標準的な再パラメータ化トリックが機能しない数値的に扱いやすいCDFを持つ連続分布(例:Gamma、Beta、Dirichlet、von Mises)を対処する。さらに、さまざまな応用でより速く、より正確な勾配を示す。

ABSTRACT

By providing a simple and efficient way of computing low-variance gradients of continuous random variables, the reparameterization trick has become the technique of choice for training a variety of latent variable models. However, it is not applicable to a number of important continuous distributions. We introduce an alternative approach to computing reparameterization gradients based on implicit differentiation and demonstrate its broader applicability by applying it to Gamma, Beta, Dirichlet, and von Mises distributions, which cannot be used with the classic reparameterization trick. Our experiments show that the proposed approach is faster and more accurate than the existing gradient estimators for these distributions.

研究の動機と目的

  • 古典的な再パラメータ化トリックに適した分布を超えて、パスワイズ勾配推定を動機づけ、拡張する。
  • 標準化関数の反転を避ける暗黙的微分に基づく勾配手法を開発する。
  • 困難な連続分布に対して、既存の推定量よりも計算上の改善と精度の向上を示す。

提案手法

  • 標準化関数を分布パラメータについて微分し、暗黙微分を適用して標準化を反転せずに dz/dphi を求めることにより、暗黙の再パラメータ化勾配を定式化する。
  • ∇_phi z = - (∇_z S_phi(z))^{-1} ∇_phi S_phi(z) を示し、標準化関数の導関数だけを用いて勾配を計算できるようにする。
  • 一変量分布に対してCDFを普遍的な標準化関数として用い、∇_phi z = - (∇_phi F(z|phi)) / q_phi(z) を得る。
  • 多変量分布へは、逐次(条件付き)コップラ基づく変換 S_phi(z) = (F(z1|phi), F(z2|z1,phi), ..., FD(zD|z1,...,zD-1,phi)) に拡張する。
  • 自動微分を活用してCDFおよび標準化関数の必要な導関数を計算し、数値的に扱いやすい勾配を可能にする。
  • 実用的なアルゴリズム手順を示し、分布間で暗黙勾配と明示的再パラメータ化を比較する。

実験結果

リサーチクエスチョン

  • RQ1閉じた形の逆CDFを持たない連続分布に対して、暗黙の再パラメータ化勾配はバイアスのない低分散の勾配を提供できるか?
  • RQ2暗黙勾配は Gamma、Beta、Dirichlet、von Mises のような分布に対して、既存の推定量よりも速度と精度の利点を提供するか?
  • RQ3潜在Dirichlet割当てや非正規分布の潜在変数を持つ変分オートエンコーダーなどの応用で、暗黙アプローチはどのように機能するか?
  • RQ4CDFベースの標準化は、このフレームワークにおける一変量および多変量分布の実用的な普遍的選択か。

主な発見

  • 暗黙的勾配は、扱いやすいCDFを持つ分布のパラメータに対する期待値の勾配の無偏推定をもたらす。
  • この手法は、いくつかの困難な分布に対して、既存の推定量よりも速く、より正確な勾配をもたらす。
  • このアプローチは Latent Dirichlet Allocation のブラックボックス・アモータイズ推論を可能にし、Gamma、Beta、von Mises の潜在変数を持つ VAE の訓練に適用できる。
  • 暗黙の方法は標準化関数の反転を必要とせず、CDFに対して自動微分を活用できる。
  • 彼らは、より広い文脈で高分散のスコア関数推定量を回避する一般的な枠組みを提供する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。