Skip to main content
QUICK REVIEW

[論文レビュー] Neural Stochastic Differential Equations: Deep Latent Gaussian Models in the Diffusion Limit

Belinda Tzen, Maxim Raginsky|arXiv (Cornell University)|May 23, 2019
Model Reduction and Neural Networks参考文献 41被引用数 54
ひとこと要約

本論文は neural SDEs のための変分推定フレームワークを、潜在パスをニューラルネット・パラメータ化されたドリフトと拡散を持つ Wiener 過程として扱うことで開発し、ブラックボックス SDE ソルバーを用いたエンドツーエンド学習を可能にする。

ABSTRACT

In deep latent Gaussian models, the latent variable is generated by a time-inhomogeneous Markov chain, where at each time step we pass the current state through a parametric nonlinear map, such as a feedforward neural net, and add a small independent Gaussian perturbation. This work considers the diffusion limit of such models, where the number of layers tends to infinity, while the step size and the noise variance tend to zero. The limiting latent object is an Itô diffusion process that solves a stochastic differential equation (SDE) whose drift and diffusion coefficient are implemented by neural nets. We develop a variational inference framework for these extit{neural SDEs} via stochastic automatic differentiation in Wiener space, where the variational approximations to the posterior are obtained by Girsanov (mean-shift) transformation of the standard Wiener process and the computation of gradients is based on the theory of stochastic flows. This permits the use of black-box SDE solvers and automatic differentiation for end-to-end inference. Experimental results with synthetic data are provided.

研究の動機と目的

  • 深層潜在ガウスモデルの拡散極限を Itô 拡散として動機づけ、形式化する。
  • パス空間 Gibbs 原理を用いて neural SDEs の変分推論フレームワークを開発する。
  • Girsanov 再パラメータ化と確率的フローを活用して、ブラックボックス SDE ソルバーを用いた勾配ベースの最適化を可能にする。
  • Wiener space における自動微分の方法論を提供し、エンドツーエンド学習を行う。

提案手法

  • 潜在過程を Itô SDE として、ニューラルネット・ドリフトおよび拡散係数を持つモデルにする。
  • Wiener space を潜在空間として用い、パス空間上で Gibbs 変分原理を適用する。
  • Girsanov の定理を適用して、変分後方分布を Wiener 過程の平均シフトと関連付ける。
  • Wiener space における自動微分を用いて SDE ソルバーを介して勾配を計算する。
  • 2つの勾配計算戦略を議論する:solve-then-differentiate(Euler backprop)と differentiate-then-solve(パスワイズ微分)。
  • Föllmer ドリフトをニューラルネットとモンテカルロ推定で近似する方法を記述する。

実験結果

リサーチクエスチョン

  • RQ1 neural SDEs を変分フレームワークで、深層潜在ガウスモデルに類似した推論モードでモデル化できるか?
  • RQ2Girsanov 再パラメータ化と確率的フローはブラックボックス SDE ソルバーと共に実行可能な勾配ベース学習を可能にするか?
  • RQ3連続時間モデル内でニューラ SDE のパラメータに関する勾配を実際的に計算する方法は何か?
  • RQ4拡散極限の見方は、深層確率モデルの表現力と推論にどのような影響を与えるか?

主な発見

  • パス空間における Gibbs 原理を用いた周辺尤度の変分界が確立される。
  • 任意の変分後方分布は、Girsanov の定理の下で標準 Wiener 過程の平均シフトに対応する。
  • Wiener space における自動微分を通じて neural SDE の変分推論を実行できる。
  • 2つの勾配計算戦略を提案する:Solve-then-differentiate(Euler backprop)と differentiate-then-solve(確率的フローによるパスワイズ微分)。
  • ニューラル SDE におけるドリフトと拡散はニューラルネットによって実装可能で、エンドツーエンド微分可能性を保持する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。