QUICK REVIEW

[논문 리뷰] Neural Stochastic Differential Equations: Deep Latent Gaussian Models in the Diffusion Limit

Belinda Tzen, Maxim Raginsky|arXiv (Cornell University)|2019. 05. 23.

Model Reduction and Neural Networks인용 수 54

한 줄 요약

이 논문은 neural SDE를 딥 잠재 가우시안 모델의 확산 한계로서 개발하고, Wiener 공간 자동 미분(Wiener-space AD)과 Girsanov 재매개화를 이용한 엔드-투-엔드 학습용 변분 추론 프레임워크를 제시한다.

ABSTRACT

In deep latent Gaussian models, the latent variable is generated by a time-inhomogeneous Markov chain, where at each time step we pass the current state through a parametric nonlinear map, such as a feedforward neural net, and add a small independent Gaussian perturbation. This work considers the diffusion limit of such models, where the number of layers tends to infinity, while the step size and the noise variance tend to zero. The limiting latent object is an It\\^o diffusion process that solves a stochastic differential equation (SDE) whose drift and diffusion coefficient are implemented by neural nets. We develop a variational inference framework for these \ extit{neural SDEs} via stochastic automatic differentiation in Wiener space, where the variational approximations to the posterior are obtained by Girsanov (mean-shift) transformation of the standard Wiener process and the computation of gradients is based on the theory of stochastic flows. This permits the use of black-box SDE solvers and automatic differentiation for end-to-end inference. Experimental results with synthetic data are provided.

연구 동기 및 목표

연속 시간 동역학으로의 확산 한계를 통해 딥 잠재 가우시안 모델(DLGMs)을 확장하려는 동기 부여.
드리프트와 확산이 신경망에 의해 구현되는 신경 SDE를 정의한다.
Wiener 측도와 Girsanov 재매개화를 이용한 경로 공간에서의 변분 추론 프레임워크를 개발한다.
블랙박스 SDE 해석기를 이용한 엔드-투-엔드 학습과 자동 미분을 가능하게 한다.

제안 방법

잠재 난수를 Wiener 과정으로 표현하고 잠재 공간을 Wiener 측도하의 Wiener 공간으로 형식화한다.
경로 공간에서 Gibbs 변분 원리를 통해 주변 로그가능도에 대한 변분 경계를 도출하고 사후 근사치를 평균 이동( Girsanov)과 연결한다.
관찰 의존형 신경망 드리프트를 Wiener 과정에 추가한 평균장 변분 가족을 제안한다.
블랙박스 SDE 해석기를 이용한 자동 미분으로 Wiener 공간에서 기울기를 계산하는 방법을 설명한다.
두 가지 기울기 추정 접근법을 논의한다: 해결 후 미분(Euler backprop)과 미분 후 해결(경로 기반 도함수, 확률 흐름을 통한 경로 의 도함수).
확산 한계에서 neural SDE를 DLGM과 연결하고 기존의 신경 ODE 프레임워크와의 연계를 설명한다.

실험 결과

연구 질문

RQ1신경 SDE가 DLGM 구조의 확산 한계를 통해 목표 분포를 표현적으로 근사할 수 있는가?
RQ2Girsanov 재매개화를 이용해 경로 공간에서 신경 SDE에 대한 변분 추론을 어떻게 형식화할 수 있는가?
RQ3블랙박스 SDE 해석기를 통해 역전파를 수행하여 신경 SDE를 엔드-투-엔드로 학습하기 위한 실용적 전략은 무엇인가?
RQ4확률 흐름이 신경 SDE 매개변수에 대한 경로 기반 도함수를 가능하게 하는 역할은 무엇인가?

주요 결과

신경 SDE는 드리프트와 확산이 신경망에 의해 구현된 확산 과정으로 목표 분포를 표현할 수 있다.
경로 공간 Gibbs 원리와 Girsanov 재매개화를 사용하여 주변 가능도에 대한 변분 경계가 얻어진다.
기울기 계산은 Wiener 공간에서 자동 미분으로 블랙박스 SDE 해석기를 통해 수행할 수 있으며, Euler 역전파 또는 경로 기반 미분 중 하나를 사용할 수 있다.
이 접근법은 신경 SDE에서 엔드-투-엔드 변분 추론을 위해 블랙박스 SDE 해석기를 활용하는 프레임워크를 제공한다.
신경 SDE와 DLGM 확산 한계 사이의 연관성을 도출하고, 신경 ODE 개념을 확률적 연속 시간 모델로 확장한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.