Skip to main content
QUICK REVIEW

[논문 리뷰] Diffusion Schrödinger Bridge with Applications to Score-Based Generative Modeling

Valentin De Bortoli, James Thornton|arXiv (Cornell University)|2021. 06. 01.
Slime Mold and Myxomycetes Research참고 문헌 77인용 수 61
한 줄 요약

이 논문은 점수 기반 생성 모델링을 슈뢰딩거 브리지 문제로 재정의하고 Diffusion Schrödinger Bridge (DSB)를 도입한다. 이는 IPF에서 영감을 받은 확산 방법으로 유한 시간 내에 데이터에서 사전로부터 샘플링을 가능하게 하고 수렴 보장을 제공한다.

ABSTRACT

Progressively applying Gaussian noise transforms complex data distributions to approximately Gaussian. Reversing this dynamic defines a generative model. When the forward noising process is given by a Stochastic Differential Equation (SDE), Song et al. (2021) demonstrate how the time inhomogeneous drift of the associated reverse-time SDE may be estimated using score-matching. A limitation of this approach is that the forward-time SDE must be run for a sufficiently long time for the final distribution to be approximately Gaussian. In contrast, solving the Schrödinger Bridge problem (SB), i.e. an entropy-regularized optimal transport problem on path spaces, yields diffusions which generate samples from the data distribution in finite time. We present Diffusion SB (DSB), an original approximation of the Iterative Proportional Fitting (IPF) procedure to solve the SB problem, and provide theoretical analysis along with generative modeling experiments. The first DSB iteration recovers the methodology proposed by Song et al. (2021), with the flexibility of using shorter time intervals, as subsequent DSB iterations reduce the discrepancy between the final-time marginal of the forward (resp. backward) SDE with respect to the prior (resp. data) distribution. Beyond generative modeling, DSB offers a widely applicable computational optimal transport tool as the continuous state-space analogue of the popular Sinkhorn algorithm (Cuturi, 2013).

연구 동기 및 목표

  • 생성 모델링을 긴 순방향 시간 확산의 필요성을 극복하기 위한 슈뢰딩거 브리지 문제로 동기화한다.
  • 점수 기반 확산을 통해 Schrödinger 브리지를 풀 수 있는 실용적 연속-시간 및 반복 프레임워크(DSB)를 개발한다.
  • SGM과 관련된 연속 상태 공간에서 IPF의 이론적 수렴 결과를 제공한다.
  • 표준 이미지 데이터셋에서 생성 모델링 능력을 시연하고 데이터 분포 간 보간을 보여준다.

제안 방법

  • 순방향 및 역방향 확산을 SDE로 형식화하고 그들의 연속 시간 한계를 도출한다.
  • 연속 상태 설정에서 Iterative Proportional Fitting (IPF)을 사용해 Schrödinger bridge를 근사한다.
  • 실제 IPF 유사한 절차로서 forward와 reverse transitions를 점수-매칭으로 반복 정제하는 Diffusion Schrödinger Bridge (DSB)를 도입한다.
  • 점수 함수를 근사하고 회귀 손실(식(26) 및 (27))을 통해 드리프트 수정치를 학습한다.
  • 간단한 가정 하에서 총변이(Total-variation) 한계 및 IPF 단조성을 보이는 이론적 수렴 분석을 제공한다(정리 1 및 관련 명제).
  • 더 짧은 시간 간격으로 데이터에서 샘플링하고 데이터 분포 간 보간을 시연한다.

실험 결과

연구 질문

  • RQ1데이터와 사전분포 간 Schrödinger 브리지를 해결하는 문제로 생성 모델링을 프레이밍할 수 있는가?
  • RQ2연속 상태 공간의 IPF가 데이터 분포를 유한 시간 내에 근사하는 수렴 확산 경로를 생성하는가?
  • RQ3신경망 점수 추정기를 사용하여 점수 기반 확산을 Schrödinger bridge 프레임워크에 어떻게 통합할 수 있는가?
  • RQ4이 설정에서 연속 IPF의 수렴 속도와 특성은 무엇인가?
  • RQ5다중 반복 DSB 절차가 데이터 주변 정합성과 데이터 간 보간을 개선하는가?

주요 결과

  • DSB는 전통적인 장시간의 순방향 확산을 개선하는 유한 시간 확산 기반 Schrödinger 브리지 문제의 해를 제공한다.
  • 첫 번째 DSB 반복은 Song et al. (2021) 방법론을 회복하지만 더 짧은 시간 간격의 유연성으로; 이후 반복은 최종 주변 분포와 타깃 분포 간의 차이를 추가로 줄인다.
  • 이 논문은 연속 상태 공간에서의 IPF의 양적 수렴 결과를 컴팩트를 필요로 하지 않고 제공하고, 반복의 KL 및 총변이에 대한 단조성도 증명한다.
  • DSB는 연속 시간 IPF로 볼 수 있으며, 번길 Algorithm 1은 브리지를 근사하기 위해 순방향 및 역방향 네트워크 업데이트를 교대로 수행하는 실용적 알고리즘이다.
  • 실험은 MNIST와 CelebA에서의 이미지 생성을 시연하고, 다중 DSB 단계가 일관되게 생성 성능을 향상시키고 데이터 분포 간의 보간을 가능하게 함을 보여준다.
  • 이 프레임워크는 계산적 최적 운송에 대한 Sinkhorn 알고리즘의 연속 상태 유사체를 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.