Skip to main content
QUICK REVIEW

[論文レビュー] Self-Consistent Recursive Diffusion Bridge for Medical Image Translation

Fuat Arslan, Bilal Kabaş|arXiv (Cornell University)|May 10, 2024
Brain Tumor Detection and Classification被引用数 13
ひとこと要約

SelfRDBは、ノイズを加えたソースを終点として用いるフォワード過程と、自己整合的な再帰的リバース過程を備えたディフュージョンブリッジフレームワークを導入し、優れたマルチモーダル医用画像翻訳(MRI-CT、マルチコントラストMRI)を達成します。

ABSTRACT

Denoising diffusion models (DDM) have gained recent traction in medical image translation given improved training stability over adversarial models. DDMs learn a multi-step denoising transformation to progressively map random Gaussian-noise images onto target-modality images, while receiving stationary guidance from source-modality images. As this denoising transformation diverges significantly from the task-relevant source-to-target transformation, DDMs can suffer from weak source-modality guidance. Here, we propose a novel self-consistent recursive diffusion bridge (SelfRDB) for improved performance in medical image translation. Unlike DDMs, SelfRDB employs a novel forward process with start- and end-points defined based on target and source images, respectively. Intermediate image samples across the process are expressed via a normal distribution with mean taken as a convex combination of start-end points, and variance from additive noise. Unlike regular diffusion bridges that prescribe zero variance at start-end points and high variance at mid-point of the process, we propose a novel noise scheduling with monotonically increasing variance towards the end-point in order to boost generalization performance and facilitate information transfer between the two modalities. To further enhance sampling accuracy in each reverse step, we propose a novel sampling procedure where the network recursively generates a transient-estimate of the target image until convergence onto a self-consistent solution. Comprehensive analyses in multi-contrast MRI and MRI-CT translation indicate that SelfRDB offers superior performance against competing methods.

研究の動機と目的

  • 標準の拡散モデルを超えた、ソースとターゲット modality 間の医用画像翻訳の改善を動機づける。
  • 一般化と情報伝達を高めるために、ソフトプライオリティを持つ終点を備えた拡散ブリッジを提案して、一般化と情報伝達を強化する。
  • リバースステップの精度を向上させる自己整合的再帰サンプリング機構を導入する。

提案手法

  • ソースターゲットの凸結合を用いたフォワード過程: x_t ~ N(mu_x0,t x0 + mu_y,t y, sigma_t^2 I) で、終点(ノイズを加えたソース)へ向かって sigma_t^2 を単調増加させる。
  • 終点は硬いソースサンプルではなくノイズを加えたソース画像 x_T = y_epsilon である。
  • 逆過程は回復ネットワーク G_theta を用いて、自己整合的なターゲット推定 x0~* を反復的に生成し、後方分布 q(x_{t-1}|x_t,y,x0~*) から x_{t-1} をサンプルする。
  • 自己整合再帰: x0~{r+1} = G_theta(x_t,t,y,x0~{r}) が x0~* に収束するまで; その後 x0~* を用いて q から x_{t-1} をサンプルする。
  • 敵対的識別器 D_theta はリバースステップのサンプルの現実性を導き、ピクセル単位のL1損失が回復された x0~* を真の x0 に一致させる。

実験結果

リサーチクエスチョン

  • RQ1ソフトプライオリティの終点を持つ拡散ブリッジは、ソース画像とターゲット画像間の跨モダリティ翻訳を改善できるか?
  • RQ2自己整合的再帰サンプリング方式は、マルチモーダル翻訳における中間サンプルの精度と現実感を高めるか?
  • RQ3SelfRDB は、GANsおよび拡散ベースのベースラインと比較して、マルチコントラストMRIおよびMRI-CT翻訳でどのように性能を示すか?
  • RQ4未知のソース画像への一般化に対する終点ノイズレベルと前方分散スケジューリングの影響は何か?

主な発見

  • SelfRDBは、マルチコントラストMRIおよびMRI-CTタスク全般で、競合手法(GANsおよび拡散モデル)を上回る翻訳性能を達成する。
  • 終点ノイズの単調増加スケジュールは、ソースモダリティの硬直した事前情報を緩和することで一般化を向上させる。
  • 自己整合的再帰サンプリング手続きは、逆ステップの推定をより正確にし、より良い画像合成を生み出す。
  • IXI、BRATS、および骨盤MRI-CTデータセットで、SelfRDBは SynDiff、DDPM、I2SB、pix2pix のベースラインより高い PSNR と SSIM を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。