Skip to main content
QUICK REVIEW

[論文レビュー] Stabilizing Diffusion Posterior Sampling by Noise--Frequency Continuation

Feng Tian, Yixuan Li|arXiv (Cornell University)|Jan 30, 2026
Advanced Neuroimaging Techniques and Applications被引用数 0
ひとこと要約

ノイズと周波数の連続性フレームワークを導入し、ノイズ依存の周波数帯における測定の一貫性を保証することで、悪条件の逆問題における拡散後処理の安定性とディテール回復を向上させる。

ABSTRACT

Diffusion posterior sampling solves inverse problems by combining a pretrained diffusion prior with measurement-consistency guidance, but it often fails to recover fine details because measurement terms are applied in a manner that is weakly coupled to the diffusion noise level. At high noise, data-consistency gradients computed from inaccurate estimates can be geometrically incongruent with the posterior geometry, inducing early-step drift, spurious high-frequency artifacts, plus sensitivity to schedules and ill-conditioned operators. To address these concerns, we propose a noise--frequency Continuation framework that constructs a continuous family of intermediate posteriors whose likelihood enforces measurement consistency only within a noise-dependent frequency band. This principle is instantiated with a stabilized posterior sampler that combines a diffusion predictor, band-limited likelihood guidance, and a multi-resolution consistency strategy that aggressively commits reliable coarse corrections while conservatively adopting high-frequency details only when they become identifiable. Across super-resolution, inpainting, and deblurring, our method achieves state-of-the-art performance and improves motion deblurring PSNR by up to 5 dB over strong baselines.

研究の動機と目的

  • severe degradations の下での拡散後処理サンプリングの不安定性と細部喪失を解決する。
  • 拡散ノイズレベルを周波数帯域ガイダンスと結びつけ、高ノイズ時の勾配の整合性を回避する。
  • band-limited likelihood guidance と多解像度 Haar ベースの一貫性戦略を用いた実用的なサンプラーを開発する。
  • トレーニング不要設定で、超解像、欠損補完、ブラー除去において強力なベースラインを上回る改善を示す。

提案手法

  • 現在の拡散ノイズレベルに応じて帯域制限された尤度を用いる中間後見(代表的なポステリオル)を連続的に構築する。
  • 完全帯域損失と帯域制限損失をノイズ依存スケジュールで混ぜる周波数ガイド付き測定目的を用いる。
  • 中間後見内で Langevin ダイナミクスを用いて各ノイズレベルで x0 の PF-ODE 推定を洗練させる。
  • 粗い補正を積極的に適用し高周波ディテールの導入を抑制する Haar ベースの多解像度フュージョンを導入する。
  • 二段階プロセスを採用する:帯域制限付きの x0 の精緻化、識別性が向上した後の高周波数の再導入、再ノイズ化と反復。
Figure 1 : Results of Different Sampling Steps. The first and third rows show the estimated image $\boldsymbol{\hat{x}}_{0}$ , while the second and fourth rows show the corresponding noised image $\boldsymbol{x}_{T}$ at different timesteps. Across timesteps, the evaluated outputs preserve a similar
Figure 1 : Results of Different Sampling Steps. The first and third rows show the estimated image $\boldsymbol{\hat{x}}_{0}$ , while the second and fourth rows show the corresponding noised image $\boldsymbol{x}_{T}$ at different timesteps. Across timesteps, the evaluated outputs preserve a similar

実験結果

リサーチクエスチョン

  • RQ1ノイズレベルと周波数帯域を結合することで、劣条件の劣化下での拡散後処理サンプリングの安定性を改善できるか。
  • RQ2 Haar フュージョンと帯域制限尤度ガイダンスを組み合わせると、高周波アーティファクトを抑えつつグローバル構造を保持できるか。
  • RQ3トレーニング特有の調整なしで、超解像・欠損補完・ブラー除去においてどの程度の PSNR/SSIM/LPIPS の向上を達成できるか。
  • RQ4帯域制限付き尤度が導入する意味情報ギャップを多解像度(Haar)の一貫性がどの程度緩和する役割を果たすか。

主な発見

  • 提案されたノイズ–周波数連続フレームワークは、超解像、欠損補完、ブラー除去を含むタスク全般で安定性とディテール回復を向上させる。
  • 帯域制限付き尤度ガイダンスと使用可能周波数内容の徐々の拡張は、初期ドリフトとスケジュールや演算子条件付けへの感度を低減する。
  • Haar領域フュージョンは粗い補正を原理的に確実に適用しつつ高周波ディテールの導入を慎重に行い、アーティファクトを低減する。
  • 実証結果は、 motion deblurring を含むいくつかの設定で最先端の性能を示し、強力なベースラインに対して約5 dB程度の PSNR 増分を達成。
  • この手法は FFHQ および ImageNet データセットで PSNR を改善しつつ、SSIM と LPIPS を堅実に維持する。
Figure 2 : Method Overview. First of all, a pre-trained diffusion model is applied to acquire the estimated $\boldsymbol{\hat{x}}_{0}$ . Second, we optimize $\boldsymbol{\hat{x}}_{0}$ in frequency domain and apply Haar fusion. Afterwards, target features are generated after iteratively sampling, and
Figure 2 : Method Overview. First of all, a pre-trained diffusion model is applied to acquire the estimated $\boldsymbol{\hat{x}}_{0}$ . Second, we optimize $\boldsymbol{\hat{x}}_{0}$ in frequency domain and apply Haar fusion. Afterwards, target features are generated after iteratively sampling, and

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。