[論文レビュー] Learning the Degradation Distribution for Blind Image Super-Resolution
この論文は、ブラーとノイズを確率的変数として扱い、それらの分布を学習して blind SR の多様な LR 画像を合成し、SR性能を向上させる確率的劣化モデル(PDM)を提案します。
Synthetic high-resolution (HR) \& low-resolution (LR) pairs are widely used in existing super-resolution (SR) methods. To avoid the domain gap between synthetic and test images, most previous methods try to adaptively learn the synthesizing (degrading) process via a deterministic model. However, some degradations in real scenarios are stochastic and cannot be determined by the content of the image. These deterministic models may fail to model the random factors and content-independent parts of degradations, which will limit the performance of the following SR models. In this paper, we propose a probabilistic degradation model (PDM), which studies the degradation $\mathbf{D}$ as a random variable, and learns its distribution by modeling the mapping from a priori random variable $\mathbf{z}$ to $\mathbf{D}$. Compared with previous deterministic degradation models, PDM could model more diverse degradations and generate HR-LR pairs that may better cover the various degradations of test images, and thus prevent the SR model from over-fitting to specific ones. Extensive experiments have demonstrated that our degradation model can help the SR model achieve better performance on different datasets. The source codes are released at \url{git@github.com:greatlog/UnpairedSR.git}.
研究の動機と目的
- Synthetic と real LR 画像間の領域ギャップの低減を blind SR で動機づける。
- Kernel とノイズの確率変数を用いて劣化を分布としてモデル化する確率的劣化モデル(PDM)を提案する。
- PDM が生成する LR-HR ペアが複数データセットで SR 性能を向上させることを示す。
- PDM を SR モデルと統合すると主流ベンチマークで最新成果を達成できる。
提案手法
- 劣化を線形過程としてモデル化する:D(x) = (x ⊗ k) ↓ s + n.
- 潜在変数 z_k をブラーカーネル k に写像するカーネルモジュールに劣化を分解する。
- 潜在変数 z_n(オプションで y_clean)をノイズ n に写像するノイズモジュールに劣化を分解する。
- p(D) = p(k)p(n) を仮定し、PatchGAN 判別器による敵対的学習で学習する。
- PDM と SR モデルを同時に訓練する統一的な PDM-SR フレームワークを提供する(PDM-SR または PDM-SRGAN)。
- 生成されたノイズの正則化項を含めて訓練を安定化させる。
実験結果
リサーチクエスチョン
- RQ1ブラインド SR で劣化を決定論的な写像として捉えるより分布として捉える方が良いか。
- RQ2確率的劣化モデルは実世界の劣化のカバレッジを改善し、SR 性能を向上させるか。
- RQ3ブラーとノイズの画像内容への依存性を最適な SR 結果のためにどのようにモデル化すべきか。
主な発見
| 手法 | 2017Track2 PSNR | 2017Track2 SSIM | 2017Track2 LPIPS | 2018Track2 PSNR | 2018Track2 SSIM | 2018Track2 LPIPS | 2018Track4 PSNR | 2018Track4 SSIM | 2018Track4 LPIPS | 2020Track1 PSNR | 2020Track1 SSIM | 2020Track1 LPIPS |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Bicubic | 21.73 | 0.5731 | 0.5430 | 20.58 | 0.5304 | 0.7929 | 20.26 | 0.5101 | 0.7970 | 25.51 | 0.6731 | 0.6414 |
| EDSR [23] | 21.58 | 0.5646 | 0.4697 | 20.43 | 0.5045 | 0.7778 | 20.07 | 0.4771 | 0.7831 | 25.34 | 0.6391 | 0.6074 |
| DSGAN-SR [12] | 20.18 | 0.5165 | 0.4314 | 20.67 | 0.5829 | 0.5293 | 20.26 | 0.4402 | 0.5381 | 23.29 | 0.6631 | 0.3295 |
| CinCGAN [7] | 19.04 | 0.4451 | 0.3847 | 20.10 | 0.4631 | 0.4748 | 20.09 | 0.4680 | 0.4903 | 21.70 | 0.5814 | 0.3386 |
| CycleSR [8] | 20.70 | 0.5242 | 0.4798 | 21.36 | 0.5291 | 0.6390 | 20.65 | 0.4980 | 0.6574 | 25.48 | 0.7259 | 0.3641 |
| Maeda et al. [30] | 19.23 | 0.4754 | 0.3667 | 19.90 | 0.4728 | 0.4897 | 18.57 | 0.4085 | 0.5322 | 20.06 | 0.5368 | 0.4074 |
| Bulat et al. [4] | 19.84 | 0.5020 | 0.4115 | 20.27 | 0.4488 | 0.6668 | 20.91 | 0.5408 | 0.5918 | 21.49 | 0.5553 | 0.4935 |
| PDM-SRGAN | 23.43 | 0.6412 | 0.2475 | 20.32 | 0.5257 | 0.4074 | 20.25 | 0.5307 | 0.4415 | 24.56 | 0.6630 | 0.2716 |
| PDM-SR | 23.69 | 0.6725 | 0.3427 | 20.85 | 0.5870 | 0.5240 | 20.32 | 0.5611 | 0.5282 | 26.80 | 0.7470 | 0.3601 |
- PDM-SR および PDM-SRGAN は複数のベンチマークで競合的な最新成果を達成し、しばしば SSIM および LPIPS が優れている。特に 2017Track2 データセットで顕著な改善が見られる。
- PDM–SR はベースラインや他の学習ベース劣化法と比べて PSNR の改善が大きく、LPIPS が低い。
- ランダム化されたカーネルとノイズの組み合わせ(z_k と z_n)の Ablation により最良の性能を示す。
- ブラーの内容非依存性およびノイズの部分的内容依存性は、検証データセットでは一般的により良い結果をもたらす。
- 学習された劣化は多様で非ガウス的なカーネルとカラフルなノイズとして視覚化され、より豊富な LR 合成を可能にする。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。