[論文レビュー] Cross-Scale Internal Graph Neural Network for Image Super-Resolution
本論文は IGNN を紹介する。クロススケールの内部グラフニュートラルネットワークで、クロススケールのパッチ再発を利用して HR ヒントを LR パッチへ伝え、単一画像超解像を改善する。
Non-local self-similarity in natural images has been well studied as an effective prior in image restoration. However, for single image super-resolution (SISR), most existing deep non-local methods (e.g., non-local neural networks) only exploit similar patches within the same scale of the low-resolution (LR) input image. Consequently, the restoration is limited to using the same-scale information while neglecting potential high-resolution (HR) cues from other scales. In this paper, we explore the cross-scale patch recurrence property of a natural image, i.e., similar patches tend to recur many times across different scales. This is achieved using a novel cross-scale internal graph neural network (IGNN). Specifically, we dynamically construct a cross-scale graph by searching k-nearest neighboring patches in the downsampled LR image for each query patch in the LR image. We then obtain the corresponding k HR neighboring patches in the LR image and aggregate them adaptively in accordance to the edge label of the constructed graph. In this way, the HR information can be passed from k HR neighboring patches to the LR query patch to help it recover more detailed textures. Besides, these internal image-specific LR/HR exemplars are also significant complements to the external information learned from the training dataset. Extensive experiments demonstrate the effectiveness of IGNN against the state-of-the-art SISR methods including existing non-local networks on standard benchmarks.
研究の動機と目的
- SISR において内部の画像固有のクロススケールパッチ再発を活用してより細かな質感を回復する動機づけ。
- ダウンサンプリングされた参照から HR パッチを集約する、クロススケールのグラフベースモジュール(GraphAgg)を提案する。
- GraphAgg をIGNN バックボーンに統合し、クロススケール近傍から LR クエリへ HR 情報を伝達する。
- 内部のクロススケールの手がかいは外部のトレーニングデータを補完し、標準ベンチマークで SR 性能を向上させることを示す。
提案手法
- ダウンサンプリングされた LR 画像内の各 LR パッチの k 最近傍を見つけることにより、動的にクロススケールグラフ Gk を構築する。
- エッジラベルに条件付けられた k 個の HR パッチを集約して、エッジ条件付きネットワーク (ECN) によって強化された LR 特徴 F'L を生成する。
- 集約前に AdaPN を用いて LR と HR 隣接パッチ間の低周波統計を整合させる。
- 集約された HR 特徴を LR 解像度に合わせて埋め込み、スキップ接続を介して LR 特徴と融合する。
- バックボーン IGNN は EDSR 上に構築される。GraphAgg は 16 番目の残差ブロックの後に挿入され、小さな ECN/DEN サブネットワークを使用する。
実験結果
リサーチクエスチョン
- RQ1クロススケール再発パッチは SISR における LR から HR への再構成を改善する意味のある高解像度手がかりを提供できるか。
- RQ2グラフベースのクロススケール集約は SR のための同一スケールの非局所法または KNN ベース法より優れているか。
- RQ3AdaPN と ECN の要素はクロススケールパッチ集約の質と頑健性にどのように影響するか。
- RQ4バックボーンのどこにクロススケール GraphAgg が SR 性能に最も有益か。
- RQ5主要なハイパーパラメータ(k, ウィンドウサイズ d)の IGNN の性能と効率への影響は。
主な発見
| 方法 | スケール | Set5 PSNR | Set5 SSIM | Set14 PSNR | Set14 SSIM | BSD100 PSNR | BSD100 SSIM | Urban100 PSNR | Urban100 SSIM | Manga109 PSNR | Manga109 SSIM |
|---|---|---|---|---|---|---|---|---|---|---|---|
| IGNN (Ours) | x2 | 38.24 | 0.9613 | 34.07 | 0.9217 | 32.41 | 0.9025 | 33.23 | 0.9383 | 39.35 | 0.9786 |
| IGNN+ (Ours) | x2 | 38.31 | 0.9616 | 34.18 | 0.9222 | 32.46 | 0.9030 | 33.42 | 0.9396 | 39.54 | 0.9790 |
| IGNN (Ours) | x3 | 34.72 | 0.9298 | 30.66 | 0.8484 | 29.31 | 0.8105 | 29.03 | 0.8696 | 34.39 | 0.9496 |
| IGNN+ (Ours) | x3 | 34.84 | 0.9305 | 30.75 | 0.8496 | 29.37 | 0.8115 | 29.20 | 0.8721 | 34.67 | 0.9509 |
| IGNN (Ours) | x4 | 32.57 | 0.8998 | 28.85 | 0.7891 | 27.77 | 0.7434 | 26.84 | 0.8090 | 31.28 | 0.9182 |
| IGNN+ (Ours) | x4 | 32.71 | 0.9011 | 28.96 | 0.7908 | 27.84 | 0.7447 | 27.04 | 0.8128 | 31.59 | 0.9207 |
- IGNN は標準ベンチマークで最先端の CNN ベース SR 手法および既存の非局所ネットワークを上回る。
- クロススケール GraphAgg は、内部の LR 類似性だけでなく、ダウンサンプリングされた参照からの HR 手がかりを活用することで SR の顕著な向上を提供する。
- Adaptive Patch Normalization および Edge-Conditioned サブネットワークは、集約の頑健性を大幅に改善し、色/明るさの不一致を低減する。
- GraphAgg をバックボーンの中央(16 ブロック後)に配置することで最大の性能向上を得る。
- Self-ensemble IGNN+ により、スケール間の PSNR/SSIM がさらに向上する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。