Skip to main content
QUICK REVIEW

[論文レビュー] Deep Stacked Hierarchical Multi-patch Network for Image Deblurring

Hongguang Zhang, Yuchao Dai|arXiv (Cornell University)|Apr 6, 2019
Advanced Image Processing Techniques参考文献 29被引用数 41
ひとこと要約

本論文は、非均一なブラーをデブラーするために細部から粗部へ非重複パッチ階層を用いる Deep Multi-Patch Hierarchical Network (DMPHN) を提案し、リアルタイムの720pデブラーリングとGoProでのPSNR/SSIMの最先端を達成する。また、Stack-DMPHN, Stack-VMPHN といったスタック版を提案し、性能をさらに向上させる。

ABSTRACT

Despite deep end-to-end learning methods have shown their superiority in removing non-uniform motion blur, there still exist major challenges with the current multi-scale and scale-recurrent models: 1) Deconvolution/upsampling operations in the coarse-to-fine scheme result in expensive runtime; 2) Simply increasing the model depth with finer-scale levels cannot improve the quality of deblurring. To tackle the above problems, we present a deep hierarchical multi-patch network inspired by Spatial Pyramid Matching to deal with blurry images via a fine-to-coarse hierarchical representation. To deal with the performance saturation w.r.t. depth, we propose a stacked version of our multi-patch model. Our proposed basic multi-patch model achieves the state-of-the-art performance on the GoPro dataset while enjoying a 40x faster runtime compared to current multi-scale methods. With 30ms to process an image at 1280x720 resolution, it is the first real-time deep motion deblurring model for 720p images at 30fps. For stacked networks, significant improvements (over 1.2dB) are achieved on the GoPro dataset by increasing the network depth. Moreover, by varying the depth of the stacked model, one can adapt the performance and runtime of the same network for different application scenarios.

研究の動機と目的

  • 非均一な運動ブラーを効率的でスケーラブルなデブラーで対処する動機付け。
  • 空間ピラミッドマッチングに触発された細部から粗さへの処理を行う階層的マルチパッチCNNを提案する。
  • 階層深度による性能飽和を、スタック型のマルチパッチネットワークを導入して克服する。

提案手法

  • 非重複パッチを扱うエンコーダ-デコーダレベルを備えた階層的マルチパッチネットワーク(DMPHN)を導入する。
  • 最も細かいレベルから処理を開始し、レジデュアル風の接続を介して粗いレベルへ残差を段階的に寄与させる。
  • スキップ/リカレントリンクを用いず、SPMのようなパッチ集約戦略を用いて小さなフィルターで高速推論を可能にする。
  • 最終出力レベル(レベル1)のみに適用されるエンドツーエンド損失で訓練し、残差学習を促す。
  • DMPHNユニットのスタック化(Stack-DMPHNおよびStack-VMPHN)を検討し、実行時間の急激な増加を招かずに性能を向上させる。

実験結果

リサーチクエスチョン

  • RQ1細部から粗さへ階層的なマルチパッチアーキテクチャは、マルチスケールやスケールリカレント手法よりも効率的に非均一運動ブラー除去を改善できるか。
  • RQ2DMPHNユニットのスタック運用は、実行時間を現実的な範囲に保ちつつ有意な性能向上をもたらすか。
  • RQ3階層レベル間での重み共有は、性能とモデルサイズにどのような影響を与えるか。

主な発見

ModelPSNRSSIMSize (MB)Runtime (s)
Sun et al. [25]24.640.842954.112000
Nah et al. [17]29.230.9162303.64300
Zhang et al. [29]29.190.930637.11400
Tao et al. [26]30.100.932333.61600
DMPHN(1)28.700.91317.25
DMPHN(1-2)29.770.928614.59
DMPHN(1-1-1)28.110.904121.712
DMPHN(1-2-4)30.210.934521.717
DMPHN(1-4-16)29.150.921721.792
DMPHN(1-2-4-8)30.250.935129.030
DMPHN(1-2-4-8-16)29.870.930536.2101
DMPHN30.210.934521.717
Stack(2)-DMPHN30.710.940343.437
Stack(3)-DMPHN31.160.945165.1233
Stack(4)-DMPHN31.200.945386.8424
VMPHN30.900.941943.4161
Stack(2)-VMPHN31.500.948386.8552
  • DMPHNはGoProデータセットでPSNR/SSIMの最先端を達成し、(1-2-4-8)構成が最良の結果を提供。
  • DMPHNは720p画像でリアルタイムに動作(1280x720あたり約30 ms)。
  • スタック版(Stack-DMPHNおよびStack-VMPHN)はGoProでベースのDMPHNより1 dB超のPSNR向上を提供。
  • Stack(4)-DMPHNとStack(2)-VMPHNはさらに結果を改善し、Stack版は一部のベースラインよりも同等以上の速度を提供。
  • モデルは軽量のまま(例:DMPHNエンコーダ/デコーダ約3.6 MB)で、各レベル間のアップサンプリング/デコンボリューションを回避。
  • 重み共有はパラメータを削減し、PSNR/SSIMに控えめなトレードオフ。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。