Skip to main content
QUICK REVIEW

[論文レビュー] Recurrent Generative Adversarial Networks for Proximal Learning and Automated Compressive Image Recovery

Morteza Mardani, Hatef Monajemi|arXiv (Cornell University)|Nov 27, 2017
Advanced Image Processing Techniques参考文献 29被引用数 39
ひとこと要約

本稿では、圧縮画像回復のための画像プリオンを学習するために、近接勾配反復をアンロールする再帰的生成的残差ネットワーク(Recurrent GAN-ResNet)を提案する。画素単位の損失と知覚的損失を組み合わせることで、再構成の忠実性と現実性が向上する。100倍高速な推論を実現し、従来の圧縮センシングMRI(CS-MRI)に対して4 dBのSNR向上を達成し、Pediatric MRI再構成において深層ResNetベースラインを2 dB上回るSNR向上を達成した。

ABSTRACT

Recovering images from undersampled linear measurements typically leads to an ill-posed linear inverse problem, that asks for proper statistical priors. Building effective priors is however challenged by the low train and test overhead dictated by real-time tasks; and the need for retrieving visually "plausible" and physically "feasible" images with minimal hallucination. To cope with these challenges, we design a cascaded network architecture that unrolls the proximal gradient iterations by permeating benefits from generative residual networks (ResNet) to modeling the proximal operator. A mixture of pixel-wise and perceptual costs is then deployed to train proximals. The overall architecture resembles back-and-forth projection onto the intersection of feasible and plausible images. Extensive computational experiments are examined for a global task of reconstructing MR images of pediatric patients, and a more local task of superresolving CelebA faces, that are insightful to design efficient architectures. Our observations indicate that for MRI reconstruction, a recurrent ResNet with a single residual block effectively learns the proximal. This simple architecture appears to significantly outperform the alternative deep ResNet architecture by 2dB SNR, and the conventional compressed-sensing MRI by 4dB SNR with 100x faster inference. For image superresolution, our preliminary results indicate that modeling the denoising proximal demands deep ResNets.

研究の動機と目的

  • 医療および自然画像タスクにおけるアンダーサンプリング線形測定値から、リアルタイムで高忠実度の画像回復を達成する課題に対処すること。
  • 従来の圧縮センシング(例:収束が遅い、知覚的品質が低い)およびディープラーニングベースライン(例:高い学習オーバーヘッド、幻覚現象)の限界を、不適切に定義された逆問題において克服すること。
  • 残差ブロックとGANベースの知覚的損失を用いて、近接演算子を通じて効果的な画像プリオンを学習する、軽量で再帰的なアーキテクチャを設計すること。
  • 再帰的で小さなネットワークが、グローバル(例:MRI)とローカル(例:スーパーレゾリューション)の回復タスクにおいて、深層ネットワークを上回る性能を発揮できるかどうかを調査すること。

提案手法

  • 近接勾配反復を段階的な再帰的ネットワークアーキテクチャにアンロールし、各段階で残差ネットワーク(ResNet)によってモデル化された学習済み近接演算子を適用する。
  • 生成器ネットワークを、事前学習済みディスクラミネーターからの知覚的損失と画素単位のL2損失の混合をGANフレームワークで使用して訓練し、忠実性と知覚的妥当性を両立させる。
  • 段階間で共有または独立した重みを用いた再帰構造を採用し、物理的モデル(データ整合性)とプリオン多様体(妥当性)の両方に射影する。
  • 転置畳み込みによるアップサンプリングにおいて、勾配クリッピングを用いて5ステップの勾配降下法による近似デコンボリューションを実装し、訓練の安定性を確保する。
  • 2つのタスクに本アーキテクチャを適用:k-spaceのアンダーサンプリングからの小児MRI再構成と、32×32のCelebA顔画像を128×128にスーパーレゾリューションする。

実験結果

リサーチクエスチョン

  • RQ1単一の残差ブロックを有する再帰的ResNetアーキテクチャが、圧縮画像回復のための近接演算子を効果的に学習でき、MRI再構成において深層ネットワークを上回る性能を示せるか?
  • RQ2GANフレームワーク内で画素単位の損失と知覚的損失を併用することで、標準的なL2損失と比較して、再構成画像の知覚的品質と物理的妥当性が向上するか?
  • RQ3再帰的アーキテクチャの性能は、ローカル画像スーパーレゾリューションタスクとグローバルMRI再構成タスクにおいて、深く非再帰的なResNetsと比較してどうなるか?
  • RQ4軽量な再帰的ネットワークは、従来の圧縮センシング手法を上回る顕著なSNR向上を達成できるか、かつ100倍高速な推論を維持できるか?

主な発見

  • 小児MRI再構成において、単一の残差ブロックを有する再帰的ResNetは、深層ResNetベースラインを2 dB上回るSNR向上を達成し、従来の圧縮センシング(CS-MRI)に対して4 dBのSNR向上を達成した。推論速度は100倍高速であった。
  • 再帰的アーキテクチャは、SNRと推論速度の両面で、深層ResNetおよび従来のCS-MRI手法を著しく上回った。これは、グローバルな逆問題において、小さな繰り返しネットワークが深層ネットワークよりも効果的であることを示している。
  • CelebA顔画像のスーパーレゾリューションにおいて、共有または独立した重みを有する再帰的アーキテクチャは、深層ResNetsに明確な利点を示さなかった。これは、ローカルノイズ除去の近接演算子において、より深いネットワークが必要であることを示唆している。
  • 各段階での生成器出力は、階層的な抽象化プロセスを示していた:初期段階ではノイズを含む低周波数構造が回復され、後続段階で段階的にシャープネスが向上しアーチファクトが低減された。
  • 勾配クリッピングの使用により、反復的最適化によるデコンボリューションの近似において訓練が安定化し、バックプロパゲーションにおける勾配爆発やNaNの発生を防止した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。