Skip to main content
QUICK REVIEW

[論文レビュー] Few-shot 3D Multi-modal Medical Image Segmentation using Generative Adversarial Learning

Arnab Kumar Mondal, José Dolz|arXiv (Cornell University)|Oct 29, 2018
Advanced Neural Network Applications参考文献 10被引用数 121
ひとこと要約

この論文は、少数のラベル付き対象しか用いない半监督GANベースの手法で、 unlabeled data と generator を活用して few-shot 3D multi-modal brain MRI segmentation を行い、ほぼ全監視と同等の性能を達成する。

ABSTRACT

We address the problem of segmenting 3D multi-modal medical images in scenarios where very few labeled examples are available for training. Leveraging the recent success of adversarial learning for semi-supervised segmentation, we propose a novel method based on Generative Adversarial Networks (GANs) to train a segmentation model with both labeled and unlabeled images. The proposed method prevents over-fitting by learning to discriminate between true and fake patches obtained by a generator network. Our work extends current adversarial learning approaches, which focus on 2D single-modality images, to the more challenging context of 3D volumes of multiple modalities. The proposed method is evaluated on the problem of segmenting brain MRI from the iSEG-2017 and MRBrainS 2013 datasets. Significant performance improvement is reported, compared to state-of-art segmentation networks trained in a fully-supervised manner. In addition, our work presents a comprehensive analysis of different GAN architectures for semi-supervised segmentation, showing recent techniques like feature matching to yield a higher performance than conventional adversarial training approaches. Our code is publicly available at https://github.com/arnab39/FewShot_GAN-Unet3D

研究の動機と目的

  • 非常に少ないラベル付きの例で3D多モーダル医用画像のセグメンテーションを解決する。
  • 敵対的学習を活用して unlabeled および合成パッチを利用し過適合を防ぐ。
  • 半監視セグメンテーションのために3DでさまざまなGANアーキテクチャを評価する(特徴マッチングを含む)。
  • 脳MRIデータセット(iSEG-2017 と MRBrainS 2013)で性能向上を実証する。

提案手法

  • ラベル付き、未ラベル、偽サンプルを扱えるGANベースの枠組みでセグメンテーションネットワークを拡張する。
  • (K+1) 出力を持つ識別器を使用し、(K+1) 番目のクラスを偽パッチに対応させる;有効な K 出力を得るための再パラメータ化を適用する。
  • 3つの損失で学習する:L_labeled(ラベル付きデータの標準交差エントロピー)、L_unlabeled(未ラベルデータの現実的な出力を促す)、L_fake(生成器が現実的で多様な偽パッチを生成するよう促す)。
  • 3Dパッチベースの設計と生成されたパッチを潜在ノイズへマッピングするEncoderを備えたGeneratorを採用し、安定学習のためのFeature Matching (FM) 損失を導入する。
  • 分布カバレッジとエントロピーに基づく強化を研究するための補完(悪い)生成器バリアントを実装し、FM GANとこのバリアントを比較する。
  • GANトレーニング用のアーキテクチャ調整を加えた3D U-Netを識別器として使用する(重み正規化、leaky ReLU、平均プーリング)。
  • memoryを管理するために3D体積を32x32x32パッチとして処理し、 semi-supervised でエンドツーエンドに学習する。
  • 前処理をN4 bias correctionと強度正規化で行い、 Adam (lr=1e-4) とバッチサイズ30で訓練する。

実験結果

リサーチクエスチョン

  • RQ1GANベースの半監視学習は、非常に少ないラベル付き対象で正確な3D多モーダル脳MRIセグメンテーションを実現できるか?
  • RQ2未ラベルデータと生成器を取り入れると、過学習を減らし一般化性能を改善するか?限定データでの完全監視訓練と比較して。
  • RQ3異なるGANバリアント(標準の adversarial、特徴マッチング、補完/悪い生成器)は、3D多モーダル設定のセグメンテーション性能にどのように影響するか?
  • RQ4FM GAN は semi-supervised 3D 医用画像セグメンテーションにおいて bad-GAN より優れているか?
  • RQ5提案手法はデータセット間で一般化するか(iSEG-2017 infant brain MRI と MRBrainS 2013 adult brain MRI)。

主な発見

  • FM GAN は few-shot シナリオ(1–2 labeled examples)で基本的な U-Net を大きく上回る。
  • 特徴マッチング(FM GAN)は、検証したGANバリアントの中で最も優れたセグメンテーション性能を示す。
  • 十分な未ラベルデータを用いるとFM GANは完全な監視下の学習に近い結果を達成し、いくつかの設定で標準的な supervise U-Net を上回る。
  • iSEG-2017 と MRBrainS 2013 で本手法は Dice スコアを改善し、表面距離指標を低減してベースラインと比較してデータセット横断の適用性を示す。
  • 補完的な(bad)生成器はこのタスクには FM GAN より効果が低いが、分布カバレッジと学習安定性の洞察を提供する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。