Skip to main content
QUICK REVIEW

[論文レビュー] nnU-Net: Self-adapting Framework for U-Net-Based Medical Image Segmentation

Fabian Isensee, Jens Petersen|arXiv (Cornell University)|Sep 27, 2018
Advanced Neural Network Applications被引用数 390
ひとこと要約

nnU-Net は、vanilla U-Nets を核とした自己適応型の完全自動パイプラインを提示し、アーキテクチャ、前処理、学習、推論をデータセットの特性に合わせて調整し、Manual tuning なしで Medical Segmentation Decathlon データセットでトップパフォーマンスを達成します。

ABSTRACT

The U-Net was presented in 2015. With its straight-forward and successful architecture it quickly evolved to a commonly used benchmark in medical image segmentation. The adaptation of the U-Net to novel problems, however, comprises several degrees of freedom regarding the exact architecture, preprocessing, training and inference. These choices are not independent of each other and substantially impact the overall performance. The present paper introduces the nnU-Net ('no-new-Net'), which refers to a robust and self-adapting framework on the basis of 2D and 3D vanilla U-Nets. We argue the strong case for taking away superfluous bells and whistles of many proposed network designs and instead focus on the remaining aspects that make out the performance and generalizability of a method. We evaluate the nnU-Net in the context of the Medical Segmentation Decathlon challenge, which measures segmentation performance in ten disciplines comprising distinct entities, image modalities, image geometries and dataset sizes, with no manual adjustments between datasets allowed. At the time of manuscript submission, nnU-Net achieves the highest mean dice scores across all classes and seven phase 1 tasks (except class 1 in BrainTumour) in the online leaderboard of the challenge.

研究の動機と目的

  • 非アーキテクチャ的で自動的に設定されたコンポーネントが、多様な医用セグメンテーションタスクに対して専門的なアーキテクチャを上回ることができることを示す。
  • 各データセットに合わせて U-Net トポロジー、前処理、学習、推論、後処理を完全自動で適応させるパイプラインを導入する。
  • Medical Segmentation Decathlon でフレームワークを評価し、最先端のベンチマークと比較する。

提案手法

  • 3つの U-Net バリアント(2D U-Net、3D U-Net、および U-Net Cascade)を、元の U-Net に対して最小限のアーキテクチャ変更で使用する。
  • 各データセットの幾何に合わせて入力パッチサイズ、メモリ使用量、プーリング操作を自動的に適応させる。
  • 完全な自動化パイプラインを定義:前処理(切り抜き、リサンプリング、正規化)、学習(損失:dice+CE、Adam オプティマイザ、学習率スケジュール、クロスバリデーション)、推論(オーバーラップを伴うパッチベースのタイル化とテスト時拡張)、および後処理(最大の連結成分) 。
  • データ拡張(回転、スケーリング、弾性変形、ガンマ補正、ミラーリング)とカスケードが適用される場合の段階的学習を Employ する。
  • データセットごとに複数モデルをアンサンブルし、クロスバリデーション平均前景 Dice スコアで submission のための最良モデルを選択する。

実験結果

リサーチクエスチョン

  • RQ1異なる医用画像データセット間での高い汎化性能を、手作業のタスク特有の微調整なしに、vanilla U-Nets を用いた自己適応フレームワークで達成できるか?
  • RQ2自動化された前処理、学習、推論、後処理のコンポーネントは、アーキテクチャの革新と比較してセグメンテーション性能にどのような影響を与えるか?
  • RQ3クロスデータセット汎化に対するアンサンブルモデルとカスケード戦略の影響はどの程度か?

主な発見

  • nnU-Net フレームワークは、Medical Segmentation Decathlon のリーダーボードで提出時点の第1フェーズの7タスク中の最高平均 Dice スコアを達成(BrainTumour クラス 1 を除く1件を除く)。
  • データセットの幾何(入力パッチサイズ、プーリングトポロジー)への自動適応により、さまざまな画像サイズとモダリティに対してネットワークが効果的に動作できる。
  • 有益な場合には3D U-Net カスケードを適用するカスケードアプローチは、大きな画像サイズに対応し、全解像度での精度向上を可能にする。
  • 具体的な学習プロトコルの詳細(損失 = dice + cross-entropy、Adam オプティマイザ、学習率スケジューリング)と広範なデータ拡張が、堅牢性と性能に大きく寄与する。
  • 推論はパッチベースのタイル化とオーバーラップ、テスト時拡張を用い、ロバスト性のためにボクセルあたり最大 64 個の予測を集計する。
  • 自動アンサンブリング戦略(2モデルのアンサンブル)と、クロスバリデーション指標で最良モデルを選択することが最終提出の性能を牽引する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。