Skip to main content
QUICK REVIEW

[論文レビュー] 3D Self-Supervised Methods for Medical Imaging

Aiham Taleb, Winfried Loetzsch|arXiv (Cornell University)|Jun 6, 2020
Medical Image Segmentation Techniques参考文献 67被引用数 128
ひとこと要約

五つの3D自己教師ありプロキシタスク(3D-CPC、3D-Rot、3D-Jig、3D-RPL、3D-Exe)を導入し、ラベルなし3D医用画像から学習することでデータ効率と下流パフォーマンスを改善。脳腫瘍、膵臓腫瘍、糖尿病性網膜症タスクで効果を発揮し、オープンソースコードを提供。

ABSTRACT

Self-supervised learning methods have witnessed a recent surge of interest after proving successful in multiple application fields. In this work, we leverage these techniques, and we propose 3D versions for five different self-supervised methods, in the form of proxy tasks. Our methods facilitate neural network feature learning from unlabeled 3D images, aiming to reduce the required cost for expert annotation. The developed algorithms are 3D Contrastive Predictive Coding, 3D Rotation prediction, 3D Jigsaw puzzles, Relative 3D patch location, and 3D Exemplar networks. Our experiments show that pretraining models with our 3D tasks yields more powerful semantic representations, and enables solving downstream tasks more accurately and efficiently, compared to training the models from scratch and to pretraining them on 2D slices. We demonstrate the effectiveness of our methods on three downstream tasks from the medical imaging domain: i) Brain Tumor Segmentation from 3D MRI, ii) Pancreas Tumor Segmentation from 3D CT, and iii) Diabetic Retinopathy Detection from 2D Fundus images. In each task, we assess the gains in data-efficiency, performance, and speed of convergence. Interestingly, we also find gains when transferring the learned representations, by our methods, from a large unlabeled 3D corpus to a small downstream-specific dataset. We achieve results competitive to state-of-the-art solutions at a fraction of the computational expense. We publish our implementations for the developed algorithms (both 3D and 2D versions) as an open-source library, in an effort to allow other researchers to apply and extend our methods on their datasets.

研究の動機と目的

  • 3D医用画像における高価な専門家アノテーションへの依存を低減する。
  • 自己教師付きプロキシタスクを用いてラベルなしデータから豊かな3D表現を学習する。
  • セグメンテーションや検出などの下流タスクにおけるデータ効率の良い微調整を可能にする。
  • 大規模なラベルなしコーパスから学習した3D表現を小規模な下流データセットへ転移させることを示す。

提案手法

  • 5つの3D自己教師ありタスクを提案する:3D Contrastive Predictive Coding (3D-CPC)、3D Rotation prediction (3D-Rot)、3D Jigsaw puzzles (3D-Jig)、Relative 3D patch location (3D-RPL)、および 3D Exemplar networks (3D-Exe) 。
  • 3D-CPCはエンコーダとコンテキストネットワークを用い、InfoNCE損失を使用して未来パッチの潜在表現を反転ピラミッド型3Dコンテキストで予測する。
  • 3D-RPLは3Dグリッド内のクエリパッチの相対位置を分類するように訓練し、ショートカットを避けるためにジッターを導入する。
  • 3D-Jigは3Dパッチグリッドの並べ替えをPクラス分類タスクとして解く。
  • 3D-Rotはディスクリタイズされた3D回転(10クラス)を予測して意味理解を促す。
  • 3D-Exeはトリプレット損失を用いて変換されたポジティブを埋め込み空間で近づけ、ネガティブを遠ざける。

実験結果

リサーチクエスチョン

  • RQ13D自己教師付きプロキシタスクは、ラベルなし3D医用画像から学習した表現を、2Dやゼロからのトレーニングと比較して改善するか。
  • RQ23D表現は大規模なラベルなしコーパスからの転移学習を通じて、下流タスクおよび小規模データセットへ転移可能か。
  • RQ33Dプロキシタスクは脳腫瘍セグメンテーション、膵腫瘍セグメンテーション、糖尿病性網膜症検出においてデータ効率、性能向上、収束速度を提供するか。
  • RQ4現実的な医用画像ベンチマークにおいて、3D手法は2D対比法および教師ありベースラインとどう比較されるか。

主な発見

モデルETWTTC
3D-From scratch76.3887.8283.11
3D Supervised78.8890.1184.92
2D-CPC76.6086.2782.41
2D-RPL77.5387.9182.56
2D-Jigsaw76.1286.2883.26
2D-Rotation76.6088.7882.41
2D-Exemplar75.2284.8281.87
Popli et al. [66]74.3989.4182.48
Baid et al. [67]74.8087.8082.66
Chandra et al. [68]74.0687.1979.89
Isensee et al. [65]80.3690.8084.32
3D-CPC80.8389.8885.11
3D-RPL81.2890.7186.12
3D-Jigsaw79.6689.2082.52
3D-Rotation80.2189.6384.75
3D-Exemplar79.4690.8083.87
  • 3D自己教師付き事前学習はデータ効率を優位に高め、ゼロからの学習および2Dスライスベースのベースラインより特にデータ不足時に優れている。
  • タスクを跨いで、3D手法は最新のBraTSベースラインと比較してDiceスコアが競争力あるいは優れており、下流エポック数を少なくする場合が多い。
  • 3D表現は大規模なラベルなし3Dコーパス(例:UK Biobank)から小さな下流データセットへ効果的に転移する。
  • 3D手法はBraTS脳腫瘍セグメンテーションタスクで2D対比より優れており、完全な3D文脈の価値を強調している。
  • 3Dおよび2Dの変種のオープンソース実装が公開され、採用と拡張を促進する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。