[論文レビュー] Self-Supervision Closes the Gap Between Weak and Strong Supervision in Histology
要約:論文はヒストロジーのタイル上でドメイン内の自己教師あり特徴抽出器(MoCo v2)を学習させ、ImageNet特徴を置き換え、弱教師ありヒストロジーの性能を大幅に向上させ、Camelyon16における強教師ありとのギャップを縮める。
One of the biggest challenges for applying machine learning to histopathology is weak supervision: whole-slide images have billions of pixels yet often only one global label. The state of the art therefore relies on strongly-supervised model training using additional local annotations from domain experts. However, in the absence of detailed annotations, most weakly-supervised approaches depend on a frozen feature extractor pre-trained on ImageNet. We identify this as a key weakness and propose to train an in-domain feature extractor on histology images using MoCo v2, a recent self-supervised learning algorithm. Experimental results on Camelyon16 and TCGA show that the proposed extractor greatly outperforms its ImageNet counterpart. In particular, our results improve the weakly-supervised state of the art on Camelyon16 from 91.4% to 98.7% AUC, thereby closing the gap with strongly-supervised models that reach 99.3% AUC. Through these experiments, we demonstrate that feature extractors trained via self-supervised learning can act as drop-in replacements to significantly improve existing machine learning techniques in histology. Lastly, we show that the learned embedding space exhibits biologically meaningful separation of tissue structures.
研究の動機と目的
- 滑面スライドラベルのみのためヒストロジーにおける弱い監督付きを動機付ける; ImageNet事前学習を主要な弱点として特定する; MoCo v2によるドメイン内自己教師あり事前訓練を提案する; Camelyon16とTCGA-COADでの性能向上を実証する; 学習表現の生物学的意味と転移可能性を示す。
提案手法
- 固定ズームレベルで全スライド画像を固定サイズパッチにタイル化する; 凍結エンコーダーでタイル特徴を抽出する; MILを適用してタイル情報をスライドラベルへ集約する; ラベルなしヒストロジータイル上でコントラスト損失を用いたMoCo v2によるドメイン内事前訓練を行う; ヒストロジーデータに適した回転と反転でMoCo v2を拡張する; 三つのMILアーキテクチャ(Weldon, Chowder, DeepMIL)で評価し、ImageNet pre-trainingと比較してAUCの改善を報告する。
実験結果
リサーチクエスチョン
- RQ1MoCo v2によるドメイン内自己監督前訓練は、ImageNet事前学習特徴よりも弱教師付きヒストロジーモデルを改善できるか?
- RQ2改善は異なるMILアーキテクチャとデータセット(Camelyon16とTCGA-COAD)で一般化するか?
- RQ3自己教師ありのドメイン内機能で弱教師付きの性能は強教師付きのベースラインにどれだけ近づくか?
- RQ4学習された埋め込みは生物学的に意味のあるクラスタリングを示し、臓器・腫瘍タイプを越えた転移学習を支援するか?
主な発見
| Method | Feature Extractor Training Method | Train Cross-Validation | Competition Test Set |
|---|---|---|---|
| Strongly-Supervised [35] | - | - | 99.3% |
| CLAM [24] | CPC | - | 91.4% ±2.3 |
| Weldon | ImageNet | 76.9% ±16.6 | 65.3% ±13.7 |
| Chowder | - | 82.3% ±15.4 | 79.6% ±5.1 |
| DeepMIL | - | 88.7% ±4.7 | 82.9% ±2.0 |
| Weldon | MoCo v2 | 97.9% ±1.4 | 98.3% ±0.7 |
| Chowder | - | 98.3% ±1.2 | 97.7% ±0.5 |
| DeepMIL | - | 96.3% ±2.1 | 98.7% ±0.2 |
- MoCo v2のドメイン内特徴は、MILモデル全体で弱教師ありヒストロジーの結果を大幅に向上させる。
- Camelyon16では、弱教師付きの性能が98.7%のAUCに達し、強教師ありモデルの99.3%のAUCに迫る。
- MoCo v2特徴は標準偏差を劇的に低下させ、ImageNet特徴と比較してはるかに頑健な性能を示す。
- TCGA-COADのCMS分類で、MoCo v2特徴はImageNetに対する大きなAUC増分を生み、アノテーションとアンサンブリングを用いる最先端手法と同等の結果を示す。
- TCGA-COADからCamelyon16(およびその逆)へのMoCo v2特徴の転送は強力なデ Cross-dataset性能を示し、学習表現の転移可能性を示唆する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。