[論文レビュー] Classification and Disease Localization in Histopathology Using Only Global Labels: A Weakly-Supervised Approach
この論文は、画像レベルのラベルのみを用いて全スライド病理画像の病気分類と局所化を行う弱教師付き手法 CHOWDER を提示し、ピクセルレベルのアノテーションなしでも競争力のある結果を達成します。
Analysis of histopathology slides is a critical step for many diagnoses, and in particular in oncology where it defines the gold standard. In the case of digital histopathological analysis, highly trained pathologists must review vast whole-slide-images of extreme digital resolution ($100,000^2$ pixels) across multiple zoom levels in order to locate abnormal regions of cells, or in some cases single cells, out of millions. The application of deep learning to this problem is hampered not only by small sample sizes, as typical datasets contain only a few hundred samples, but also by the generation of ground-truth localized annotations for training interpretable classification and segmentation models. We propose a method for disease localization in the context of weakly supervised learning, where only image-level labels are available during training. Even without pixel-level annotations, we are able to demonstrate performance comparable with models trained with strong annotations on the Camelyon-16 lymph node metastases detection challenge. We accomplish this through the use of pre-trained deep convolutional networks, feature embedding, as well as learning via top instances and negative evidence, a multiple instance learning technique from the field of semantic segmentation and object detection.
研究の動機と目的
- 組織病理画像解析におけるピクセルレベルアノテーションの高コストと希少性に対処する。
- 全スライドラベルのみを用いて病変領域を局在化する弱教師付き学習アプローチを開発する。
- 複数のインスタンス学習を用いた事前学習済み CNN 特徴を活用して最も指標性の高いタイルとネガティブ証拠を識別する。
- セグメンテーションマスクを必要とせず、ground-truth 領域と整合する解釈可能な局在化マップを生成する。
提案手法
- 224×224 タイルから抽出した ResNet-50 特徴量 (2048 次元) をタイル埋め込みとして使用する。
- タイルのインデックス全体にわたる one-dimensional 埋め込み層を適用して、一貫したタイルレベルの埋め込みを生成する。
- MIL に基づく分類のために上位 R および下位 R のタイル埋め込み(トップインスタンスとネガティブ証拠)を保持する。
- 選択したトップ/ボトム埋め込みに対して MLP による分類を行い、スライドレベルの予測を得る。
- ベースラインの集約法(MaxPool, MeanPool)を提案手法 CHOWDER と比較する。
- Adam による binary cross-entropy 損失で訓練し、アンサンブル(E ネットワーク)を用いて汎化性能を向上させる。
実験結果
リサーチクエスチョン
- RQ1画像レベルラベルのみを用いた弱教師付きで、全スライド病理画像の病変局所化は実現可能か?
- RQ2トップインスタンスとネガティブ証拠を用いた MIL ベースのアプローチは、異質な WSI データセット上で標準的なプーリングと比較してどの程度性能を発揮するか?
- RQ3CHOWDER は Camelyon-16 および TCGA データセットで最先端の弱教師付き手法と同等またはそれを上回る病変領域の局所化をどの程度実現できるか?
主な発見
| 手法 | CV AUC | 大会 AUC |
|---|---|---|
| ベースライン MaxPool | 0.655 | 0.? |
| ベースライン MeanPool | 0.530 | 0.? |
| WELDON R=1 | 0.765 | 0.? |
| WELDON R=10 | 0.670 | 0.? |
| WELDON R=100 | 0.600 | 0.? |
| WELDON R=300 | 0.573 | 0.? |
| CHOWDER R=1 | 0.821 | 0.? |
| CHOWDER R=5 | 0.858 | 0.? |
| CHOWDER R=10 | 0.843 | 0.? |
| CHOWDER R=100 | 0.775 | 0.? |
| CHOWDER R=300 | 0.652 | 0.? |
| CHOWDER R=1 (TCGA-Lung) | 0.900 | 0.? |
| CHOWDER R=10 (TCGA-Lung) | 0.915 | 0.? |
| CHOWDER R=100 (TCGA-Lung) | 0.909 | 0.? |
- CHOWDER は、データセット間で強力なベースラインのプーリングおよび WELDON と比較して競争力のあるまたは上回る AUC を達成する。
- Camelyon-16 では、適切な R を用いた CHOWDER がベースラインより高い AUC を示し、セグメンテーションマスクを使用せずに人間レベルの性能に近い動作を示す。
- TCGA-Lung では、CHOWDER は拡散性疾患レジームでの頑健性を示し、R が {1,10,100} の場合の AUC が約 0.90–0.92 である。
- CHOWDER が生成する局所化マップはピクセルレベルの訓練データなしで腫瘍領域をハイライトし、定性的な可視化で ground-truth アノテーションと密接に一致する。
- Camelyon-16 の最強の公表手法と比較して、ground-truth セグメンテーションマスクなしで CHOWDER が実質的な性能向上を達成しており(Bejnordi ら 2017 に近い AUC)、最大の成果を示した。
- 複数の CHOWDER モデルをアンサンブルすることで、データセットサイズが小さくハイパーパラメータ調整が限定的な場合の性能が安定する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。