[論文レビュー] End-to-end Training for Whole Image Breast Cancer Diagnosis using An All Convolutional Design
本論文は、最初の訓練段階での病変アノテーションのみを必要とし、以降は画像レベルのラベルのみを用いる、全結合層を含まないエンド・ツー・エンドの畳み込みニューラルネットワークを用いた、全画像を対象とした乳がん診断のための深層学習モデルを提案する。初期の弱い監視学習を経て、全画像の監視のみを用いても、DDS-Mで0.91のAUC、INbreastで0.96のAUCを達成し、最先端の性能を実現した。
We develop an end-to-end training algorithm for whole-image breast cancer diagnosis based on mammograms. It requires lesion annotations only at the first stage of training. After that, a whole image classifier can be trained using only image level labels. This greatly reduced the reliance on lesion annotations. Our approach is implemented using an all convolutional design that is simple yet provides superior performance in comparison with the previous methods. On DDSM, our best single-model achieves a per-image AUC score of 0.88 and three-model averaging increases the score to 0.91. On INbreast, our best single-model achieves a per-image AUC score of 0.96. Using DDSM as benchmark, our models compare favorably with the current state-of-the-art. We also demonstrate that a whole image model trained on DDSM can be easily transferred to INbreast without using its lesion annotations and using only a small amount of training data. Code availability: https://github.com/lishen/end2end-all-conv
研究の動機と目的
- 全画像乳がん診断における高コストな病変レベルのアノテーションへの依存を低減すること。
- エンド・ツー・エンドの学習に適したシンプルでありながら効果的な全畳み込みアーキテクチャの開発。
- 画像レベルのラベルと最小限のファインチューニングのみを用いて、1つのデータセットから別のデータセットへの転移学習を可能にすること。
- 高コストな病変アノテーションを大幅に削減しつつ、最先端の手法と同等の診断性能を達成すること。
提案手法
- 全画像を対象とした全畳み込みニューラルネットワークを用いて、エンド・ツー・エンドで処理を行う。
- モデルは、病変レベルのアノテーションを用いて事前学習し、懸念すべき領域を局在化する。
- 事前学習後、全画像分類のための画像レベルのラベル(良性/悪性)のみを用いて、ネットワークをファインチューニングする。
- 2段階の訓練戦略により、病変の局在化と全画像診断を分離し、アノテーション依存度を最小限に抑える。
- ソースデータセットで分類器ヘッドを初期化し、ターゲットデータセットで最小限のデータを用いてファインチューニングすることで、転移学習を可能にする。
- 全結合層を避けることで、空間的情報を保持し、一般化性能を向上させる。
実験結果
リサーチクエスチョン
- RQ1初期の病変レベルの事前学習を経て、以降は画像レベルのラベルのみを用いるエンド・ツー・エンドの深層学習モデルが、高い診断性能を達成できるか。
- RQ2従来の手法と比較して、全畳み込みアーキテクチャは全画像乳がん診断においてどの程度有効か。
- RQ3ターゲットデータセットで病変アノテーションを一切用いずに、1つのデータセットで学習したモデルを別のデータセットにどの程度効果的に転送できるか。
- RQ4病変アノテーションへの依存度を低減することで、アノテーションコストを著しく削減できるか、かつ診断精度が著しく低下しないか。
主な発見
- 最良の単一モデルは、DDS-Mデータセットで0.88の画像単位AUCを達成し、3モデルアンサンブルで0.91に向上した。
- INbreastデータセットでは、最良の単一モデルが0.96の画像単位AUCを達成し、難易度の高いベンチマークでも優れた性能を示した。
- 事前学習後の画像レベルラベルのみを用いた状況でも、従来の最先端手法を上回る性能を、DDS-Mデータセットで達成した。
- DDS-MからINbreastへの転移学習は、最小限のデータとターゲットデータセットでの病変アノテーションなしで効果的であった。
- 全畳み込みアーキテクチャは、全結合層を含むモデルと比較して、より優れた特徴学習と一般化性能を実現した。
- 高コストな病変レベルのアノテーションへの依存度を著しく低減しつつ、高い診断精度を維持できた。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。