QUICK REVIEW

[論文レビュー] Deep Multi-instance Networks with Sparse Label Assignment for Whole Mammogram Classification

Wentao Zhu, Qi Lou|arXiv (Cornell University)|Dec 18, 2016

AI in cancer detection参考文献 15被引用数 31

ひとこと要約

本論文は、検出やセグメンテーションのアノテーションに高コストがかかるのを回避するために、全乳房レントゲン画像の分類にエンドツーエンドの深層マルチインスタンスネットワークを提案する。マックスプーリング、ラベル割り当て、スパース学習の仕組みを活用することで、INbreastデータセットにおいて最先端の性能を達成し、明示的なボクシングボックスの監視がなくても、小さな、散在する腫瘍の検出が可能である。AUCは事前学習済みAlexNetよりも6%向上した。

ABSTRACT

Mammogram classification is directly related to computer-aided diagnosis of breast cancer. Traditional methods requires great effort to annotate the training data by costly manual labeling and specialized computational models to detect these annotations during test. Inspired by the success of using deep convolutional features for natural image analysis and multi-instance learning for labeling a set of instances/patches, we propose end-to-end trained deep multi-instance networks for mass classification based on whole mammogram without the aforementioned costly need to annotate the training data. We explore three different schemes to construct deep multi-instance networks for whole mammogram classification. Experimental results on the INbreast dataset demonstrate the robustness of proposed deep networks compared to previous work using segmentation and detection annotations in the training.

研究の動機と目的

乳房腫瘍分類において、高コストな手動アノテーション（例えばボクシングボックスやセグメンテーションマスク）の必要性をなくすこと。
生の、アノテーションのない画像から直接、全乳房レントゲン画像を分類するエンドツーエンドの深層学習フレームワークを構築すること。
マルチインスタンス学習を、小さな領域に限った病変に適応させることで、医療画像解析における深層特徴のロバスト性と転移性を向上させること。
マックスプーリング、ラベル割り当て、スパース性という、乳房レントゲン画像における腫瘍の小さなサイズと低発生率に適した代替マルチインスタンス学習スキームを検討すること。

提案手法

全乳房レントゲン画像を224×224にリサイズし、Otsuのセグメンテーションを適用して背景を除去する。
深層畳み込みニューラルネットワーク（例：AlexNet）を用いて、乳房画像の各パッチから高次元特徴マップを抽出する。
重み共有を用いた線形回帰を適用し、特徴マップ全体にわたる各パッチの悪性確率を予測する。
3つの異なるマルチインスタンス学習スキームを採用：マックスプーリング（最も高い確率のパッチを選択）、ラベル割り当て（上位k個のパッチを正例と割り当て）、スパース性（少数の活性パッチを促進）。
各スキームに特化した損失関数（マックスプーリング損失、ラベル割り当て損失、スパース正則化）を用いて、ネットワーク全体をエンドツーエンドで訓練する。
限定的な訓練データにおける汎化性を向上させるために、データオーグメンテーションを活用する。

実験結果

リサーチクエスチョン

RQ1深層マルチインスタンスネットワークは、検出やセグメンテーションのアノテーションを一切必要とせずに、ロバストな全乳房レントゲン画像分類を達成できるか？
RQ2マックスプーリング、ラベル割り当て、スパース性といった、異なるマルチインスタンス学習スキームは、腫瘍分類において性能とロバスト性の面でどのように比較されるか？
RQ3ImageNetで事前学習したモデルからの転移学習は、限られたアノテーションを伴う医療画像分野でどの程度性能を向上させられるか？
RQ4腫瘍が画像の約2%しか占めない状況でも、モデルは効果的に病変を局在化し、悪性を予測できるか？
RQ5中間段階の検出やセグメンテーションアノテーションを必要とするマルチステージパイプラインと比較して、モデルの性能はどの程度か？

主な発見

提案された深層マルチインスタンスネットワークは、INbreastデータセットで最高のAUCを達成し、事前学習済みAlexNetや検出／セグメンテーションの監視付き微調整モデルといったベースラインモデルを上回った。
ラベル割り当てに基づく深層マルチインスタンスネットワークが最も高いAUCを達成し、マックスプーリング法やスパース法よりも優れた性能を示した。
ImageNetで事前学習することで、初期化から学習する場合に比べて性能が7%向上した。これは、深層特徴が医療画像に転移可能であることを確認した。
事前学習済みAlexNetよりもAUCが6%向上し、マックスプーリングベースのMILよりも8%向上した。これは、強力な汎化性とロバスト性を示している。
可視化の結果、モデルはパッチごとの悪性確率を正しく学習しており、ラベル割り当て法はマックスプーリング法よりも小さな腫瘍をよりよく捉えていることがわかった。
スパースマルチインスタンスネットワークは、モデルの複雑さと性能のバランスをうまくとることができ、感度と計算コストの妥協点を提供した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。