Skip to main content
QUICK REVIEW

[論文レビュー] Optimizing and Visualizing Deep Learning for Benign/Malignant Classification in Breast Tumors

Darvin Yi, Rebecca Lynn Sawyer|arXiv (Cornell University)|May 17, 2017
AI in cancer detection参考文献 12被引用数 49
ひとこと要約

本研究では、DDSMデータセットの1,000例のサブセットを用いて、深層学習をマンモグラム画像に適用し、良性/悪性腫瘍の分類を実施した。GoogLeNetアーキテクチャを用い、85%の正答率と0.91のAUCを達成し、手作業で特徴を抽出する手法を上回った。また、臨床的に重要な特徴(例:棘状変形)を明らかにする新規の可視化技術を導入し、モデルの解釈可能性と診断的妥当性を検証した。

ABSTRACT

Breast cancer has the highest incidence and second highest mortality rate for women in the US. Our study aims to utilize deep learning for benign/malignant classification of mammogram tumors using a subset of cases from the Digital Database of Screening Mammography (DDSM). Though it was a small dataset from the view of Deep Learning (about 1000 patients), we show that currently state of the art architectures of deep learning can find a robust signal, even when trained from scratch. Using convolutional neural networks (CNNs), we are able to achieve an accuracy of 85% and an ROC AUC of 0.91, while leading hand-crafted feature based methods are only able to achieve an accuracy of 71%. We investigate an amalgamation of architectures to show that our best result is reached with an ensemble of the lightweight GoogLe Nets tasked with interpreting both the coronal caudal view and the mediolateral oblique view, simply averaging the probability scores of both views to make the final prediction. In addition, we have created a novel method to visualize what features the neural network detects for the benign/malignant classification, and have correlated those features with well known radiological features, such as spiculation. Our algorithm significantly improves existing classification methods for mammography lesions and identifies features that correlate with established clinical markers.

研究の動機と目的

  • 限られたマンモグラムデータを用いた深層学習により、がんスクリーニングにおける良性/悪性分類の性能を向上させること。
  • CADシステムにおける手作業特徴抽出の限界を克服し、データ駆動型の深層学習を活用すること。
  • 学習された特徴を既知の放射線学的マーカーと結びつけることで、深層学習の意思決定を解釈可能な方法で可視化する手法を開発すること。
  • 深層ニューラルネットワークが、臨床的に重要な特徴(例:棘状変形)を学習できることを示し、信頼性と臨床応用可能性を高めること。
  • 複数の視野(CCおよびMLO)を統合したアンサンブルモデルを評価し、分類のロバストネスを向上させること。

提案手法

  • デジタルスクリーニングマンモグラフィー・データベース(DDSM)の1,000例のサブセットを、軽量なGoogLeNetアーキテクチャを用いて、スクラッチから訓練した。
  • 頭側・尾側(CC)および側側・斜外側(MLO)視野を別々に処理するモデルの予測を、確率スコアの平均化によって統合した。
  • 限られたデータにおける一般化性能の向上と分散の低減を目的に、複数のGoogLeNetモデルをアンサンブル化した。
  • クラススコアを最大化するように反復的に確率的勾配上昇を実行する「Directed Dream」という新規な可視化技術を開発した。
  • Directed Dreamプロセスの各反復でセマンティックマップを可視化し、ネットワークが学習した高レベル特徴を特定した。
  • 得られた視覚的幻想(ホラコレーション)を、棘状変形などの既知の放射線学的特徴と照合し、臨床的妥当性を検証した。

実験結果

リサーチクエスチョン

  • RQ1限定的なマンモグラムデータセットにおいて、最先端の深層学習モデルが良性/悪性分類において堅牢な性能を達成できるか?
  • RQ2CCおよびMLO視野の複数の視野にわたるアンサンブルモデリングは、単一視野モデルと比較して分類性能をどのように向上させるか?
  • RQ3深層学習モデルは、マンモグラフィーにおける臨床的マーカー(例:棘状変形)に対応する特徴を学習できるか?
  • RQ4Directed Dreamのような可視化技術は、深層ニューラルネットワークの意思決定プロセスにおいて、意味的で解釈可能な特徴をどの程度明らかにできるか?
  • RQ5共有されたモデルアーキテクチャを用いて複数の視野を統合することで、特徴の共有が促進され、分類精度が向上するか?

主な発見

  • 深層学習モデルは、1,000例のマンモグラムデータセットにおいて85%の正答率とROC AUC 0.91を達成し、手作業特徴抽出手法(71%正答率)を顕著に上回った。
  • CCおよびMLO視野の両方を用いたGoogLeNetのアンサンブルモデルは、確率スコアの平均化により最高の性能を示し、視野間での共有特徴学習の恩恵があることを示した。
  • Directed Dream可視化手法により、悪性例では星型の棘状変形に類似したパターンが明確に生成された。
  • 良性例の可視化では、丸くまとまった明るい領域が散らばる「星の夜空」のような効果が得られ、悪性パターンとは対照的で、逆の特徴優先順位を示した。
  • 悪性例における可視化された特徴は、臨床的に有意義な棘状変形と強く相関しており、モデルが診断的に重要なパターンを学習できることを検証した。
  • 反復的可視化プロセスにより、単一ステップのセマンティックマップよりも高次の抽象化特徴が明らかになった。深層ネットワークが専門家知識と整合する複雑で解釈可能な特徴を学習していることを示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。