Skip to main content
QUICK REVIEW

[論文レビュー] DeepLesion: Automated Deep Mining, Categorization and Detection of Significant Radiology Image Findings using Large-Scale Clinical Lesion Annotations

Ke Yan, Xiaosong Wang|arXiv (Cornell University)|Oct 4, 2017
COVID-19 diagnosis using AI参考文献 9被引用数 43
ひとこと要約

本稿では、33,688枚のマークされた画像と病変バウンディングボックスを含む大規模なレントゲン画像データセット「DeepLesion」を紹介する。これにより、自動的な深層学習によるマイニング、5種類の病変(例:肝腫瘍、肺結節)への教師なし分類、および深層畳み込みニューラルネットワーク(CNN)を用いた複数クラス病変検出が可能となる。本手法は、偽ラベルを用いて64.3%の検出精度を達成し、単一クラス検出を著しく上回り、後向き臨床的ラベルが新たなラベル付け作業なしに、スケーラブルで多目的なCADシステムを可能にすることを示している。

ABSTRACT

Extracting, harvesting and building large-scale annotated radiological image datasets is a greatly important yet challenging problem. It is also the bottleneck to designing more effective data-hungry computing paradigms (e.g., deep learning) for medical image analysis. Yet, vast amounts of clinical annotations (usually associated with disease image findings and marked using arrows, lines, lesion diameters, segmentation, etc.) have been collected over several decades and stored in hospitals' Picture Archiving and Communication Systems. In this paper, we mine and harvest one major type of clinical annotation data - lesion diameters annotated on bookmarked images - to learn an effective multi-class lesion detector via unsupervised and supervised deep Convolutional Neural Networks (CNN). Our dataset is composed of 33,688 bookmarked radiology images from 10,825 studies of 4,477 unique patients. For every bookmarked image, a bounding box is created to cover the target lesion based on its measured diameters. We categorize the collection of lesions using an unsupervised deep mining scheme to generate clustered pseudo lesion labels. Next, we adopt a regional-CNN method to detect lesions of multiple categories, regardless of missing annotations (normally only one lesion is annotated, despite the presence of multiple co-existing findings). Our integrated mining, categorization and detection framework is validated with promising empirical results, as a scalable, universal or multi-purpose CAD paradigm built upon abundant retrospective medical data. Furthermore, we demonstrate that detection accuracy can be significantly improved by incorporating pseudo lesion labels (e.g., Liver lesion/tumor, Lung nodule/tumor, Abdomen lesions, Chest lymph node and others). This dataset will be made publicly available (under the open science initiative).

研究の動機と目的

  • 深層学習を用いたレントゲン画像分野における大規模かつ高品質なラベル付き医療画像データセットの不足に対処すること。
  • 1つの疾患に焦点を当てるのではなく、同時に複数の病変タイプを検出できるスケーラブルで多目的なCADフレームワークを開発すること。
  • PACSシステムに保存された未利用の臨床的ラベル(例:病変径、矢印)を、病変分類と検出の弱い教師付き信号として活用すること。
  • 後向き臨床的ラベルからの病変特徴の教師なし深層クラスタリングが、意味のある偽ラベルを生成し、検出性能を向上させることを示すこと。
  • 追加の専門家ラベル付けを必要とせず、既存の後向き臨床データのみを用いて普遍的なCADシステムを構築できるかを検証すること。

提案手法

  • 10,825件の検査と4,477名の患者を対象に、33,688枚のマークされたレントゲン画像からDeepLesionデータセットを構築し、病変バウンディングボックスは測定された径から導出された。
  • 放射線科医によるラベルなしカテゴリを前提に、反復的な特徴抽出、クラスタリング、CNNの再訓練を含む教師なし深層マイニングパイプラインを適用し、潜在的な病変カテゴリを発見した。
  • 1枚の画像に1つの病変しかラベルが付いていなくても、複数カテゴリにわたる病変の局所化と分類を同時に実行できる、領域ベースのCNN(R-CNN)フレームワークを用いた。
  • 予測されたバウンディングボックスと正解ボックスのIoUが0.5以上である条件を用いて検出精度を評価する、新しい評価プロトコルを導入した。主な指標では病変カテゴリは無視された。
  • 2つの設定で性能を評価した:単一クラス検出(すべての病変を1つの異常クラスとして扱う)と、クラスタリングから得た偽クラスを用いた複数クラス検出。
  • トレーニングプロセスに偽病変ラベルを組み込むことで、汎化性能と検出精度を向上させ、自己ラベル付けされたカテゴリがモデル性能を向上させることを示した。

実験結果

リサーチクエスチョン

  • RQ1後向き臨床的ラベルから得られる病変特徴の教師なし深層クラスタリングが、検出性能を向上させる意味のある偽病変カテゴリを生成できるか?
  • RQ2偽病変ラベル(例:肝臓病変、肺結節)を組み込むことで、単一クラス検出と比較して、複数クラス病変検出モデルの精度はどの程度向上するか?
  • RQ3PACSシステムに保存された既存の部分的ラベル付き臨床データのみを用いて、新たな専門家ラベル付けを必要としないスケーラブルで多目的なCADシステムを構築できるか?
  • RQ4弱い教師付きの偽ラベルを用いた場合、異なるIoU閾値における深層学習モデルの検出精度はどのように変化するか?
  • RQ51枚の画像に1つの病変しかラベルが付いていなくても、1つの深層学習モデルが複数の病変タイプを同時に効果的に検出できるか?

主な発見

  • 提案された複数クラス病変検出器は、教師なし偽病変カテゴリを用いた場合、テストセットで64.3%の検出精度を達成したのに対し、単一クラス検出では59.45%であった。
  • 偽病変ラベルの使用により、全5クラスタ(肝臓、肺、腹部、胸部リンパ節、混合病変)において、1病変カテゴリあたり3–8%の精度向上が見られた。
  • 肺結節および胸部リンパ節の検出は、他のカテゴリと比較して顕著に高い性能を示し、単一クラス検出と比較して3–8%の精度向上を達成した。
  • 512×512の画像をTitan X GPUで88msで処理できたため、リアルタイム推論が可能であることが示された。
  • 多くの誤検出は、後で放射線科医によって真正の病変であると確認された。これは、モデルが部分的な臨床的ラベルでは見逃された臨床的に重要な所見を検出できることを示している。
  • 異なるIoU閾値における検出精度曲線(図5a)は、特に高いIoU閾値で複数クラスモデルの優位性が一貫して示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。