Skip to main content
QUICK REVIEW

[論文レビュー] Deep Weakly-Supervised Learning Methods for Classification and Localization in Histology Images: A Survey

Jérôme Rony, Soufiane Belharbi|arXiv (Cornell University)|Sep 8, 2019
AI in cancer detection被引用数 27
ひとこと要約

本調査では、ヒストロロジー画像分類および局在化のためのディープ弱教師付き学習手法の分類体系を提案し、下位から上位へのアプローチと上位から下位へのアプローチに分類する。GlaSおよびCAMELYON16データセット上で代表的な手法を評価した結果、CAMの低活性化、過剰活性化、しきい値感受性、モデル選択バイアスのため、局在化性能が低く、ヒストロロジー特有の手法が一般自然画像向け手法を上回ることがわかった。

ABSTRACT

Using deep learning models to diagnose cancer from histology data presents several challenges. Cancer grading and localization of regions of interest (ROIs) in these images normally relies on both image- and pixel-level labels, the latter requiring a costly annotation process. Deep weakly-supervised object localization (WSOL) methods provide different strategies for low-cost training of deep learning models. Using only image-class annotations, these methods can be trained to classify an image, and yield class activation maps (CAMs) for ROI localization. This paper provides a review of state-of-art DL methods for WSOL. We propose a taxonomy where these methods are divided into bottom-up and top-down methods according to the information flow in models. Although the latter have seen limited progress, recent bottom-up methods are currently driving much progress with deep WSOL methods. Early works focused on designing different spatial pooling functions. However, these methods reached limited localization accuracy, and unveiled a major limitation -- the under-activation of CAMs which leads to high false negative localization. Subsequent works aimed to alleviate this issue and recover complete object. Representative methods from our taxonomy are evaluated and compared in terms of classification and localization accuracy on two challenging histology datasets. Overall, the results indicate poor localization performance, particularly for generic methods that were initially designed to process natural images. Methods designed to address the challenges of histology data yielded good results. However, all methods suffer from high false positive/negative localization. Four key challenges are identified for the application of deep WSOL methods in histology -- under/over activation of CAMs, sensitivity to thresholding, and model selection.

研究の動機と目的

  • ヒストロロジー画像解析におけるピクセルレベルのアノテーションの高コストおよび複雑さを軽減するため、弱教師付き学習手法をレビューすること。
  • ヒストロロジー画像に特化した最新のディープ弱教師付きオブジェクト局在化(WSOL)技術を特定し、分類すること。
  • 分類および局在化精度に注目して、公開されたヒストロロジー画像データセット上でWSOL手法の性能を評価すること。
  • CAMの低活性化、過剰活性化、しきい値感受性、WSOLにおけるモデル選択の課題といった主要な課題を分析すること。
  • ドメイン固有の事前知識とより良い疑似アノテーション戦略を組み込むことで、ヒストロロジーにおけるWSOL性能を向上させるための研究方向性を提案すること。

提案手法

  • WSOL手法を下位から上位への情報フロー(bottom-up)と上位から下位への情報フロー(top-down)に分ける、新規の分類体系を提案する。
  • GlaS(結腸がん)およびCAMELYON16(乳がん)という2つの公開ヒストロロジー画像データセットを用い、標準的手順に従って代表的なWSOL手法を評価する。
  • 画像ラベルのみで訓練されたディープニューラルネットワークから生成されるクラス活性化マップ(CAMs)を局在化出力として採用する。
  • パラメータ変更、自己注意機構、浅い特徴量、疑似アノテーション、タスクの分離といった手法を用いて、CAMの限界を緩和する。
  • 事前学習済み分類器を用いてピクセル単位の監視信号を生成する疑似アノテーションを実施し、局在化のロバスト性を向上させる。
  • 2段階訓練戦略を導入する:まず分類器を訓練し、それを固定した後、別個に局在化器を訓練することで、分類と局在化の性能を分離する。
(a)
(a)

実験結果

リサーチクエスチョン

  • RQ1下位から上位と上位から下位のディープWSOL手法は、ヒストロロジー画像における情報フローと性能でどのように異なるか?
  • RQ2自然画像向けに設計された一般的なWSOL手法は、ヒストロロジー画像への適用において、局在化精度の観点でどの程度一般化可能か?
  • RQ3ヒストロロジーにおけるWSOLで見られる局在化性能の低さの主な原因は何であり、自然画像ドメインの課題とはどのように異なるか?
  • RQ4CAMの低活性化と過剰活性化は局在化の信頼性にどのように影響し、それらを緩和する技術は何か?
  • RQ5分類性能と局在化性能のどちらに基づいてモデルを選択するかが、ヒストロロジーにおける最終的なWSOL性能に与える影響は?

主な発見

  • 下位から上位のWSOL手法は、注意機構や特徴量の精錬の進展により、現在ヒストロロジー画像の局在化で上位の性能を示している。
  • 自然画像向けに設計された一般的なWSOL手法は、ヒストロロジーデータでは局在化性能が低く、特に偽陽性および偽陰性の割合が高い。
  • CAMの低活性化は、わずかな特徴的な領域しか活性化されないため、偽陰性を引き起こし、より大きな腫瘍領域を逃す。
  • ヒストロロジーで新たに観察された過剰活性化は、前景と背景領域の類似性が高いため、偽陽性を引き起こす。
  • ROIサイズ制約や事前学習済み分類器からの疑似アノテーションといった事前知識を用いることで、偽陽性および偽陰性を低減し、局在化性能が向上する。
  • 分類精度のみに基づくモデル選択は、局在化性能を著しく低下させる。分類と局在化の訓練を分離することで、全体の性能が向上する。
(b)
(b)

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。