QUICK REVIEW

[論文レビュー] Detecting Cancer Metastases on Gigapixel Pathology Images

Yun Liu, Krishna Gadepalli|arXiv (Cornell University)|Mar 3, 2017

AI in cancer detection参考文献 3被引用数 521

ひとこと要約

本論文は、gigapixel病理スライドにおける小さな転移を検出・局在するためのCNNベースの枠組みを提案し、病変レベル検出で最先端を達成し、Camelyon16でのスライドレベルAUCも高い。事前学習、カラー正規化、およびマルチスケールパッチングには反対の立場を取り、軽量なモデルが性能と同等であることを示す。

ABSTRACT

Each year, the treatment decisions for more than 230,000 breast cancer patients in the U.S. hinge on whether the cancer has metastasized away from the breast. Metastasis detection is currently performed by pathologists reviewing large expanses of biological tissues. This process is labor intensive and error-prone. We present a framework to automatically detect and localize tumors as small as 100 x 100 pixels in gigapixel microscopy images sized 100,000 x 100,000 pixels. Our method leverages a convolutional neural network (CNN) architecture and obtains state-of-the-art results on the Camelyon16 dataset in the challenging lesion-level tumor detection task. At 8 false positives per image, we detect 92.4% of the tumors, relative to 82.7% by the previous best automated approach. For comparison, a human pathologist attempting exhaustive search achieved 73.2% sensitivity. We achieve image-level AUC scores above 97% on both the Camelyon16 test set and an independent set of 110 slides. In addition, we discover that two slides in the Camelyon16 training set were erroneously labeled normal. Our approach could considerably reduce false negative rates in metastasis detection.

研究の動機と目的

超巨大な全体スライド画像（gigapixelスケール）において小さな転移を検出する課題に対処する。
病理医のために腫瘍を局在させるため、スライド全体で効率的な推論を行うパッチベースのCNNフレームワークを開発する。
Camelyon16と独立データセットで評価し、スライドレベルの精度と腫瘍レベルの局在を評価する。

提案手法

Inception (V3) アーキテクチャを用いて299x299パッチを分類し、中心部の128x128腫瘍領域を予測する。
バランスの取れたパッチサンプリングと広範なデータ拡張（回転、反転、カラージッター、パッチ抽出時のジッター）で学習する。
スライド全体に128ピクセルストライドのヒートマップをスライド上でスライドさせ、ヒートマップの最大値をとってスライドレベル予測を行う。
FROCとAUC指標を用いて既存手法と比較し、モデルサイズ（小型 vs フル）、事前学習、カラー正規化、マルチスケール入力を探索する。
評価のため腫瘍座標を抽出するためヒートマップ上で非最大抑制を適用する。

実験結果

リサーチクエスチョン

RQ1CNNベースのパッチ分類器は、gigapixelの病理スライドにおいて高感度かつ低偽陽性率で小さな転移を検出・局在できるのか？
RQ2自然画像での事前学習、カラー正規化、またはマルチスケール入力はこのタスクに有益か？
RQ3モデルサイズが性能に及ぼす影響は何か、ヒートマップベースのスライディングウィンドウアプローチはスライドレベルおよび腫瘍レベルの評価にどれほど有効か？

主な発見

Input	FROC (validation)	@8FP (validation)	AUC (validation)	FROC (test)	@8FP (test)	AUC (test)
40X	98.1	100	99.0	87.3 (83.2, 91.1)	91.1 (87.2, 94.5)	96.7 (92.6, 99.6)
40X-pretrained	99.3	100	100	85.5 (81.0, 89.5)	91.1 (86.8, 94.6)	97.5 (93.8, 99.8)
40X-small	99.3	100	100	86.4 (82.2, 90.4)	92.4 (88.8, 95.7)	97.1 (93.2, 99.8)
ensemble-of-3	-	-	-	88.5 (84.3, 92.2)	92.4 (88.7, 95.6)	97.7 (93.0, 100)
20X-small	94.7	100	99.6	85.5 (81.0, 89.7)	91.1 (86.9, 94.8)	98.6 (96.7, 100)
10X-small	88.7	97.2	97.7	79.3 (74.2, 84.1)	84.9 (80.0, 89.4)	96.5 (91.9, 99.7)
40X+20X-small	94.9	98.6	99.0	85.9 (81.6, 89.9)	92.9 (89.3, 96.1)	97.0 (93.1, 99.9)
40X+10X-small	93.8	98.6	100	82.2 (77.0, 86.7)	87.6 (83.2, 91.7)	98.6 (96.2, 99.9)
Pathologist	-	-	-	73.3*	73.3*	96.6
Camelyon16 winner	-	-	-	80.7	82.7	99.4

Camelyon16のテストセットと独立データセット（NHO-1）でスライドレベルAUCが高い値を達成（>97%）。
40Xスケールで、検証時の最大偽陽性100件に対するFROCは98.1%、テストFROCは87.3（CI付き）で、AUCは96.7。
小型Inceptionベースのモデル（フルパラメータの3%）がフルモデルとほぼ同等の性能を達成。
広範なデータ拡張とトレーニングの下で、カラー正規化とマルチスケール入力は性能を改善しなかった。
回転/反転を横断したアンサンブリングは控えめな改善をもたらし、3モデルのアンサンブルが最良の結果を示した（テストでAUC 97.7）。
データ処理エラーによりnormalとラベル付けされた2枚のスライドで腫瘍を検出したことは、ラベルノイズに対する頑健性を示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。