Skip to main content
QUICK REVIEW

[论文解读] Detecting Cancer Metastases on Gigapixel Pathology Images

Yun Liu, Krishna Gadepalli|arXiv (Cornell University)|Mar 3, 2017
AI in cancer detection参考文献 3被引用 521
一句话总结

本论文开发了基于 CNN 的框架,用于在千亿像素级病理切片中检测并定位小转移病灶,在 Camelyon16 上实现了前沿的病灶级检测以及高的切片级 AUC,并对预训练、颜色归一化和多尺度patching提出异议,显示轻量模型也能达到相同性能。

ABSTRACT

Each year, the treatment decisions for more than 230,000 breast cancer patients in the U.S. hinge on whether the cancer has metastasized away from the breast. Metastasis detection is currently performed by pathologists reviewing large expanses of biological tissues. This process is labor intensive and error-prone. We present a framework to automatically detect and localize tumors as small as 100 x 100 pixels in gigapixel microscopy images sized 100,000 x 100,000 pixels. Our method leverages a convolutional neural network (CNN) architecture and obtains state-of-the-art results on the Camelyon16 dataset in the challenging lesion-level tumor detection task. At 8 false positives per image, we detect 92.4% of the tumors, relative to 82.7% by the previous best automated approach. For comparison, a human pathologist attempting exhaustive search achieved 73.2% sensitivity. We achieve image-level AUC scores above 97% on both the Camelyon16 test set and an independent set of 110 slides. In addition, we discover that two slides in the Camelyon16 training set were erroneously labeled normal. Our approach could considerably reduce false negative rates in metastasis detection.

研究动机与目标

  • 应对在极大尺寸的全景切片(gigapixel 规模)中检测小转移病灶的挑战。
  • 开发一个基于补丁的 CNN 框架,在整个切片上实现高效推断,以定位肿瘤供病理学家使用。
  • 在 Camelyon16 和一个独立数据集上进行评估,以评估切片级准确性和肿瘤级定位。

提出的方法

  • 使用 Inception (V3) 架构对 299x299 的补丁进行分类,预测中心区域为 128x128 的肿瘤区域。
  • 使用平衡的补丁采样和广泛的数据增强(旋转、翻转、颜色抖动、补丁提取中的抖动)进行训练。
  • 通过在切片上以 128 像素步幅滑动热图并取最大热图值来进行切片级预测。
  • 使用 FROC 和 AUC 指标与先前方法进行比较,并探索模型大小(小型 vs 全量)、预训练、颜色归一化以及多尺度输入。
  • 对热图应用非极大抑制以提取评估用的肿瘤坐标。

实验结果

研究问题

  • RQ1一个基于 CNN 的补丁分类器是否能够在 gigapixel 病理切片上以高灵敏度和低假阳性率检测并定位小型转移灶?
  • RQ2在自然图像上的预训练、颜色归一化或多尺度输入对该任务是否有益?
  • RQ3模型大小对性能的影响有多大,以及基于热图的滑动窗口方法在切片级和肿瘤级评估中的有效性如何?

主要发现

  • 在 Camelyon16 测试集和独立数据集(NHO-1)上实现了高切片级 AUC(>97%)。
  • 在 40X 级别,验证集的 FROC 为 98.1%,每张切片最多 100 个假阳性;测试集 FROC 为 87.3(含 CI),AUC 为 96.7。
  • 基于 Inception 的小型模型(仅为全量参数的 3%)在性能上几乎与全模型相同。
  • 在广泛的数据增强和训练下,颜色归一化和多尺度输入并未提升性能。
  • 通过对旋转/翻转进行集成带来适度的提升;3 模型的集成在测试集上获得最佳结果(AUC 97.7)。
  • 该方法在两张标注为正常的切片中检测出肿瘤,原因是数据处理错误,显示对标签噪声具有鲁棒性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。