Skip to main content
QUICK REVIEW

[论文解读] Weakly Supervised Lesion Localization With Probabilistic-CAM Pooling

Wenwu Ye, Jin Yao|arXiv (Cornell University)|May 29, 2020
COVID-19 diagnosis using AI参考文献 1被引用 47
一句话总结

本文提出 Probabilistic-CAM (PCAM) pooling,一种弱监督全局池化方法,在训练时利用 CAM 定位以在胸部 X 光片上改进病灶定位,无需边界框注释,在 ChestX-ray14 上的分类与定位性能优于基线。

ABSTRACT

Localizing thoracic diseases on chest X-ray plays a critical role in clinical practices such as diagnosis and treatment planning. However, current deep learning based approaches often require strong supervision, e.g. annotated bounding boxes, for training such systems, which is infeasible to harvest in large-scale. We present Probabilistic Class Activation Map (PCAM) pooling, a novel global pooling operation for lesion localization with only image-level supervision. PCAM pooling explicitly leverages the excellent localization ability of CAM during training in a probabilistic fashion. Experiments on the ChestX-ray14 dataset show a ResNet-34 model trained with PCAM pooling outperforms state-of-the-art baselines on both the classification task and the localization task. Visual examination on the probability maps generated by PCAM pooling shows clear and sharp boundaries around lesion regions compared to the localization heatmaps generated by CAM. PCAM pooling is open sourced at https://github.com/jfhealthcare/Chexpert.

研究动机与目标

  • 促使仅使用图像级标签就能实现胸部病变的准确定位,以实现可扩展的训练。
  • 通过一个概率池化方案在训练过程中利用基于 CAM 的定位来引导特征聚合。
  • 在大规模胸部 X 光数据集上实现更好的分类与定位性能,且无需额外注释工作。

提出的方法

  • 骨干网络处理胸部 X 光片图像以生成特征图。
  • 使用 1x1 卷积对每个嵌入计算类别激活分数;通过 sigmoid 进行界限,以获得每个嵌入的疾病概率。
  • 将这些概率归一化,在 MIL 框架下获得用于加权全局池化的注意力权重。
  • 使用这些注意力权重对特征图进行池化,生成经过相同分类层的嵌入。
  • 在推断阶段,使用基于 sigmoid 的概率图作为定位热图,通过区域/概率阈值来获得区域和边界框。

实验结果

研究问题

  • RQ1在图像级监督下,PCAM pooling 是否能相比现有弱监督方法改善病灶定位?
  • RQ2将 CAM 基于定位集成到训练目标中是否同时提升胸部 X 光数据集上的分类和定位性能?
  • RQ3相较于标准 CAM 热图,PCAM 概率图对定位边界的定性影响是什么?

主要发现

  • PCAM pooling 在 ChestX-ray14 上相对于若干基线同时提升了分类 AUC 和定位指标。
  • PCAM pooling 产生的概率图在病灶周围呈现更清晰、更锐利的边界,优于传统 CAM 热图。
  • 定位实验表明 PCAM pooling 在多种疾病上实现了更高的基于 IoBB 的定位精度,尽管在假阳性方面有一定权衡。
  • 定性可视化显示相较于基于 LSE 的方法,病灶定位边界更精确、区域建议更广泛。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。