Skip to main content
QUICK REVIEW

[论文解读] CAMEL: A Weakly Supervised Learning Framework for Histopathology Image Segmentation

Gang Xu, Zhigang Song|arXiv (Cornell University)|Aug 28, 2019
AI in cancer detection参考文献 23被引用 23
一句话总结

CAMEL 是一种弱监督学习框架,用于组织病理学图像分割,仅使用图像级别标签,通过结合多实例学习(cMIL)方法自动生成高质量的实例级别标签。在 CAMELYON16 和结直肠腺瘤数据集上,其分割性能与全监督方法相当,证明了无需人工标注即可实现自动标签增强的有效性。

ABSTRACT

Histopathology image analysis plays a critical role in cancer diagnosis and treatment. To automatically segment the cancerous regions, fully supervised segmentation algorithms require labor-intensive and time-consuming labeling at the pixel level. In this research, we propose CAMEL, a weakly supervised learning framework for histopathology image segmentation using only image-level labels. Using multiple instance learning (MIL)-based label enrichment, CAMEL splits the image into latticed instances and automatically generates instance-level labels. After label enrichment, the instance-level labels are further assigned to the corresponding pixels, producing the approximate pixel-level labels and making fully supervised training of segmentation models possible. CAMEL achieves comparable performance with the fully supervised approaches in both instance-level classification and pixel-level segmentation on CAMELYON16 and a colorectal adenoma dataset. Moreover, the generality of the automatic labeling methodology may benefit future weakly supervised learning studies for histopathology image analysis.

研究动机与目标

  • 通过仅利用图像级别标签,减少组织病理学图像分割中对昂贵像素级别标注的依赖。
  • 开发一种自动化方法,将图像级别标签增强为实例级别标签,无需人工提供的边界框或涂鸦标注。
  • 利用自动生成的近似像素级别标签,实现分割模型的全监督训练。
  • 评估标签增强方法在不同组织病理学数据集和任务上的泛化能力。
  • 发布一个新的结直肠腺瘤数据集,以支持未来在弱监督组织病理学分析方面的研究。

提出的方法

  • CAMEL 将全切片图像(WSIs)划分为均匀尺寸的网格状实例,以支持实例级别分析。
  • 采用结合多实例学习(cMIL)方法,整合最大-最大和最大-最小实例选择标准,以平衡数据分布并提升标签质量。
  • 在构建的实例级别数据集上训练 cMIL 模型,从图像级别监督中预测实例级别标签。
  • 随后将实例级别标签直接分配给其对应像素,形成用于分割训练的近似像素级别掩码。
  • 应用级联数据增强策略,以提升模型泛化能力并改善性能。
  • 该框架支持使用增强后的像素级别标签对分割模型(如 DeepLabv2、U-Net)进行端到端训练。

实验结果

研究问题

  • RQ1仅使用图像级别标签的弱监督框架能否实现与全监督模型相当的分割性能?
  • RQ2从图像级别标签自动生成实例级别标签的方法能否在组织病理学分割中超越现有弱监督方法?
  • RQ3自动生成的实例级别标签的质量如何影响下游像素级别分割性能?
  • RQ4基于 cMIL 的标签增强方法是否能在不同组织病理学数据集和癌种间实现泛化?
  • RQ5所提出的标签增强策略能否在保持高分割精度的同时减少过标注?

主要发现

  • 在 CAMELYON16 数据集上,CAMEL 的像素级别 F1 分数达到 91.8%,IoU 为 84.8%,与全监督基线(FSB)性能相当。
  • CAMEL 在 160×160 实例尺寸下,实例级别分类的敏感度达到 94.7%,特异度达到 94.1%,优于图像级别 FSB 及其他弱监督方法。
  • 在结直肠腺瘤数据集上,CAMEL 的像素级别 F1 分数分别为 89.7%(160×160)和 86.1%(320×320),接近全监督基线的 87.5%。
  • 使用更细粒度的实例尺寸(如 160×160)可减少过标注并提升分割质量,证明了更高粒度在标签生成中的优势。
  • CAMEL 在实例级别分类和像素级别分割方面均优于最先进的弱监督方法,如 WILDCAT、DWS-MIL 和 CDWS-MIL。
  • 该框架的标签增强策略在新发布的结直肠腺瘤数据集上表现出良好泛化能力,证实其在不同组织病理学任务中的鲁棒性与可迁移性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。