Skip to main content
QUICK REVIEW

[论文解读] Exploiting saliency for object segmentation from image level labels

Seong Joon Oh, Rodrigo Benenson|arXiv (Cornell University)|Jan 28, 2017
Visual Attention and Saliency Detection参考文献 50被引用 31
一句话总结

该论文提出了一种新颖的弱监督语义分割方法,结合图像级别标签与类别无关显著性图,实现了最先进性能。通过利用图像分类器生成的物体种子和显著性图进行范围预测,该方法在Pascal VOC 2012上达到了全监督性能的80%,显著优于仅使用图像级别监督的先前方法。

ABSTRACT

There have been remarkable improvements in the semantic labelling task in the recent years. However, the state of the art methods rely on large-scale pixel-level annotations. This paper studies the problem of training a pixel-wise semantic labeller network from image-level annotations of the present object classes. Recently, it has been shown that high quality seeds indicating discriminative object regions can be obtained from image-level labels. Without additional information, obtaining the full extent of the object is an inherently ill-posed problem due to co-occurrences. We propose using a saliency model as additional information and hereby exploit prior knowledge on the object extent and image statistics. We show how to combine both information sources in order to recover 80% of the fully supervised performance - which is the new state of the art in weakly supervised training for pixel-wise semantic labelling. The code is available at https://goo.gl/KygSeb.

研究动机与目标

  • 解决在无像素级标注的情况下训练精确像素级语义分割模型的挑战。
  • 通过将显著性作为先验,超越判别性物体种子以预测物体范围,从而改进弱监督学习。
  • 在仅使用图像级别监督的情况下实现最先进性能,最大限度减少对昂贵像素标注的依赖。
  • 分析物体种子与显著性之间的协同作用,以指导深度网络训练。
  • 证明即使显著性图存在噪声,也能为物体边界预测提供强有力的归纳偏置。

提出的方法

  • 该方法使用训练好的图像分类器,基于图像级别标签生成高置信度的物体种子——即对应于物体类别的判别性区域。
  • 它采用在边界框标注上训练的类别无关显著性模型,以预测物体范围并抑制背景区域。
  • 一种引导分割架构将种子和显著性图作为伪真实标签监督,用于训练分割网络。
  • 引导标注器通过融合种子置信度和显著性图生成伪标签,并以前景/背景的精确率和召回率作为评估指标。
  • 应用CRF后处理步骤以优化最终的分割预测结果。
  • 整个流程在训练过程中完全避免使用像素级标注,仅依赖图像级别标签和显著性图。

实验结果

研究问题

  • RQ1当仅提供图像级别标签时,显著性图是否能有效引导完整物体范围的恢复?
  • RQ2与仅使用种子相比,将物体种子与显著性图结合如何提升分割性能?
  • RQ3显著性模型的质量在多大程度上影响最终的分割精度?
  • RQ4仅使用图像级别标签和显著性图,弱监督模型能否实现接近全监督基线的性能?
  • RQ5在弱监督语义分割中,显著性相对于其他先验(如大小、人工修正)的相对贡献是什么?

主要发现

  • 所提方法(同时使用物体种子和显著性图,记为$\mathcal{G}_2$)在Pascal VOC 2012测试集上实现了56.7的平均交并比(mIoU),达到全监督DeepLabv1性能的80.6%。
  • 显著性图真值情况(使用真实显著性掩码)实现了56.9 mIoU,表明通过改进显著性模型仍有进一步提升空间。
  • 即使不使用种子,仅使用显著性的引导方法($\mathcal{G}_0$)也达到了48.8 mIoU,证明显著性图本身即为强大的监督信号。
  • 该方法显著优于仅使用图像级别标签的先前最先进方法,包括MIL-FCN、CCNN、WSSL和SEC。
  • 引入显著性图使性能相比仅使用种子的基线($\mathcal{G}_0$ vs. $\mathcal{G}_2$)提升了5.1个百分点绝对值,证实其在范围预测中的关键作用。
  • 该方法在所有仅使用图像级别标签且无任何人工干预修正的方法中,实现了迄今为止报告的最佳性能。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。