Skip to main content
QUICK REVIEW

[论文解读] A Simple Semi-Supervised Learning Framework for Object Detection

Kihyuk Sohn, Zizhao Zhang|arXiv (Cornell University)|May 10, 2020
Advanced Neural Network Applications参考文献 69被引用 325
一句话总结

STAC 引入一个简单的两阶段半监督框架,使用教师从未标注数据生成高置信度伪边界框,并通过强增强来训练以改进目标检测器,在 MS-COCO 和 VOC07 上实现显著的数据效率提升。

ABSTRACT

Semi-supervised learning (SSL) has a potential to improve the predictive performance of machine learning models using unlabeled data. Although there has been remarkable recent progress, the scope of demonstration in SSL has mainly been on image classification tasks. In this paper, we propose STAC, a simple yet effective SSL framework for visual object detection along with a data augmentation strategy. STAC deploys highly confident pseudo labels of localized objects from an unlabeled image and updates the model by enforcing consistency via strong augmentations. We propose experimental protocols to evaluate the performance of semi-supervised object detection using MS-COCO and show the efficacy of STAC on both MS-COCO and VOC07. On VOC07, STAC improves the AP$^{0.5}$ from $76.30$ to $79.08$; on MS-COCO, STAC demonstrates $2{ imes}$ higher data efficiency by achieving 24.38 mAP using only 5\% labeled data than supervised baseline that marks 23.86\% using 10\% labeled data. The code is available at https://github.com/google-research/ssl_detection/.

研究动机与目标

  • 由于标注成本高,推动标签高效的目标检测。
  • 开发一个简单的 SSL 框架,利用伪标注和增强一致性。
  • 展示 STAC 在 MS-COCO 和 PASCAL VOC 的低标签场景中的有效性。

提出的方法

  • 两阶段训练,灵感来自 Noisy-Student:在带标签数据上训练一个教师,然后为未标注图像生成伪边框。
  • 使用高置信度阈值筛选伪边框并进行测试时推断以获得伪标签。
  • 对未标注数据应用强且多样化的数据增强(全局颜色、全局几何、框级变换和 Cutout),并相应地调整伪边框。
  • 在强增强后的伪标签下计算无监督损失,同时结合带标注数据的有监督损失。
  • 使用简单的无监督损失权重 lambda_u 和置信度阈值 tau(tau ≈ 0.9,lambda_u ≈ 2)来优化 Faster R-CNN。
  • 在 MS-COCO 和 PASCAL VOC 上用 1–10% 标注数据和全部数据进行评估,并与有监督基线进行比较。

实验结果

研究问题

  • RQ1一个使用伪标注和强增强的简单 SSL 框架在有限标注数据下是否能改善对象检测?
  • RQ2伪标签质量、增强强度和未标注数据量的变化如何影响 MS-COCO 与 VOC07 的检测性能?
  • RQ3在低标注 regime 下 STAC 的有效超参数(tau、lambda_u)有哪些?

主要发现

  • STAC 在 MS-COCO 的 1–10% 标注数据下持续优于有监督基线。
  • 使用 5% 标注数据时,STAC 将 mAP 从 18.47(有监督)提高到 24.38;使用 10% 标注数据时,从 23.86 提高到 28.64。
  • STAC 在 100% COCO 上达到 39.21 mAP(对比有监督基线 37.63,强增强后为 39.48)。
  • 在 VOC07 上,STAC 结合额外的未标注数据达到 46.01 mAP(AP50 79.08),而有监督基线为 42.60 / 76.30。
  • STAC 数据效率在低标注场景大约提升 2x,尤其在 5% 和 10% 标注数据时,并且从更大的未标注数据池中获益。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。