QUICK REVIEW

[论文解读] Data Distillation: Towards Omni-Supervised Learning

Ilija Radosavovic, Piotr Dollár|arXiv (Cornell University)|Dec 12, 2017

Multimodal Machine Learning Applications参考文献 40被引用 43

一句话总结

本文提出数据提炼（data distillation）方法，通过利用单一模型在多种数据增强变换下预测结果的集成，从大规模无标签互联网数据中生成合成标注。该方法在 COCO 关键点检测和目标检测任务上超越了完全监督基线模型，关键点检测任务中最高提升 2.0 AP，目标检测任务中 AP_M 提升 1.8 AP，证明了全监督学习（omni-supervised learning）的可行性。

ABSTRACT

We investigate omni-supervised learning, a special regime of semi-supervised learning in which the learner exploits all available labeled data plus internet-scale sources of unlabeled data. Omni-supervised learning is lower-bounded by performance on existing labeled datasets, offering the potential to surpass state-of-the-art fully supervised methods. To exploit the omni-supervised setting, we propose data distillation, a method that ensembles predictions from multiple transformations of unlabeled data, using a single model, to automatically generate new training annotations. We argue that visual recognition models have recently become accurate enough that it is now possible to apply classic ideas about self-training to challenging real-world data. Our experimental results show that in the cases of human keypoint detection and general object detection, state-of-the-art models trained with data distillation surpass the performance of using labeled data from the COCO dataset alone.

研究动机与目标

探索全监督学习，即结合所有可用的标注数据与海量无标签数据源的训练范式。
解决在真实世界大规模视觉识别任务中利用无标签数据的挑战，且无需修改模型或损失函数。
证明现代高精度模型能够可靠地生成有用的伪标签用于自训练。
评估数据提炼在 COCO 关键点检测和目标检测等挑战性基准上的有效性。
展示通过利用互联网规模的无标签数据，数据提炼可超越完全监督基线模型。

提出的方法

通过对单个输入应用多种数据增强变换（如翻转、缩放）生成无标签图像的预测结果。
将这些变换视图下的预测结果进行集成，生成更鲁棒且多样化的伪标签。
将集成预测结果作为合成训练标签，用于重新训练学生模型。
端到端应用该方法，不修改模型架构或损失函数，将伪标签视为真实标签处理。
使用每类别的置信度阈值，平衡目标检测中各类别实例数量。
通过在预测框并集上进行边界框投票，聚合不同变换下的检测结果。

实验结果

研究问题

RQ1数据提炼能否有效利用互联网规模的无标签数据，超越完全监督学习性能？
RQ2在多个数据变换下对单一模型的预测结果进行集成，是否能提供超越单次预测的有意义信号？
RQ3数据提炼能否在真实世界大规模基准（如 COCO 关键点检测和目标检测）上提升性能？
RQ4在使用相同标注数据加无标签数据的情况下，数据提炼与完全监督学习相比表现如何？
RQ5数据提炼是否可在不修改模型或损失函数的前提下有效应用？

主要发现

在 COCO 关键点检测任务上，数据提炼相较 Mask R-CNN 基线模型提升了 2.0 AP，性能超过使用相同数量人工标注数据的训练结果。
在目标检测任务中，当使用 co-115 作为标注数据、un-120 作为无标签数据时，数据提炼使 AP 提升 0.8–0.9 点，AP50 提升 0.9–1.1 点。
在 AP_M 指标上提升最大，从 43.7 提升至 45.5，增幅达 1.8 点（使用 ResNeXt-101-32×4 模型）。
该方法在所有测试的主干网络架构上均一致提升性能，包括 ResNet-50、ResNet-101 和 ResNeXt-101-32×4。
结果表明，数据提炼可超越完全监督基线模型，验证了全监督学习的潜力。
数据提炼的成功表明，现代模型已具备足够精度，可生成可靠的伪标签，从而减少对复杂数据清洗启发式规则的依赖。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。