[论文解读] Stitcher: Feedback-driven Data Provider for Object Detection
Stitcher 是一种基于反馈的数据增强方法,通过重缩放和拼接图像为更小的组件,提升目标检测性能,确保小目标在训练损失中贡献更大。该方法在检测器、主干网络、数据集和任务上均实现了稳定性能提升,且计算开销可忽略不计。
Object detectors commonly vary quality according to scales, where the performance on small objects is the least satisfying. In this paper, we investigate this phenomenon and discover that: in the majority of training iterations, small objects contribute barely to the total loss, causing poor performance with imbalanced optimization. Inspired by this finding, we present Stitcher, a feedback-driven data provider, which aims to train object detectors in a balanced way. In Stitcher, images are resized into smaller components and then stitched into the same size to regular images. Stitched images contain inevitable smaller objects, which would be beneficial with our core idea, to exploit the loss statistics as feedback to guide next-iteration update. Experiments have been conducted on various detectors, backbones, training periods, datasets, and even on instance segmentation. Stitcher steadily improves performance by a large margin in all settings, especially for small objects, with nearly no additional computation in both training and testing stages.
研究动机与目标
- 为解决目标检测器训练中的不平衡问题,即小目标对损失的贡献微乎其微,导致其性能表现不佳。
- 通过增加小目标对训练损失的贡献,改善优化平衡。
- 设计一种数据增强方法,利用损失反馈动态引导训练,且不增加计算开销。
- 在多种检测器、主干网络、数据集和任务(包括实例分割)上评估其有效性。
提出的方法
- 将图像分割为更小的组件,再重新拼接回原始尺寸,生成包含保留小目标的新训练样本。
- 该方法利用每次训练迭代的损失统计信息作为反馈,指导下一次迭代的数据采样与优化。
- 由于重缩放和重新组装的过程,拼接后的图像天然包含更多小目标,从而增强其在训练中的表示。
- 反馈机制调整数据采样策略,优先选择小目标对损失贡献更大的样本,从而改善优化平衡。
- 该方法与检测器架构、主干网络和训练调度无关,具备广泛适用性。
实验结果
研究问题
- RQ1为何在目标检测中,小目标尽管对性能至关重要,却仍面临优化不佳的问题?
- RQ2能否利用训练迭代中的损失统计信息作为反馈,实现不同目标尺度间优化的再平衡?
- RQ3通过图像拼接实现的数据增强是否能改善训练平衡性与检测准确率,特别是对小目标的提升?
- RQ4此类方法是否可普遍适用于各类检测器、主干网络和数据集,且不增加推理成本?
主要发现
- Stitcher 在所有评估的检测器和数据集上均显著提升了小目标的检测性能。
- 该方法在 mAP 上实现了稳定增益,其中小目标 AP 的提升最为显著,表明优化平衡性得到改善。
- 性能增益在不同训练周期、主干网络和数据集上均得以保持,展现出良好的鲁棒性。
- 该方法在训练和推理阶段均几乎不增加额外计算成本,适用于实际部署。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。