[论文解读] Softer-NMS: Rethinking Bounding Box Regression for Accurate Object Detection.
本文提出了一种名为 Softer-NMS 的新型边界框回归损失,通过联合学习定位方差与变换,以提升目标检测的准确性。通过在改进的 NMS 中利用该方差,其在 MS-COCO 上使用 VGG-16 Faster R-CNN 时将 AP 从 23.6% 提升至 29.1%,并在 ResNet-50 FPN Faster R-CNN 上将 AP 从 36.8% 提升至 37.8%,以极低的计算成本实现了最先进的定位精炼效果。
Non-maximum suppression (NMS) is essential for state-of-the-art object detectors to localize object from a set of candidate locations. However, accurate candidate location sometimes is not associated with a high classification score, which leads to object localization failure during NMS. In this paper, we introduce a novel bounding box regression loss for learning bounding box transformation and localization variance together. The resulting localization variance exhibits a strong connection to localization accuracy, which is then utilized in our new non-maximum suppression method to improve localization accuracy for object detection. On MS-COCO, we boost the AP of VGG-16 faster R-CNN from 23.6% to 29.1% with a single model and nearly no additional computational overhead. More importantly, our method is able to improve the AP of ResNet-50 FPN fast R-CNN from 36.8% to 37.8%, which achieves state-of-the-art bounding box refinement result.
研究动机与目标
- 解决在高精度边界框分类得分较低时,非极大值抑制(NMS)在目标定位中失效的问题。
- 通过建模定位方差与检测置信度之间的关系,提升定位准确性。
- 开发一种新型 NMS 变体,利用学习到的定位方差更有效地抑制定位不准确的候选框。
- 在计算开销极低的前提下,实现最先进的边界框精炼效果。
提出的方法
- 提出一种新的边界框回归损失,联合优化边界框变换与定位方差。
- 将定位方差建模为与实际定位准确性强相关性的可学习组件。
- 在推理过程中使用预测的方差来加权 NMS 中的抑制决策,优先保留更准确的框。
- 修改标准 NMS 机制,采用基于 IoU 的抑制策略,并以预测定位方差的倒数进行加权。
- 端到端训练模型,以提升分类与定位的鲁棒性。
- 将该方法应用于标准检测器(如 Faster R-CNN 和 Faster R-CNN with FPN),无需架构改动。
实验结果
研究问题
- RQ1在训练过程中学习定位方差是否能提升目标检测中 NMS 的鲁棒性?
- RQ2学习到的方差度量是否比仅使用分类得分更能反映实际定位准确性?
- RQ3是否可以通过引入方差感知的 NMS 机制,在不增加推理成本的前提下减少定位误差?
- RQ4与标准 NMS 相比,该方法在标准基准上的 AP 和定位精度表现如何?
主要发现
- Softer-NMS 在单个模型上将 VGG-16 Faster R-CNN 在 MS-COCO 上的 AP 从 23.6% 提升至 29.1%,且无额外计算开销。
- 该方法在 ResNet-50 FPN Faster R-CNN 上实现了 1.0% 的 AP 提升,从 36.8% 提升至 37.8%,创下边界框精炼的新 SOTA 记录。
- 学习到的定位方差与实际定位准确性具有强相关性,从而在 NMS 中实现更优的抑制决策。
- 该改进仅带来极低的计算开销,具备在实际部署中的可行性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。