[论文解读] Adaptive NMS: Refining Pedestrian Detection in a Crowd
该论文提出自适应-NMS(adaptive-NMS),一种基于行人密度动态调整抑制阈值的非极大值抑制方法,以提升人群中的行人检测性能。通过引入可学习子网络来预测实例特定的阈值,该方法减少了误检和漏检,在CityPersons数据集上达到10.8%的MR-2,在CrowdHuman数据集上达到49.73%的MR-2,性能达到当前最先进水平。
Pedestrian detection in a crowd is a very challenging issue. This paper addresses this problem by a novel Non-Maximum Suppression (NMS) algorithm to better refine the bounding boxes given by detectors. The contributions are threefold: (1) we propose adaptive-NMS, which applies a dynamic suppression threshold to an instance, according to the target density; (2) we design an efficient subnetwork to learn density scores, which can be conveniently embedded into both the single-stage and two-stage detectors; and (3) we achieve state of the art results on the CityPersons and CrowdHuman benchmarks.
研究动机与目标
- 解决在高度拥挤场景中因行人重叠和遮挡导致检测器性能下降的挑战。
- 克服固定阈值贪婪-NMS的局限性,后者要么漏检重叠行人,要么保留误检。
- 设计一种动态NMS机制,根据局部行人密度自适应调整抑制阈值,以保留真正阳性样本并抑制误检。
- 将方法无缝集成到单阶段和两阶段检测器中,无需架构约束,确保广泛适用性。
- 在标准评估协议下,于基准数据集上实现最先进性能。
提出的方法
- 提出自适应-NMS,一种动态NMS变体,利用可学习子网络基于局部行人密度预测实例特定的抑制阈值。
- 训练一个轻量级密度估计子网络,以特征图为输入,为每个检测提议输出一个密度得分。
- 利用密度得分调节每个实例的NMS阈值:密度越高,阈值越高,从而减少对重叠真正阳性样本的抑制。
- 将子网络集成到两阶段检测器(如Faster R-CNN with FPN)和单阶段检测器(如RFB-Net)中,推理开销极低。
- 采用可微分的软抑制机制,根据IoU和学习到的密度信息对检测得分进行衰减,避免硬性移除重叠框。
- 通过标准检测损失和可微分NMS近似,端到端优化整个流程,使反向传播能够通过NMS步骤。
实验结果
研究问题
- RQ1与固定阈值NMS相比,可学习的、密度自适应的NMS机制是否能显著提升高度拥挤场景中的行人检测性能?
- RQ2在单阶段与两阶段检测器中,自适应-NMS在人群行人检测中的表现如何?
- RQ3在高两两重叠(IoU > 0.5)场景下,自适应-NMS在多大程度上能减少误检和漏检?
- RQ4该方法是否能在不同人群密度下泛化良好,而无需针对数据集调整超参数?
- RQ5自适应-NMS是否能在不增加损失项或修改主干网络的前提下,于CityPersons和CrowdHuman等标准基准上实现最先进性能?
主要发现
- 在CityPersons测试集上,自适应-NMS将漏检率降低至10.8% MR-2,达到最先进性能。
- 在CrowdHuman验证集上,自适应-NMS实现49.73% MR-2,优于基线贪婪-NMS和软-NMS方法。
- 与贪婪-NMS相比,自适应-NMS在FPN上提升2.62% MR-2,在RFB Net上提升2.19% MR-2,表现一致提升。
- 学习到的密度子网络能有效捕捉局部人群密度,实现动态阈值调节,从而保留重叠的真正阳性样本。
- 该方法兼容两阶段和单阶段检测器,在无需架构修改的情况下均表现出一致的性能提升。
- 自适应-NMS优于现有方法如Repulsion Loss和AggLoss,且无需额外损失项或更强主干网络。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。