QUICK REVIEW

[论文解读] Weighted Boxes Fusion: ensembling boxes for object detection models

Roman Solovyev, Weimin Wang|arXiv (Cornell University)|Oct 29, 2019

Advanced Neural Network Applications被引用 39

一句话总结

本文提出了加权框融合（Weighted Boxes Fusion, WBF）方法，通过利用置信度分数对多个边界框预测结果进行加权平均，实现模型集成，从而提升目标检测性能。在 COCO 和 Open Images 数据集上的实验表明，WBF 通过基于置信度的加权方式有效融合重叠检测框，实现了当前最优性能，且代码已公开。

ABSTRACT

In this work, we present a novel method for combining predictions of object detection models: weighted boxes fusion. Our algorithm utilizes confidence scores of all proposed bounding boxes to constructs the averaged boxes. We tested method on several datasets and evaluated it in the context of the Open Images and COCO Object Detection tracks, achieving top results in these challenges. The source code is publicly available at this https URL

研究动机与目标

解决多个目标检测模型产生的不一致或重叠边界框预测问题。
通过利用置信度分数智能融合多个预测框，提升检测性能。
开发一种可泛化、轻量级的后处理技术，适用于多种检测基准。
在 COCO 和 Open Images 等主要目标检测挑战中取得顶尖结果。

提出的方法

该方法聚合来自多个目标检测器的多个预测边界框。
利用每个框的置信度分数作为权重，计算边界框坐标的加权平均。
通过计算输入框加权均值得到新框的位置和大小，实现重叠框的合并。
使用 IoU（交并比）判断框之间的重叠关系，实现相关预测的分组。
从合并的框中选择置信度最高的框作为最终融合框。
该方法作为后处理步骤应用，无需模型微调或结构修改。

实验结果

研究问题

RQ1置信度分数能否被有效利用以提升融合后目标检测预测的质量？
RQ2与非加权或非基于置信度的融合方法相比，加权融合在 mAP 指标上的表现如何？
RQ3WBF 在 COCO 和 Open Images 等标准基准上的性能提升程度如何？
RQ4该方法在不同检测模型和数据集上是否具备鲁棒性？

主要发现

加权框融合在 Open Images 目标检测挑战中取得了当前最优结果。
与基线融合技术相比，WBF 在 COCO 数据集上的平均平均精度（mAP）有所提升。
WBF 在多个检测模型和测试集上均表现出一致的性能增益。
该方法作为后处理步骤效果显著，且无需模型微调或架构修改。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。