Skip to main content
QUICK REVIEW

[论文解读] MMDetection: Open MMLab Detection Toolbox and Benchmark

Kai Chen, Jiaqi Wang|arXiv (Cornell University)|Jun 17, 2019
Advanced Neural Network Applications参考文献 41被引用 794
一句话总结

MMDetection 是一个基于 PyTorch 的、模块化的目标检测和实例分割工具箱,拥有庞大的模型库和全面的基准测试,包括消融研究和跨代码库的比较。

ABSTRACT

We present MMDetection, an object detection toolbox that contains a rich set of object detection and instance segmentation methods as well as related components and modules. The toolbox started from a codebase of MMDet team who won the detection track of COCO Challenge 2018. It gradually evolves into a unified platform that covers many popular detection methods and contemporary modules. It not only includes training and inference codes, but also provides weights for more than 200 network models. We believe this toolbox is by far the most complete detection toolbox. In this paper, we introduce the various features of this toolbox. In addition, we also conduct a benchmarking study on different methods, components, and their hyper-parameters. We wish that the toolbox and benchmark could serve the growing research community by providing a flexible toolkit to reimplement existing methods and develop their own new detectors. Code and models are available at https://github.com/open-mmlab/mmdetection. The project is under active development and we will keep this document updated.

研究动机与目标

  • 提供一个用于构建和训练目标检测器的统一、模块化框架。
  • 对广泛的检测方法和组件进行基准测试,以实现公平比较。
  • 提供实用的训练、消融实验和超参数见解,以指导研究人员。
  • 提供一个轻量、高效且可扩展的工具箱,具备扩展的模型权重和多框架支持。

提出的方法

  • 引入一个模块化检测器架构,具有 Backbone、Neck、DenseHead、RoIExtractor 和 RoIHead 的抽象,以实现检测器的轻松组合。
  • 提供一个基于 PyTorch 的统一训练流水线,配备钩子系统以实现灵活定制。
  • 在 COCO 2017 上对多种检测框架和骨干网络进行基准测试,以比较准确性、速度和内存。
  • 对损失函数、归一化层、训练尺度和其他超参数进行广泛的消融研究。
  • 在共享硬件条件下,将 MMDetection 与 Detectron、maskrcnn-benchmark 和 SimpleDet 在速度、内存和 AP 方面进行对比。

实验结果

研究问题

  • RQ1模块化、可重复使用的组件设计如何影响检测器的开发和可重复性?
  • RQ2在 COCO 上,现代检测器和骨干网络的性能与效率权衡是什么?
  • RQ3不同的损失、归一化策略和训练尺度如何影响目标检测性能?
  • RQ4在等效条件下,MMDetection 与其他代码库在速度、内存和准确性方面的比较如何?

主要发现

  • MMDetection 提供了广泛的模型和超过 200 个网络权重,便于灵活的重新实现和开发。
  • 混合精度训练(FP16)在内存上显著减少,且对精度的损失极小,并在现代 GPU 上带来速度提升。
  • 归一化策略(FrozenBN、SyncBN、GN)和头部设计选择对 AP 有显著影响,使用更深的边框回归头和替代头部架构可提升性能。
  • 训练尺度和数据增强(范围多尺度与数值多尺度)对 AP 有中等提升,较宽的范围在较大尺度上带来收益。
  • 基于 IoU 的回归损失和替代回归损失在收益上取决于损失权重和采样策略,在经过调参后,一些损失在某些条件下优于 Smooth L1。
  • MMDetection 在多节点训练下实现近线性加速,并在多种骨干网络和检测器上表现出竞争力。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。