QUICK REVIEW

[論文レビュー] MMDetection: Open MMLab Detection Toolbox and Benchmark

Kai Chen, Jiaqi Wang|arXiv (Cornell University)|Jun 17, 2019

Advanced Neural Network Applications参考文献 41被引用数 794

ひとこと要約

MMDetection は PyTorch ベースのモジュラーな物体検出およびインスタンスセグメンテーションのツールボックスで、豊富なモデル zoo と、アブレーションおよびコードベースを横断した比較を含む包括的なベンチマークを備えています。

ABSTRACT

We present MMDetection, an object detection toolbox that contains a rich set of object detection and instance segmentation methods as well as related components and modules. The toolbox started from a codebase of MMDet team who won the detection track of COCO Challenge 2018. It gradually evolves into a unified platform that covers many popular detection methods and contemporary modules. It not only includes training and inference codes, but also provides weights for more than 200 network models. We believe this toolbox is by far the most complete detection toolbox. In this paper, we introduce the various features of this toolbox. In addition, we also conduct a benchmarking study on different methods, components, and their hyper-parameters. We wish that the toolbox and benchmark could serve the growing research community by providing a flexible toolkit to reimplement existing methods and develop their own new detectors. Code and models are available at https://github.com/open-mmlab/mmdetection. The project is under active development and we will keep this document updated.

研究の動機と目的

物体検出器の構築と訓練のための統一されたモジュラー枠組みを提供する。
公正な比較を可能にするため、広範な検出手法とコンポーネントのベンチマークを行う。
研究者を導く実践的な学習、アブレーション、ハイパーパラメータの洞察を提供する。
拡張されたモデル重みとマルチフレームワーク対応を備えた、軽量で効率的かつスケーラブルなツールボックスを提示する。

提案手法

Backbone、Neck、DenseHead、RoIExtractor、RoIHead の抽象化を用いたモジュラ-detector アーキテクチャを導入し、検出器の容易な構成を実現する。
柔軟なカスタマイズを可能にするフックシステムを備えた、統一された PyTorch ベースのトレーニングパイプラインを提供する。
COCO 2017 上で複数の検出フレームワークとバックボーンをベンチマークし、精度・スピード・メモリを比較する。
損失関数、正規化層、学習スケール、その他のハイパーパラメータに関する大規模なアブレーション研究を実施する。
共用ハードウェア上で、MMDetection を Detectron、maskrcnn-benchmark、SimpleDet と速度・メモリ・APの観点で比較する。

実験結果

リサーチクエスチョン

RQ1モジュール式で再利用可能なコンポーネント設計は、検出器の開発と再現性にどのような影響を与えるか？
RQ2COCO 上での現代的な検出器とバックボーンの性能と効率のトレードオフはどのようになるか？
RQ3異なる損失関数、正規化戦略、訓練スケールは物体検出の性能にどのように影響するか？
RQ4等価条件下で、MMDetection は他のコードベースと速度、メモリ、精度の点でどのように比較されるか？

主な発見

Method	Backbone	LR Schd	AP^b	AP^b_{50}	AP^b_{75}	AP^m	AP^m_{50}	AP^m_{75}	AP^m_{S}	AP^m_{M}
Faster R-CNN	R-50 (c)	1x	36.6	58.5	39.2	-	-	-	-	-
Faster R-CNN	R-101 (c)	1x	38.8	60.5	42.3	-	-	-	-	-
Faster R-CNN	R-50	1x	36.4	58.4	39.1	-	-	-	-	-
Faster R-CNN	R-101	1x	38.5	60.3	41.6	-	-	-	-	-
X-101-32x4d	1x	-	40.1	62.0	43.8	-	-	-	-	-
X-101-64x4d	1x	-	41.3	63.3	45.2	-	-	-	-	-

MMDetection は幅広いモデルと200を超えるネットワーク重みを提供し、柔軟な再実装と開発を可能にする。
混在精度トレーニング（FP16）によりメモリを削減し、精度のわずかな低下で現代GPUでの速度向上をもたらす。
正規化戦略（FrozenBN、SyncBN、GN）とヘッド設計の選択は AP に大きく影響し、より深い bbox ヘッドや代替ヘッド設計が性能を向上させる。
学習規模とデータ拡張（レンジ対値のマルチスケール）は AP を緩やかに改善し、より広いレンジが大規模スケールで利得をもたらす。
IoU ベースおよび代替回帰損失は、損失ウェイトとサンプリング戦略によって得られる利得が異なり、調整条件下でいくつかの損失が Smooth L1 より優れることがある。
MMDetection はマルチノード訓練でほぼ線形のスピードアップを達成し、複数のバックボーンと検出器で競争力のある性能を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。