QUICK REVIEW

[논문 리뷰] MMDetection: Open MMLab Detection Toolbox and Benchmark

Kai Chen, Jiaqi Wang|arXiv (Cornell University)|2019. 06. 17.

Advanced Neural Network Applications참고 문헌 41인용 수 794

한 줄 요약

MMDetection은 PyTorch 기반의 모듈식 객체 탐지 및 인스턴스 세분화 도구상자이며, 모델 zoo가 크고 절삭 및 크로스 코드베이스 비교를 포함한 포괄적 벤치마크를 제공합니다.

ABSTRACT

We present MMDetection, an object detection toolbox that contains a rich set of object detection and instance segmentation methods as well as related components and modules. The toolbox started from a codebase of MMDet team who won the detection track of COCO Challenge 2018. It gradually evolves into a unified platform that covers many popular detection methods and contemporary modules. It not only includes training and inference codes, but also provides weights for more than 200 network models. We believe this toolbox is by far the most complete detection toolbox. In this paper, we introduce the various features of this toolbox. In addition, we also conduct a benchmarking study on different methods, components, and their hyper-parameters. We wish that the toolbox and benchmark could serve the growing research community by providing a flexible toolkit to reimplement existing methods and develop their own new detectors. Code and models are available at https://github.com/open-mmlab/mmdetection. The project is under active development and we will keep this document updated.

연구 동기 및 목표

객체 탐지기를 구성하고 학습하기 위한 단일하고 모듈식 프레임워크를 제공한다.
공정한 비교를 가능하게 하기 위해 다양한 탐지 방법과 구성 요소를 벤치마크한다.
연구자를 안내하기 위한 실용적 학습, 절삭 실험(ablation), 하이퍼파라미터 인사이트를 제공한다.
확장된 모델 가중치와 다중 프레임워크 지원을 갖춘 가볍고 효율적이며 확장 가능한 도구상자를 제시한다.

제안 방법

탐지기 쉬운 구성 구성을 가능하게 하는 백본(Backbone), 넥(Neck), DenseHead, RoIExtractor, RoIHead 추상화를 갖춘 모듈식 탐지기 아키텍처를 도입한다.
유연한 커스터마이즈를 위한 훅 시스템을 가진 PyTorch 기반의 일관된 학습 파이프라인을 제공한다.
COCO 2017에서 여러 탐지 프레임워크와 백본을 벤치마크하여 정확도, 속도 및 메모리를 비교한다.
손실, 정규화 계층, 학습 스케일 및 기타 하이퍼파라미터에 대한 광범위한 ablation 연구를 수행한다.
공유 하드웨어에서 속도, 메모리, AP 측면에서 MMDetection을 Detectron, maskrcnn-benchmark, SimpleDet과 비교한다.

실험 결과

연구 질문

RQ1모듈식이고 재사용 가능한 구성 설계가 탐지기 개발과 재현성에 어떤 영향을 미치는가?
RQ2COCO에서 현대의 탐지기와 백본 간의 성능 및 효율성의 트레이드오프은 무엇인가?
RQ3다양한 손실 함수, 정규화 전략 및 학습 스케일이 객체 탐지 성능에 어떤 영향을 미치는가?
RQ4동일 조건에서 MMDetection이 다른 코드베이스와 속도, 메모리, 정확도 측면에서 어떻게 비교되는가?

주요 결과

방법	백본	학습률 스케줄	AP^b	AP^b_{50}	AP^b_{75}	AP^m	AP^m_{50}	AP^m_{75}	AP^m_{S}	AP^m_{M}
Faster R-CNN	R-50 (c)	1x	36.6	58.5	39.2	-	-	-	-	-
Faster R-CNN	R-101 (c)	1x	38.8	60.5	42.3	-	-	-	-	-
Faster R-CNN	R-50	1x	36.4	58.4	39.1	-	-	-	-	-
Faster R-CNN	R-101	1x	38.5	60.3	41.6	-	-	-	-	-
X-101-32x4d	1x	-	40.1	62.0	43.8	-	-	-	-	-
X-101-64x4d	1x	-	41.3	63.3	45.2	-	-	-	-	-

MMDetection은 다양한 모델과 200개가 넘는 네트워크 가중치를 제공하여 유연한 재구현 및 개발을 가능하게 한다.
정밀도 혼합 훈련(FP16)은 메모리 사용을 줄이고 정확도 손실은 최소화하며 최신 GPU에서 속도 이점을 제공한다.
정규화 전략(FrozenBN, SyncBN, GN)과 헤드 설계 선택은 AP에 상당한 영향을 미치며, 더 깊은 bbox 헤드와 대체 헤드 아키텍처가 성능을 향상시킨다.
학습 스케일 및 데이터 증강(range vs value multi-scale)이 AP를 약간 향상시키며, 더 넓은 범위가 더 큰 스케일에서 이익을 준다.
IoU 기반 및 대체 회귀 손실은 손실 가중치와 샘플링 전략에 따라 이익이 달라지며, 일부 손실이 조정된 조건에서 Smooth L1보다 우수한 성능을 보인다.
MMDetection은 다중 노드 학습으로 거의 선형 속도 향상을 달성하고, 여러 백본과 탐지기에서 경쟁력 있는 성능을 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.