Skip to main content
QUICK REVIEW

[논문 리뷰] EfficientDet: Scalable and Efficient Object Detection

Mingxing Tan, Ruoming Pang|arXiv (Cornell University)|2019. 11. 20.
Advanced Neural Network Applications참고 문헌 41인용 수 521
한 줄 요약

EfficientDet은 가중치가 있는 양방향 피처 피라미드 네트워크(BiFPN)와 복합 스케일링 방법을 도입하여, 파라미터 수와 FLOPs가 훨씬 적은 상태에서 COCO에서 최첨단 정확도를 달성하는 탐지기 패밀리를 만들어낸다.

ABSTRACT

Model efficiency has become increasingly important in computer vision. In this paper, we systematically study neural network architecture design choices for object detection and propose several key optimizations to improve efficiency. First, we propose a weighted bi-directional feature pyramid network (BiFPN), which allows easy and fast multiscale feature fusion; Second, we propose a compound scaling method that uniformly scales the resolution, depth, and width for all backbone, feature network, and box/class prediction networks at the same time. Based on these optimizations and better backbones, we have developed a new family of object detectors, called EfficientDet, which consistently achieve much better efficiency than prior art across a wide spectrum of resource constraints. In particular, with single model and single-scale, our EfficientDet-D7 achieves state-of-the-art 55.1 AP on COCO test-dev with 77M parameters and 410B FLOPs, being 4x - 9x smaller and using 13x - 42x fewer FLOPs than previous detectors. Code is available at https://github.com/google/automl/tree/master/efficientdet.

연구 동기 및 목표

  • 리얼월드 자원 제약 하에서 효율적인 단일 스테이지 물체 탐지기의 설계 선택을 조사한다.
  • 다양한 FLOPs와 파라미터 범위에서 정확도와 효율성을 모두 개선하는 확장 가능한 아키텍처를 개발한다.
  • 백본, 피처 네트워크, 예측 헤드를 균형 있게 조정하는 학습 가능한 피처 융합 메커니즘과 통합 스케일링 전략을 제안한다.

제안 방법

  • 효율적인 다중 스케일 피처 융합을 위한 교차 규모 연결을 갖춘 가중치가 있는 bi-directional feature pyramid network(BiFPN)을 제안한다.
  • 낮은 지연을 위해 소프트맥스 가중 융합을 대체하는 빠른 정규화 융합을 도입한다.
  • 하나의 아키텍처(EfficientDet) 내에서 EfficientNet 백본과 공유 클래스/박스 헤드를 채택한다.
  • 단순 계수 φ에 의해 가이드되는 백본 폭/깊이, BiFPN 깊이/폭, 박스/클래스 예측 네트워크를 함께 확장하는 복합 스케일링 방법을 개발한다.
  • 다른 자원 예산에 맞추어 BiFPN 층과 예측 헤드를 반복하여 구성(D0–D7)한다.
  • 효율성과 정확도 향상을 보이기 위해 COCO 탐지와 Pascal VOC 분할로 평가한다.

실험 결과

연구 질문

  • RQ1학습 가능한 효율적 교차 규모 피처 융합(BiFPN)이 기존 FPN 변형들에 비해 정확도와 계산 비용 모두에서 우수한가?
  • RQ2백본, 피처 네트워크, 예측 헤드를 가로지르는 원리적 복합 스케일링 전략이 다수의 자원 제약에서 우수한 정확도-효율성 트레이드오프를 제공하는가?
  • RQ3EfficientNet과 공유 클래스/박스 헤드 같은 백본이 전체 탐지기 효율성에 어떻게 기여하는가?
  • RQ4가중치 있는 피처 융합과 비가중 피처 융합의 차이가 성능과 속도에 어떤 영향을 미치는가?

주요 결과

  • EfficientDet-D7x는 COCO test-dev에서 55.1 AP를 77M 파라미터 및 410B FLOPs로 달성하여, 이전 탐지기들에 비해 계산 및 파라미터가 크게 줄었음에도 높은 정확도를 보임.
  • 가중 피처 융합을 갖춘 BiFPN은 NAS-FPN, PANet 등 다른 교차 규모 네트워크보다 더 적은 파라미터와 FLOPs로 더 높은 정확도를 달성함.
  • 빠른 정규화 융합은 소프트맥스 기반 융합과 유사한 정확도를 제공하면서도 GPU에서 최대 ~30% 더 빠르게 실행되어 전체 효율성을 향상시킴.
  • 백본, BiFPN, 예측 헤드에 걸친 복합 스케일링은 단일 차원 스케일링 방식보다 더 나은 정확도-효율성 트레이드오프를 제공하며, D0–D7 구성은 다양한 자원 예산을 포괄함.
  • EfficientNet 백본과 BiFPN 및 공유 박스/클래스 헤드를 결합하면 COCO 및 VOC 작업에서 정확도를 유지하거나 향상시키면서 모델 크기와 FLOPs를 크게 줄임.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.