Skip to main content
QUICK REVIEW

[논문 리뷰] Computation Reallocation for Object Detection

Feng Liang, Lin Chen|arXiv (Cornell University)|2019. 12. 24.
Advanced Neural Network Applications참고 문헌 32인용 수 30
한 줄 요약

이 논문은 객체 검출 백본에서 특징 해상도와 공간 위치 간의 계산을 자동으로 재할당하는 신경망 아키텍처 탐색 프레임워크인 CR-NAS를 제안한다. FLOPs를 증가시키지 않으면서도 검출 정확도를 향상시킨다. 두 수준의 재할당 공간과 계층적 탐색을 통해 최적의 계산 분포를 학습함으로써 ResNet50과 MobileNetV2에서 각각 1.9% 및 1.7%의 COCO AP 향상을 달성한다. 이는 다른 검출 헤드, 데이터셋(예: PASCAL VOC), 그리고 인스턴스 세그멘테이션과 같은 작업으로도 강력한 이식성을 보여준다.

ABSTRACT

The allocation of computation resources in the backbone is a crucial issue in object detection. However, classification allocation pattern is usually adopted directly to object detector, which is proved to be sub-optimal. In order to reallocate the engaged computation resources in a more efficient way, we present CR-NAS (Computation Reallocation Neural Architecture Search) that can learn computation reallocation strategies across different feature resolution and spatial position diectly on the target detection dataset. A two-level reallocation space is proposed for both stage and spatial reallocation. A novel hierarchical search procedure is adopted to cope with the complex search space. We apply CR-NAS to multiple backbones and achieve consistent improvements. Our CR-ResNet50 and CR-MobileNetV2 outperforms the baseline by 1.9% and 1.7% COCO AP respectively without any additional computation budget. The models discovered by CR-NAS can be equiped to other powerful detection neck/head and be easily transferred to other dataset, e.g. PASCAL VOC, and other vision tasks, e.g. instance segmentation. Our CR-NAS can be used as a plugin to improve the performance of various networks, which is demanding.

연구 동기 및 목표

  • 객체 검출 백본에서 일반적으로 이미지 분류 네트워크에서 유도된 최적화되지 않은 계산 할당 문제를 해결하기 위해.
  • 분류 사전 지식에 의존하지 않고, 검출 데이터셋에서 직접 계산 재할당 전략을 학습하는 방법을 개발하기 위해.
  • 다양한 특징 해상도와 공간 위치 간의 효과적 수신 영역(Efficient Receptive Field, ERF) 균형을 최적화하여 검출 성능을 향상시키기 위해.
  • 효율적이고 이식 가능하며 다양한 백본 아키텍처와 검출 작업에 적용 가능한 탐색 프레임워크를 설계하기 위해.

제안 방법

  • 특징 해상도 간의 스테이지 수준 재할당과 공간 위치 간의 연산 수준 재할당을 포함하는 두 수준의 계산 재할당 공간을 제안한다.
  • 스테이지 수준 탐색 비용을 줄이고 다양한 계산 예산에 적응하기 위해 모델을 재사용하는 계층적 탐색 절차를 도입한다.
  • ERF 균형과 스케일 변동성 처리에 중점을 둔, 객체 검출을 위한 새로운 탐색 공간을 활용한다.
  • 스테이지와 공간 위치 간의 계산 재할당을 동시에 최적화하기 위해 미분 가능 탐색 전략을 사용한다.
  • COCO 검출 데이터에 직접 탐색 절차를 적용하여 작업별로 최적화된 계산 분포를 학습한다.
  • 발견된 아키텍처를 플러그인으로 재사용하여 다양한 검출 헤드, 넥, 모델을 향상시킨다.

실험 결과

연구 질문

  • RQ1특징 해상도와 공간 위치 간의 계산 재할당이 FLOPs를 증가시키지 않으면서도 객체 검출 성능을 향상시킬 수 있는가?
  • RQ2객체 검출 백본의 다양한 특징 맵에서 효과적 수신 영역(ERF) 분포는 어떻게 달라지며, 이를 최적화할 수 있는가?
  • RQ3직접 검출 데이터에서 훈련된 NAS 프레임워크가 분류 기반 백본보다 객체 검출에서 뛰어난 성능을 낼 수 있는가?
  • RQ4계산 재할당 전략은 다양한 검출 모델, 데이터셋, 작업 간에 얼마나 이식 가능한가?
  • RQ5분류 정확도와 검출 성능 사이에 괴리가 존재하는가이며, 계산 재할당이 이를 메울 수 있는가?

주요 결과

  • CR-ResNet50는 추가 FLOPs 없이도 COCO AP 38.3%를 달성하여 기준 모델 대비 1.9% 향상되었다.
  • CR-MobileNetV2는 동일한 계산 예산 하에서 COCO AP 33.9%를 기록하여 기준 모델 대비 1.7% 향상되었다.
  • 스테이지 재할당 구성 요소만으로도 MobileNetV2, ResNet18, ResNet50, ResNet101, ResNeXt 등 여러 모델에서 평균 1.0%의 AP 향상을 달성했다.
  • Mask R-CNN를 통해 인스턴스 세그멘테이션에 적용했을 때, CR-ResNet50는 COCO 세그멘테이션 AP를 1.3% 향상시키고 바운딩 박스 AP를 1.5% 향상시켰다.
  • PASCAL VOC에서 CR-ResNet50는 기준 모델 대비 mAP@0.5에서 1.0% 향상되었다.
  • NAS-FPN 넥과 Cascade Mask R-CNN를 결합했을 때, CR-ResNet101은 44.5%의 AP를 기록하여 기준 모델 대비 1.2% 향상되었다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.