Skip to main content
QUICK REVIEW

[논문 리뷰] Rethinking Rotated Object Detection with Gaussian Wasserstein Distance Loss

Xue Yang, Junchi Yan|arXiv (Cornell University)|2021. 01. 28.
Advanced Neural Network Applications참고 문헌 82인용 수 204
한 줄 요약

이 논문은 각도 회귀 기반 회전 손실을 가우시안 Wasserstein 거리(GWD) 손실로 대체하여 회전된 박스를 2-D 가우시안 분포로 모델링하고, 미분 가능하고 거리-일관된 회귀를 제공하여 경계 불연속성과 정사각형 유사 문제를 다양한 경계 상자 정의에 걸쳐 완화한다.

ABSTRACT

Boundary discontinuity and its inconsistency to the final detection metric have been the bottleneck for rotating detection regression loss design. In this paper, we propose a novel regression loss based on Gaussian Wasserstein distance as a fundamental approach to solve the problem. Specifically, the rotated bounding box is converted to a 2-D Gaussian distribution, which enables to approximate the indifferentiable rotational IoU induced loss by the Gaussian Wasserstein distance (GWD) which can be learned efficiently by gradient back-propagation. GWD can still be informative for learning even there is no overlapping between two rotating bounding boxes which is often the case for small object detection. Thanks to its three unique properties, GWD can also elegantly solve the boundary discontinuity and square-like problem regardless how the bounding box is defined. Experiments on five datasets using different detectors show the effectiveness of our approach. Codes are available at https://github.com/yangxue0827/RotationDetection and https://github.com/open-mmlab/mmrotate.

연구 동기 및 목표

  • 기존 회전 탐지기에서의 핵심 결함 파악: 거리-손실의 일관성 부족, 경계 불연속성, 그리고 정사각형 유사 문제.
  • 박스 간 IoU를 근사하기 위한 가우시안 Wasserstein 거리 기반의 통합적이고 미분 가능한 손실 제안.
  • GWD 기반 회귀가 경계 박스 정의에 강건하며 데이터셋 전반의 탐지 성능을 개선함을 보임.
  • 도입 및 재현을 용이하게 하는 오픈 소스 코드 제공.

제안 방법

  • 회전된 경계 상자 B(x, y, w, h, theta)를 평균 m=(x,y)이고 공분산 Sigma가 w, h, theta로 도출되는 2-D 가우시안 분포로 변환한다.
  • :

실험 결과

연구 질문

  • RQ1가우시안 Wasserstein 거리가 회전 IoU 손실의 미분 가능하고 IoU에 일관된 대체로 제공될 수 있는가?
  • RQ2회전 박스를 2-D 가우시안으로 모델링하는 것이 경계 불연속성과 정사각형 유사 문제를 경계 상자 정의에 독립적으로 해결하는가?
  • RQ3GWD 기반 회귀는 전통적인 Smooth L1 손실과 비교해 다양한 데이터셋과 탐지기에 대해 어떻게 성능을 보이는가?
  • RQ4제안된 GWD 손실이 OpenCV D_oc 대 Long-edge D_le와 같은 다양한 경계 상자 매개변수화에 강건한가?

주요 결과

  • GWD 기반 회귀는 DOTA, HRSC2016, UCAS-AOD 등 여러 데이터셋에서 Smooth L1 손실을 대체할 때 mAP를 향상시킨다.
  • IoU=0인 비겹치는 박스에도 정보를 유지하는 미분 가능한 대체 수단을 제공한다.
  • GWD는 경계 불연속성 및 정사각형 유사 문제를 자연스럽게 완화하며 사용된 경계 상자 정의에 거의 의존적이지 않다.
  • 다양한 학습 기법으로 RetinaNet, R3Det 및 백본 R-50, R-101, R-152에서 성능 향상을 보인다는 결과를 포함한 바리에이션 연구가 있음.
  • 다섯 개의 공공 데이터셋과 두 탐지기에 걸친 광범위한 실험으로 접근법의 효과를 검증했다.
  • 결과 재현을 위한 코드가 공개되어 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.