Skip to main content
QUICK REVIEW

[論文レビュー] Dynamic Anchor Learning for Arbitrary-Oriented Object Detection

Qi Ming, Zhiqiang Zhou|arXiv (Cornell University)|Dec 8, 2020
Advanced Image and Video Retrieval Techniques参考文献 47被引用数 24
ひとこと要約

本稿では、任意方向のオブジェクト検出のための新しいラベル割り当て手法であるDynamic Anchor Learning (DAL)を提案する。IoUに基づくアンカー照合を学習された一致度メトリックに置き換えることで、空間的整合性、特徴量整合性、回帰不確実性を統合的に評価し、高品質なアンカーの動的選択を可能にする。水平アンカーの数を最小限に抑えつつ、検出精度を顕著に向上させ、DOTA(mAP 76.95%)およびHRSC2016(mAP 89.77%)で最先端の性能を達成。一般の水平オブジェクト検出に対しても有効である。

ABSTRACT

Arbitrary-oriented objects widely appear in natural scenes, aerial photographs, remote sensing images, etc., thus arbitrary-oriented object detection has received considerable attention. Many current rotation detectors use plenty of anchors with different orientations to achieve spatial alignment with ground truth boxes, then Intersection-over-Union (IoU) is applied to sample the positive and negative candidates for training. However, we observe that the selected positive anchors cannot always ensure accurate detections after regression, while some negative samples can achieve accurate localization. It indicates that the quality assessment of anchors through IoU is not appropriate, and this further lead to inconsistency between classification confidence and localization accuracy. In this paper, we propose a dynamic anchor learning (DAL) method, which utilizes the newly defined matching degree to comprehensively evaluate the localization potential of the anchors and carry out a more efficient label assignment process. In this way, the detector can dynamically select high-quality anchors to achieve accurate object detection, and the divergence between classification and regression will be alleviated. With the newly introduced DAL, we achieve superior detection performance for arbitrary-oriented objects with only a few horizontal preset anchors. Experimental results on three remote sensing datasets HRSC2016, DOTA, UCAS-AOD as well as a scene text dataset ICDAR 2015 show that our method achieves substantial improvement compared with the baseline model. Besides, our approach is also universal for object detection using horizontal bound box. The code and models are available at https://github.com/ming71/DAL.

研究の動機と目的

  • 回転オブジェクト検出における分類信頼度と局所化精度の不一致を解消すること。
  • IoUに基づくラベル割り当ての限界を克服し、局所化の潜在的性能が強い高品質なネガティブアンカーを特定できない問題に対処すること。
  • 空間的・特徴量的・回帰不確実性の総合的マッチング基準に基づき、高品質なアンカーを動的に選択する適応的ラベル割り当てメカニズムを構築すること。
  • 多数の回転アンカーに依存することを減らし、最小限の水平アンカーで選択の品質を向上させること。
  • 標準的な水平バウンディングボックス検出に対しても汎用性を示すために、手法を拡張すること。

提案手法

  • 空間的整合性、特徴量整合性の能力、回帰不確実性に基づいてアンカーを評価する新しい一致度メトリックを提案。
  • 一致度を用いた動的アンカー選択を導入し、陽に固定されたIoU閾値によるポジティブ/ネガティブサンプルの割り当てを置き換える。
  • 分類信頼度を実際の局所化性能と一致させるマッチングに敏感な損失関数を設計。
  • アーキテクチャの大幅な見直しを伴わずに、一致度をトレーニングパイプラインに軽量かつ微分可能に統合する定式化を採用。
  • 各特徴位置に水平アンカーを3つだけ使用し、アンカーの複雑さを顕著に低減しながら高い性能を維持。
  • 複数のデータセットおよび検出フレームワークに本手法を適用し、回転検出および水平検出の両方において汎用性を実証。

実験結果

リサーチクエスチョン

  • RQ1回転オブジェクト検出におけるIoUベースのラベル割り当ては、局所化の潜在的性能が高いためのアンカーを信頼性を持って特定できるか?
  • RQ2分類信頼度と局所化精度の不一致は、アンカー品質の評価に欠陥があることに起因するか?
  • RQ3空間的・特徴量的・回帰不確実性を統合した統一されたメトリックは、任意方向検出におけるラベル割り当てを改善できるか?
  • RQ4多数の回転アンカーに依存せず、少数の水平アンカーと動的選択により高品質な検出を達成できるか?
  • RQ5提案手法は回転検出および標準的な水平オブジェクト検出の両方に対して普遍的に適用可能か?

主な発見

  • DOTAでは、S2A-Netと統合した際、mAPが76.95%に達し、前回の最先端手法を2.83%上回った。
  • HRSC2016では、ResNet-101を用いた場合mAPが89.77%、ResNet-50を用いた場合88.6%(416×416入力)に達し、多数の回転アンカーを用いたモデルを上回った。
  • DOTAではベースライン比でmAPが3%向上し、UCAS-AODでは2.3%向上。HRSC2016ではAP75が著しく2.5%向上した。
  • ICDAR 2015ではF-measureが77.5%から81.5%(マルチスケールテスト時82.4%)に向上し、シーンテキストへの汎用性が顕著に示された。
  • 416×416入力でRTX 2080 Tiで34 FPSの推論速度を達成し、高い精度を維持しながらも効率性を示した。
  • 標準的な水平オブジェクト検出に対しても一般化可能であり、ICDAR 2013、NWPU VHR-10、VOC2007の各データセットで一貫した性能向上を示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。