Skip to main content
QUICK REVIEW

[論文レビュー] IENet: Interacting Embranchment One Stage Anchor Free Detector for Orientation Aerial Object Detection

Youtian Lin, Pengming Feng|arXiv (Cornell University)|Dec 2, 2019
Advanced Neural Network Applications参考文献 47被引用数 76
ひとこと要約

IENetは、回転物体検出のためのアンカーなし・1段階検出器で、幾何変換によりOBBをHBBで表現し、自己注意を用いた相互分岐連携モジュールを導入してブランチ間の特徴を融合し、姿勢推定を改善する。

ABSTRACT

Object detection in aerial images is a challenging task due to the lack of visible features and variant orientation of objects. Significant progress has been made recently for predicting targets from aerial images with horizontal bounding boxes (HBBs) and oriented bounding boxes (OBBs) using two-stage detectors with region based convolutional neural networks (R-CNN), involving object localization in one stage and object classification in the other. However, the computational complexity in two-stage detectors is often high, especially for orientational object detection, due to anchor matching and using regions of interest (RoI) pooling for feature extraction. In this paper, we propose a one-stage anchor free detector for orientational object detection, namely, an interactive embranchment network (IENet), which is built upon a detector with prediction in per-pixel fashion. First, a novel geometric transformation is employed to better represent the oriented object in angle prediction, then a branch interactive module with a self-attention mechanism is developed to fuse features from classification and box regression branches. Finally, we introduce an enhanced intersection over union (IoU) loss for OBB detection, which is computationally more efficient than regular polygon IoU. Experiments conducted demonstrate the effectiveness and the superiority of our proposed method, as compared with state-of-the-art detectors.

研究の動機と目的

  • 航空画像における効率的な姿勢物体検出を、1段階のアンカーなしアプローチで動機づける。
  • 姿勢付き境界框を周囲の水平境界箱と方位パラメータへ変換する表現を開発する。
  • 分類と回帰の特徴を頑健な姿勢回帰のために融合する、自己注意付きのインタラクティブ・エンブランチメント・モジュールを提案する。

提案手法

  • FCOSをFCOS-Oへ適応させ、ピクセル単位の姿勢予測のベースラインとする。
  • OBBを周囲のHBBと方位パラメータ[ w, h ]で表す幾何変換を導入する。
  • 自己注意機構を用いて分類ブランチとボックス回帰ブランチの特徴を融合するインタラクティブ・エンブランチメント(IE)モジュールを設計する。
  • 計算量を削減するため、内部ボックスに由来するOBB IoU損失を実装する。
  • FCOS風ヘッドに姿勢回帰ブランチを追加した、エンドツーエンドの1段階アーキテクチャを用いる。
  • L = (1/Npos)L_cls + (λ/Npos)L_reg + (ω/Npos)L_ori という損失結合を用い、HBBとOBBの特定のIoU項を用いる。

実験結果

リサーチクエスチョン

  • RQ1アンカーなしの1段階検出器は、回転姿勢を持つ航空物体検出で競争力のある性能を達成できるだろうか。
  • RQ2OBBを周囲のHBBと方位パラメータで表現することは、回帰の安定性と精度を向上させるか?
  • RQ3自己注意を備えたIEモジュールは、ブランチ間の特徴を効果的に融合して姿勢回帰を改善できるか?
  • RQ4提案されたOBB IoU損失は、真値OBBと整合性を保ちつつ計算効率が高いか?

主な発見

  • IENetは公開航空データセットにおいて、精度と効率の点でベースライン1段階の姿勢検出器を上回る。
  • 幾何変換により、OBB回帰をHBB回帰と姿勢回帰に分解することで効果的なOBB回帰を可能にする。
  • 自己注意を用いたIEモジュールは、ブランチ間の特徴関係を活用して姿勢予測を改善する。
  • 内部ボックスIoUベースの損失は、完全なOBB IoUと比較して計算を削減しつつOBB回帰を導く。
  • DOTAとHRSC2016での実験は、最先端検出器と競合する結果を示し、速度とメモリ効率の改善を達成。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。