Skip to main content
QUICK REVIEW

[論文レビュー] Objects detection for remote sensing images based on polar coordinates

Lin Zhou, Haoran Wei|arXiv (Cornell University)|Jan 9, 2020
Remote-Sensing Image Classification参考文献 46被引用数 35
ひとこと要約

本論文は、極座標で向き付き物体をモデル化する anchor-free 検出器である P-RSDet を導入し、回帰パラメータを減らしつつ、Polar Ring Area Loss という新規ロス関数を提案して競争力のある精度を達成する。

ABSTRACT

Arbitrary-oriented object detection is an important task in the field of remote sensing object detection. Existing studies have shown that the polar coordinate system has obvious advantages in dealing with the problem of rotating object modeling, that is, using fewer parameters to achieve more accurate rotating object detection. However, present state-of-the-art detectors based on deep learning are all modeled in Cartesian coordinates. In this article, we introduce the polar coordinate system to the deep learning detector for the first time, and propose an anchor free Polar Remote Sensing Object Detector (P-RSDet), which can achieve competitive detection accuracy via uses simpler object representation model and less regression parameters. In P-RSDet method, arbitrary-oriented object detection can be achieved by predicting the center point and regressing one polar radius and two polar angles. Besides, in order to express the geometric constraint relationship between the polar radius and the polar angle, a Polar Ring Area Loss function is proposed to improve the prediction accuracy of the corner position. Experiments on DOTA, UCAS-AOD and NWPU VHR-10 datasets show that our P-RSDet achieves state-of-the-art performances with simpler model and less regression parameters.

研究の動機と目的

  • リモートセ sensing 画像における oriented object detection の課題を動機付け、解決する。
  • 极座標を用いて oriented bounding boxes をモデル化する新しい anchor-free 検出器を提案する。
  • 回帰パラメータを削減しつつ検出精度を維持または向上させる。
  • Polar Ring Area Loss を導入して、極座標空間における半径と角度の幾何学的関係をより良く捉える。
  • 複数のリモートセ sensing データセット(DOTA、UCAS-AOD、NWPU VHR-10)で有効性を示す。

提案手法

  • オブジェクトの極点を中心とする極座標形で four corners を表現する。
  • pole-point heatmap1 枚と ρ(polar radius)、θ1、θ2 の regression map の3枚のマップを出力する。
  • CornerNet に着想を得た keypoint アプローチで pole points を抽出し、密なリモートセ sensing シーンでの見逃しを減らす修正抽出法を適用する。
  • ρ、θ1、θ2 を Smooth-L1 loss で回帰し、Polar Ring Area Loss を導入して半径と角度をリングエリア項で結合する。
  • 推論時に polar coordinates を Cartesian coordinates に変換して標準的な bounding box 表現に戻す。
  • 高解像度エンコーダ(ResNet-101、代替案も検証)を活用した anchor-free フレームワークで End-to-End 学習する。
  • DOTA、UCAS-AOD、NWPU VHR-10 で評価し、 oriented および horizontal 検出器と比較する。

実験結果

リサーチクエスチョン

  • RQ1極座標の anchor-free 検出器はリモートセ sensing 画像の oriented object detection において競争力のある、またはそれを上回る性能を達成できるか。
  • RQ2Polar Ring Area Loss を取り入れると、polar-space 表現における半径-角度の回帰精度が向上するか。
  • RQ3Pole Point 抽出戦略は密なリモートセ sensing シーンでの検出精度にどのような影響を与えるか。
  • RQ4極座標・anchor-free アプローチは oriented および horizontal 注釈形式を持つデータセット間で有効か。

主な発見

モデルPlBdBrGftSvLvShTcBcStSbfRaHaSpHemAP
RRPN [12]88.5271.2031.6659.3051.8556.1957.2590.8172.8467.3856.6952.8453.0851.9453.5861.01
R 2 CNN [13]80.9465.6735.3467.4459.9250.9155.8190.6766.9272.3955.0652.2355.1453.3548.2260.67
R-DFPN [14]80.9265.8233.7758.9455.7750.9454.7890.3366.3468.6648.7351.7655.1051.3235.8857.94
ICN [43]81.4074.3047.7070.3064.9067.8070.0090.8079.1078.2053.6062.9067.0064.2050.2068.20
RoI-Transformer [44]88.6478.5243.4475.9268.8173.6883.5990.7477.2781.4658.3953.5462.8358.9347.6769.56
P-RSDet88.5877.8450.4469.2971.1075.7978.6690.8880.1081.7157.9263.0366.3069.7763.1372.30
  • P-RSDet は oriented boxes を用いた DOTA で state-of-the-art(mAP 72.30)を達成。
  • P-RSDet は oriented boxes で UCAS-AOD において competitive(mAP 90.03)、horizontal boxes で強力な結果(mAP 90.24)。
  • P-RSDet は NWPU VHR-10 で horizontal boxes において strong results(mAP 90.80)を達成。
  • 他の anchor-based Cartesian 検出器と比較して、P-RSDet はより単純なモデルと回帰パラメータ数が少ない状態で競争力のある精度を提供する。
  • Polar Ring Area Loss は UCAS-AOD oriented 検出で mAP を約 1.85 ポイント改善(Polar Ring Area Loss あり)。
  • 提案手法による極点抽出は extreme-point/connected-domain 法によって、top-K keypoint 抽出より見逃しを減らす。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。