[논문 리뷰] Objects detection for remote sensing images based on polar coordinates
요약: 논문은 방향 객체를 극 좌표로 모델링하는 앵커 프리 탐지기 P-RSDet를 소개하며, 회귀 파라미터를 더 적게 사용하면서도 정확도 경쟁력을 가지며 새로운 Polar Ring Area Loss를 제안합니다.
Arbitrary-oriented object detection is an important task in the field of remote sensing object detection. Existing studies have shown that the polar coordinate system has obvious advantages in dealing with the problem of rotating object modeling, that is, using fewer parameters to achieve more accurate rotating object detection. However, present state-of-the-art detectors based on deep learning are all modeled in Cartesian coordinates. In this article, we introduce the polar coordinate system to the deep learning detector for the first time, and propose an anchor free Polar Remote Sensing Object Detector (P-RSDet), which can achieve competitive detection accuracy via uses simpler object representation model and less regression parameters. In P-RSDet method, arbitrary-oriented object detection can be achieved by predicting the center point and regressing one polar radius and two polar angles. Besides, in order to express the geometric constraint relationship between the polar radius and the polar angle, a Polar Ring Area Loss function is proposed to improve the prediction accuracy of the corner position. Experiments on DOTA, UCAS-AOD and NWPU VHR-10 datasets show that our P-RSDet achieves state-of-the-art performances with simpler model and less regression parameters.
연구 동기 및 목표
- 원격 탐지 영상에서 방향 객체 탐지의 도전과제를 동기부여하고 해결한다.
- 극 좌표를 사용하여 방향 바운딩 박스를 모델링하는 새로운 앵커 프리 탐지기를 제안한다.
- 회귀 파라미터를 줄이면서 탐지 정확도 유지 또는 향상을 목표로 한다.
- Polar Ring Area Loss를 도입하여 극 공간에서 반지 모양의 면적 항을 통해 반지의 반지름과 각도 간 기하학적 관계를 더 잘 포착한다.
- 다수의 원격 탐지 데이터셋(DOTA, UCAS-AOD, NWPU VHR-10)에서 효과를 입증한다.
제안 방법
- 객체 극 점을 물체 극점점을 중심으로 하는 극 좌표식으로 방향 객체를 네 모서리로 표현한다.
- 폴 포인트 히트맷 하나와 ρ(극 반지름), θ1, θ2에 대한 세 가지 회귀 맵의 네 가지 맵을 출력한다.
- CornerNet에서 영감을 받은 키포인트 방식과 밀집한 원격 탐지 장면에서 누락 검출을 줄이기 위한 수정된 추출 방법으로 극 점을 추출한다.
- Smooth-L1 손실로 ρ, θ1, θ2를 회귀하고 Polar Ring Area Loss를 도입하여 링 면적 항을 통해 반지름과 각도를 결합한다.
- 추론 시 극 좌표를 표준 바운딩 박스 표현으로 변환한다.
- 앵커 프리 프레임워크에서 엔드투엔드로 학습하며 고해상도 인코더(ResNet-101, 대안도 실험됨)를 활용한다.
- DOTA, UCAS-AOD, NWPU VHR-10에서 방향 탐지기 및 수평 탐지기와의 비교를 평가한다.
실험 결과
연구 질문
- RQ1극 좌표의 앵커 프리 탐지기가 원격 탐지 영상의 방향 객체 탐지에 대해 경쟁력 있거나 우수한 성능을 달성할 수 있는가?
- RQ2Polar Ring Area Loss를 포함하면 극 공간 표현에서 반지름-각도 회귀의 정확도가 향상되는가?
- RQ3제안된 극점 추출 전략이 밀집 원격 탐지 장면에서 탐지 정확도에 어떤 영향을 미치는가?
- RQ4극 좌표 기반의 앵커 프리 접근법이 방향 및 수평 주석 형식이 있는 데이터셋에서 효과적인가?
주요 결과
| Model | Pl | Bd | Br | Gft | Sv | Lv | Sh | Tc | Bc | St | Sbf | Ra | Ha | Sp | He | mAP |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| RRPN [12] | 88.52 | 71.20 | 31.66 | 59.30 | 51.85 | 56.19 | 57.25 | 90.81 | 72.84 | 67.38 | 56.69 | 52.84 | 53.08 | 51.94 | 53.58 | 61.01 |
| R 2 CNN [13] | 80.94 | 65.67 | 35.34 | 67.44 | 59.92 | 50.91 | 55.81 | 90.67 | 66.92 | 72.39 | 55.06 | 52.23 | 55.14 | 53.35 | 48.22 | 60.67 |
| R-DFPN [14] | 80.92 | 65.82 | 33.77 | 58.94 | 55.77 | 50.94 | 54.78 | 90.33 | 66.34 | 68.66 | 48.73 | 51.76 | 55.10 | 51.32 | 35.88 | 57.94 |
| ICN [43] | 81.40 | 74.30 | 47.70 | 70.30 | 64.90 | 67.80 | 70.00 | 90.80 | 79.10 | 78.20 | 53.60 | 62.90 | 67.00 | 64.20 | 50.20 | 68.20 |
| RoI-Transformer [44] | 88.64 | 78.52 | 43.44 | 75.92 | 68.81 | 73.68 | 83.59 | 90.74 | 77.27 | 81.46 | 58.39 | 53.54 | 62.83 | 58.93 | 47.67 | 69.56 |
| P-RSDet | 88.58 | 77.84 | 50.44 | 69.29 | 71.10 | 75.79 | 78.66 | 90.88 | 80.10 | 81.71 | 57.92 | 63.03 | 66.30 | 69.77 | 63.13 | 72.30 |
- P-RSDet는 방향 상자에서 DOTA에 대한 최첨단 성능을 달성( mAP 72.30 ).
- P-RSDet는 방향 상자에서 UCAS-AOD에 대해 경쟁력 있는 성능을 달성( mAP 90.03 ) 및 수평 상자에서 강력한 결과를 보임( mAP 90.24 ).
- P-RSDet는 NWPU VHR-10에서 수평 상자에 대해 강력한 결과를 보임( mAP 90.80 ).
- 다른 앵커 기반 카테시안 탐지기와 비교할 때 P-RSDet는 더 간단한 모델과 더 적은 회귀 파라미터로 경쟁력 있는 정확도를 제공한다.
- Polar Ring Area Loss는 UCAS-AOD 방향 탐지에서 약 1.85% 포인트의 mAP 향상을 가져온다(Polar Ring Area Loss 사용 시).
- 제안된 극점 추출 방식(극점-확장점/연결 도메인 방법)은 최상위-K 키포인트 추출 대비 누락 탐지를 줄인다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.