[论文解读] Objects detection for remote sensing images based on polar coordinates
本文提出 P-RSDet,一种无锚检测器,通过极坐标建模定向目标,在回归参数更少的情况下实现有竞争力的精度,并引入新颖的 Polar Ring Area Loss。
Arbitrary-oriented object detection is an important task in the field of remote sensing object detection. Existing studies have shown that the polar coordinate system has obvious advantages in dealing with the problem of rotating object modeling, that is, using fewer parameters to achieve more accurate rotating object detection. However, present state-of-the-art detectors based on deep learning are all modeled in Cartesian coordinates. In this article, we introduce the polar coordinate system to the deep learning detector for the first time, and propose an anchor free Polar Remote Sensing Object Detector (P-RSDet), which can achieve competitive detection accuracy via uses simpler object representation model and less regression parameters. In P-RSDet method, arbitrary-oriented object detection can be achieved by predicting the center point and regressing one polar radius and two polar angles. Besides, in order to express the geometric constraint relationship between the polar radius and the polar angle, a Polar Ring Area Loss function is proposed to improve the prediction accuracy of the corner position. Experiments on DOTA, UCAS-AOD and NWPU VHR-10 datasets show that our P-RSDet achieves state-of-the-art performances with simpler model and less regression parameters.
研究动机与目标
- 激励并解决遥感图像中定向目标检测的挑战。
- 提出一种使用极坐标来建模定向边界框的无锚检测器。
- 在保持或提升检测精度的同时减少回归参数。
- 引入 Polar Ring Area Loss,以更好地在极坐标空间捕捉半径和角度之间的几何关系。
- 在多个遥感数据集(DOTA、UCAS-AOD、NWPU VHR-10)上证明有效性。
提出的方法
- 使用以目标极点为中心的极坐标公式,将定向对象表示为四个角点。
- 输出四个特征图:一个极点热力图和三个回归图,用于 ρ(极径)、θ1、θ2。
- 通过借鉴 CornerNet 的关键点方法并采用修订的提取方式,在密集遥感场景中减少漏检,通过极点点提取。
- 对 ρ、θ1、θ2 使用 Smooth-L1 损失进行回归,并引入 Polar Ring Area Loss,通过环形面积项耦合半径与角度。
- 推理阶段将极坐标转换回笛卡尔坐标,以获得标准的边界框表示。
- 在无锚框框架中端到端训练,利用高分辨率编码器(ResNet-101,测试了其它替代品)。
- 在 DOTA、UCAS-AOD 和 NWPU VHR-10 上进行评估,并与定向和水平检测器进行对比。
实验结果
研究问题
- RQ1在极坐标中的无锚检测器是否可以实现对遥感图像中定向目标检测的具有竞争力或更优的性能?
- RQ2将 Polar Ring Area Loss 纳入后,极坐标空间的半径-角度回归精度是否得到提升?
- RQ3在密集遥感场景中,Pole Point 提取策略如何影响检测精度?
- RQ4极坐标无锚方法在具有定向和水平注释格式的数据集上是否都有效?
主要发现
| Model | Pl | Bd | Br | Gft | Sv | Lv | Sh | Tc | Bc | St | Sbf | Ra | Ha | Sp | He | mAP |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| RRPN [12] | 88.52 | 71.20 | 31.66 | 59.30 | 51.85 | 56.19 | 57.25 | 90.81 | 72.84 | 67.38 | 56.69 | 52.84 | 53.08 | 51.94 | 53.58 | 61.01 |
| R 2 CNN [13] | 80.94 | 65.67 | 35.34 | 67.44 | 59.92 | 50.91 | 55.81 | 90.67 | 66.92 | 72.39 | 55.06 | 52.23 | 55.14 | 53.35 | 48.22 | 60.67 |
| R-DFPN [14] | 80.92 | 65.82 | 33.77 | 58.94 | 55.77 | 50.94 | 54.78 | 90.33 | 66.34 | 68.66 | 48.73 | 51.76 | 55.10 | 51.32 | 35.88 | 57.94 |
| ICN [43] | 81.40 | 74.30 | 47.70 | 70.30 | 64.90 | 67.80 | 70.00 | 90.80 | 79.10 | 78.20 | 53.60 | 62.90 | 67.00 | 64.20 | 50.20 | 68.20 |
| RoI-Transformer [44] | 88.64 | 78.52 | 43.44 | 75.92 | 68.81 | 73.68 | 83.59 | 90.74 | 77.27 | 81.46 | 58.39 | 53.54 | 62.83 | 58.93 | 47.67 | 69.56 |
| P-RSDet | 88.58 | 77.84 | 50.44 | 69.29 | 71.10 | 75.79 | 78.66 | 90.88 | 80.10 | 81.71 | 57.92 | 63.03 | 66.30 | 69.77 | 63.13 | 72.30 |
- P-RSDet 在 DOTA 的定向框任务上实现了最先进的性能(mAP 72.30)。
- P-RSDet 在 UCAS-AOD 的定向框任务上实现了有竞争力的性能(mAP 90.03),并且在水平框上也表现出色(mAP 90.24)。
- P-RSDet 在 NWPU VHR-10 的水平框任务上实现了强劲的结果(mAP 90.80)。
- 与其他基于锚框的笛卡尔检测器相比,P-RSDet 提供了更简洁的模型和更少的回归参数,仍保持具有竞争力的精度。
- 与 Polar Ring Area Loss 相关的 UCAS-AOD 定向检测中,mAP 提升约 1.85 个百分点。
- 通过提出的极点点提取的极端点/连通域方法,相较于 Top-K 关键点提取,减少了漏检。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。