[论文解读] IENet: Interacting Embranchment One Stage Anchor Free Detector for Orientation Aerial Object Detection
IENet 是一个用于定向航拍目标检测的一阶段无锚框检测器,使用几何变换将 OBB 用 HBB 表示,并通过带自注意力的交互分支融合模块来融合跨分支的特征以提升定向预测。
Object detection in aerial images is a challenging task due to the lack of visible features and variant orientation of objects. Significant progress has been made recently for predicting targets from aerial images with horizontal bounding boxes (HBBs) and oriented bounding boxes (OBBs) using two-stage detectors with region based convolutional neural networks (R-CNN), involving object localization in one stage and object classification in the other. However, the computational complexity in two-stage detectors is often high, especially for orientational object detection, due to anchor matching and using regions of interest (RoI) pooling for feature extraction. In this paper, we propose a one-stage anchor free detector for orientational object detection, namely, an interactive embranchment network (IENet), which is built upon a detector with prediction in per-pixel fashion. First, a novel geometric transformation is employed to better represent the oriented object in angle prediction, then a branch interactive module with a self-attention mechanism is developed to fuse features from classification and box regression branches. Finally, we introduce an enhanced intersection over union (IoU) loss for OBB detection, which is computationally more efficient than regular polygon IoU. Experiments conducted demonstrate the effectiveness and the superiority of our proposed method, as compared with state-of-the-art detectors.
研究动机与目标
- 以一阶段无锚框方法促进高效的航拍图像定向目标检测。
- 开发一种将有定向的边界框转换为包含定向参数的周围水平边界框的表示。
- 提出一个带自注意力的交互分支模块,以融合分类和回归特征,实现鲁棒的定向回归。
提出的方法
- 将 FCOS 改编为 FCOS-O,作为逐像素定向预测的基线。
- 引入一种几何变换,将 OBB 表示为包含的 HBB 加上定向参数 [w,h]。
- 设计一个交互分支(IE)模块,利用自注意力融合来自分类分支和框回归分支的特征。
- 实现一种基于内框的 OBB IoU 损失以降低计算量。
- 采用端到端的一阶段体系结构,在类似 FCOS 的头部中新增定向回归分支。
- 使用损失组合 L = (1/Npos)L_cls + (λ/Npos)L_reg + (ω/Npos)L_ori,并对 HBB 和 OBB 指定 IoU 术语。
实验结果
研究问题
- RQ1无锚框的一阶段检测器是否能够在定向航拍目标检测中达到具有竞争力的性能?
- RQ2通过周围的 HBB 和定向参数来表示 OBB 是否能提高回归的稳定性和准确性?
- RQ3带自注意力的 IE 模块是否能有效融合跨分支特征以提升定向回归?
- RQ4所提出的 OBB IoU 损失在保持与真实 OBB 对齐的同时是否计算高效?
主要发现
- IENet 在公开航拍数据集上在准确性和效率方面超越基线的一阶段定向检测器。
- 几何变换通过将 OBB 回归分解为 HBB 回归和定向回归来实现有效的 OBB 回归。
- 带自注意力的 IE 模块通过利用跨分支特征关系来改善定向预测。
- 基于内框 IoU 的损失在引导 OBB 回归的同时降低了相较于全 OBB IoU 的计算量。
- 在 DOTA 和 HRSC2016 上的实验显示与最先进检测器相比具有竞争力的结果,同时提高了速度与内存效率。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。