Skip to main content
QUICK REVIEW

[论文解读] AGPCNet: Attention-Guided Pyramid Context Networks for Infrared Small Target Detection

Tianfang Zhang, Siying Cao|arXiv (Cornell University)|Nov 5, 2021
Infrared Target Detection Methodologies参考文献 39被引用 46
一句话总结

AGPCNet 引入了带有多尺度金字塔上下文和非对称融合的注意力引导上下文架构,在 MDFA 和 SIRST Aug 数据集上实现了红外小目标检测的最先进性能。

ABSTRACT

Infrared small target detection is an important problem in many fields such as earth observation, military reconnaissance, disaster relief, and has received widespread attention recently. This paper presents the Attention-Guided Pyramid Context Network (AGPCNet) algorithm. Its main components are an Attention-Guided Context Block (AGCB), a Context Pyramid Module (CPM), and an Asymmetric Fusion Module (AFM). AGCB divides the feature map into patches to compute local associations and uses Global Context Attention (GCA) to compute global associations between semantics, CPM integrates features from multi-scale AGCBs, and AFM integrates low-level and deep-level semantics from a feature-fusion perspective to enhance the utilization of features. The experimental results illustrate that AGPCNet has achieved new state-of-the-art performance on two available infrared small target datasets. The source codes are available at https://github.com/Tianfang-Zhang/AGPCNet.

研究动机与目标

  • 在混杂和噪声中推动对小型红外目标的准确分割。
  • 开发一个数据驱动的网络,利用全局和局部上下文来处理小目标。
  • 提出一个基于金字塔和注意力的框架,以提升特征融合和目标定位。

提出的方法

  • Attention-Guided Context Block (AGCB),将特征分割为补丁以实现局部的非局部式关联,并使用 Global Context Attention (GCA) 来建模补丁级的全局关系。
  • Context Pyramid Module (CPM) 将多尺度的 AGCB 输出与原始特征图融合,形成一个上下文金字塔。
  • Asymmetric Fusion Module (AFM) 通过独立的注意力通道自适应地融合低层和深层特征,以减少特征不匹配。
  • 在 AFM 内使用 Pixel attention (PA) 和 channel attention (CA) 来增强融合。
  • 在 MDFA 和 SIRST Aug 数据集上以输入尺寸 256x256 进行训练与评估,使用 SoftIoU 损失和 SGD 优化。
  • 通过消融研究来验证骨干网络的选择、CPM、AFM、降维比和 GCA 类型。

实验结果

研究问题

  • RQ1如何有效地整合全局与局部上下文信息来进行红外小目标检测?
  • RQ2多尺度上下文聚合对小目标分割性能的影响如何?
  • RQ3低层与深层语义的非对称融合是否能改善目标定位并降低误报?

主要发现

方法MDFA 精度MDFA 召回MDFA mIoUMDFA F-measureMDFA AUCSIRST Aug 精度SIRST Aug 召回SIRST Aug mIoUSIRST Aug F-measureSIRST Aug AUC
Tophat0.03990.10460.02980.05780.71540.68730.08180.07880.14610.7441
LCM0.01140.75250.01130.02240.95120.01820.79430.01820.03570.8016
MPCM0.64720.14990.13860.24340.84760.93570.15090.14930.25990.7886
NRAM0.73980.10640.10260.18610.49810.88300.08130.08040.14890.5104
PSTNN0.72360.15440.14580.25450.60870.93660.09490.09430.17240.3556
SRWS0.81380.03940.03900.07510.46410.84180.03600.03570.06900.5706
MDvsFA cGAN0.66000.5400-0.60000.9100-----
ACM0.54540.70060.44230.61330.86880.83170.70510.82700.92830.9283
AGPCNet0.59390.72410.48430.65250.86820.83230.85420.72880.84310.9344
  • AGPCNet 在 MDFA 和 SIRST Aug 数据集上的 mIoU 与 F-measure 全部达到最先进水平。
  • 在消融实验中,使用更深的骨干网络(ResNet-34)以及加入 CPM 和 AFM 提高了检测准确性。
  • CPM 的多尺度设计将能量聚焦于目标区域,减少背景干扰。
  • GCA 与 PA 与 Patch-Wise attention 的组合优于替代方案,提升全局–局部融合。
  • AGPCNet 在合并数据集上表现出显著提升,并展现出鲁棒的目标分割能力,误报减少。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。