Skip to main content
QUICK REVIEW

[論文レビュー] AGPCNet: Attention-Guided Pyramid Context Networks for Infrared Small Target Detection

Tianfang Zhang, Siying Cao|arXiv (Cornell University)|Nov 5, 2021
Infrared Target Detection Methodologies参考文献 39被引用数 46
ひとこと要約

AGPCNet は Attention-Guided Context アーキテクチャを導入し、多スケールピラミッドコンテキストと非対称融合で MDFA と SIRST Aug データセット上の赤外線小目標検出を最先端へ。

ABSTRACT

Infrared small target detection is an important problem in many fields such as earth observation, military reconnaissance, disaster relief, and has received widespread attention recently. This paper presents the Attention-Guided Pyramid Context Network (AGPCNet) algorithm. Its main components are an Attention-Guided Context Block (AGCB), a Context Pyramid Module (CPM), and an Asymmetric Fusion Module (AFM). AGCB divides the feature map into patches to compute local associations and uses Global Context Attention (GCA) to compute global associations between semantics, CPM integrates features from multi-scale AGCBs, and AFM integrates low-level and deep-level semantics from a feature-fusion perspective to enhance the utilization of features. The experimental results illustrate that AGPCNet has achieved new state-of-the-art performance on two available infrared small target datasets. The source codes are available at https://github.com/Tianfang-Zhang/AGPCNet.

研究の動機と目的

  • ごみやノイズのある環境下で、小さな赤外線目標を正確にセグメンテーションすることを動機づける。
  • グローバルおよびローカルな文脈を活用するデータ駆動型ネットワークの開発。
  • 特徴融合とターゲット定位を改善するためのピラミッド型かつ注意機構ベースのフレームワークを提案する。

提案手法

  • Attention-Guided Context Block (AGCB) は特徴をパッチに分割して局所的・非局所的な関連を作り、Global Context Attention (GCA) を用いてパッチレベルの全体的関係をモデル化する。
  • Context Pyramid Module (CPM) は多スケールの AGCB 出力と元の特徴マップを融合して Context Pyramid を形成する。
  • Asymmetric Fusion Module (AFM) は低レベル特徴と深層特徴を適応的に融合し、別個の注意経路で特徴のミスマッチを削減する。
  • AFM 内で Pixel attention (PA) および Channel attention (CA) を用いて融合を強化する。
  • MDFA および SIRST Aug データセットで入力サイズ 256x256、SoftIoU loss と SGD 最適化を用いて訓練および評価。
  • バックボーンの選択、CPM、AFM、縮小比、GCAタイプの妥当性を検証するアブレーション研究。

実験結果

リサーチクエスチョン

  • RQ1赤外線小目標検出のために、グローバルおよびローカルの文脈情報をどのように効果的に統合できるか?
  • RQ2マルチスケールの文脈集約が小目標のセグメンテーション性能に与える影響は何か?
  • RQ3低レベルと深層レベルの意味論の非対称融合はターゲット定位を改善し、偽警報を減らすのか?

主な発見

手法MDFA 精度MDFA 再現率MDFA mIoUMDFA F-measureMDFA AUCSIRST Aug 精度SIRST Aug 再現率SIRST Aug mIoUSIRST Aug F-measureSIRST Aug AUC
Tophat0.03990.10460.02980.05780.71540.68730.08180.07880.14610.7441
LCM0.01140.75250.01130.02240.95120.01820.79430.01820.03570.8016
MPCM0.64720.14990.13860.24340.84760.93570.15090.14930.25990.7886
NRAM0.73980.10640.10260.18610.49810.88300.08130.08040.14890.5104
PSTNN0.72360.15440.14580.25450.60870.93660.09490.09430.17240.3556
SRWS0.81380.03940.03900.07510.46410.84180.03600.03570.06900.5706
MDvsFA cGAN0.66000.5400-0.60000.9100-----
ACM0.54540.70060.44230.61330.86880.83170.70510.82700.92830.9283
AGPCNet0.59390.72410.48430.65250.86820.83230.85420.72880.84310.9344
  • AGPCNet は MDFA および SIRST Aug データセットにおいて mIoU および F-measure の両方で最先端の性能を達成。
  • アブレーション実験では、より深いバックボーン(ResNet-34)と CPM および AFM の含有が検出精度を向上。
  • CPM のマルチスケール設計はターゲット領域にエネルギーを集中させ、背景干渉を低減。
  • GCA は Pixel Attention (PA) および Patch-Wise attention を備えた構成で代替案を上回り、グローバル–ローカルの融合を強化。
  • AGPCNet は結合データセットで顕著な向上を示し、偽警報を減らした堅牢なターゲットセグメンテーションを実証。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。