Skip to main content
QUICK REVIEW

[論文レビュー] Boundary-Guided Camouflaged Object Detection

Yujia Sun, Shuo Wang|arXiv (Cornell University)|Jul 2, 2022
Visual Attention and Saliency Detection被引用数 23
ひとこと要約

BGNet は、物体関連のエッジ意味論を用いてマルチレベル特徴学習を導くエッジガイド型フレームワークを camouflaged object detection に導入し、3つの COD ベンチマークで最先端の結果を達成します。

ABSTRACT

Camouflaged object detection (COD), segmenting objects that are elegantly blended into their surroundings, is a valuable yet challenging task. Existing deep-learning methods often fall into the difficulty of accurately identifying the camouflaged object with complete and fine object structure. To this end, in this paper, we propose a novel boundary-guided network (BGNet) for camouflaged object detection. Our method explores valuable and extra object-related edge semantics to guide representation learning of COD, which forces the model to generate features that highlight object structure, thereby promoting camouflaged object detection of accurate boundary localization. Extensive experiments on three challenging benchmark datasets demonstrate that our BGNet significantly outperforms the existing 18 state-of-the-art methods under four widely-used evaluation metrics. Our code is publicly available at: https://github.com/thograce/BGNet.

研究の動機と目的

  • 物体関連エッジ意味論を活用して、カモフラージュ物体検出(COD)の境界保持を改善する動機付け。
  • 専用のエッジモジュールを備えた境界ガイド型ネットワーク(BGNet)を提案し、COD特徴学習を強化する。
  • 複数レベルのエッジ手掛かりを統合することで、よりシャープな物体境界とより良い局在化を実現することを示す。
  • 3つのベンチマークで最先端の COD 手法に対して BGNet を評価し、デザイン選択を正当化するためのアブレーションを行う。

提案手法

  • エッジ認識モジュール(EAM)は、低レベルのエッジ詳細と高レベルの位置情報を組み合わせ、境界監視の下で物体関連のエッジを抽出する。
  • エッジ導入機能モジュール(EFM)は、局所チャネル注意機構を介してエッジ手掛かりをバックボーン特徴に注入し、境界表現を強化する。
  • コンテキスト集約モジュール(CAM)は、クロススケールのアトラス畳み込みを用いてマルチレベル特徴を段階的に融合し、文脈認識型 COD 推定を高める。
  • 損失は、マスクのための重み付き二値交差エントロピーと重み付きIOUを組み合わせ、エッジ監督にはダイス損失を加え、トレードオフパラメータλを3に設定。
  • BGNet のバックボーンは Res2Net-50、複数レベルの特徴(f2 から f5)を EAM、EFM、CAM を通じて処理し、最終的な CAM 予測を生成する。

実験結果

リサーチクエスチョン

  • RQ1境界に配慮したエッジ情報は、カモフラージュ物体検出の性能をどう改善するか?
  • RQ2バックボーンの複数レベルでエッジ手掛かりを統合することは、既存の COD 手法と比べて境界の鮮明さとセグメンテーション精度を改善するか?
  • RQ3BGNet の各コンポーネント(EAM、EFM、CAM)の全体の COD 性能への寄与はどの程度か?
  • RQ4標準的な COD ベンチマーク(CAMO、COD10K、NC4K)における BGNet の性能は、最先端手法と比較してどうか?

主な発見

手法CAMO-テスト SαCAMO-テスト EφCAMO-テスト FβwCAMO-テスト MCOD10K-テスト SαCOD10K-テスト EφCOD10K-テスト FβwCOD10K-テスト MNC4K SαNC4K EφNC4K FβwNC4K M
BGNet (Ours)0.8120.8700.7490.0730.8310.9010.7220.0330.8510.9070.7880.044
  • BGNet は3つの COD ベンチマークで18件の最先端手法を上回り、4つの指標(Sα、Eφ、Fβw、M)で優れた性能を示した。
  • アブレーション研究は、コンテキスト集約モジュール(CAM)と境界手掛かり(EAM)が顕著な改善をもたらすことを示し、CAM が Fβw の顕著な改善を提供する。
  • 局所チャネル注意機構(LCA)を用いた EF M は、エッジ手掛かりを多レベル特徴と効果的に融合し、境界セマンティクスを強化する。
  • エッジ抽出の入力選択は、f2 と f5 をエッジ関連入力として使用することが最良の COD 性能をもたらすことを示した。
  • BGNet は精度の向上を図りつつ、パラメータ数、FLOPs、速度のバランスを良好に保つ。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。