Skip to main content
QUICK REVIEW

[論文レビュー] FCL-COD: Weakly Supervised Camouflaged Object Detection with Frequency-aware and Contrastive Learning

Jingchen Ni, Quan Zhang|arXiv (Cornell University)|Mar 24, 2026
Visual Attention and Saliency Detection被引用数 0
ひとこと要約

FCL-COD は周波数を意識した対照学習フレームワークを提示し、弱教師付き偽装物体検出のために SAM を適応的に微調整する。COD ベンチマークで最先端の結果を達成し、FoRA、勾配を意識した対照学習、マルチスケール周波数認識を組み合わせて境界を refine し、非偽装活性化を抑制する。

ABSTRACT

Existing camouflage object detection (COD) methods typically rely on fully-supervised learning guided by mask annotations. However, obtaining mask annotations is time-consuming and labor-intensive. Compared to fully-supervised methods, existing weakly-supervised COD methods exhibit significantly poorer performance. Even for the Segment Anything Model (SAM), there are still challenges in handling weakly-supervised camouflage object detection (WSCOD), such as: a. non-camouflage target responses, b. local responses, c. extreme responses, and d. lack of refined boundary awareness, which leads to unsatisfactory results in camouflage scenes. To alleviate these issues, we propose a frequency-aware and contrastive learning-based WSCOD framework in this paper, named FCL-COD. To mitigate the problem of non-camouflaged object responses, we propose the Frequency-aware Low-rank Adaptation (FoRA) method, which incorporates frequency-aware camouflage scene knowledge into SAM. To overcome the challenges of local and extreme responses, we introduce a gradient-aware contrastive learning approach that effectively delineates precise foreground-background boundaries. Additionally, to address the lack of refined boundary perception, we present a multi-scale frequency-aware representation learning strategy that facilitates the modeling of more refined boundaries. We validate the effectiveness of our approach through extensive empirical experiments on three widely recognized COD benchmarks. The results confirm that our method surpasses both state-of-the-art weakly supervised and even fully supervised techniques.

研究の動機と目的

  • SAM のようなファウンデーションモデルを用いた WSCOD の制限を動機づけて対処する。
  • 周波数を意識した適応により偽装 priors を SAM に注入する。
  • 勾配を意識した対照学習によって境界の delineation を改善する。
  • マルチスケール周波数認識注意機構で境界感度を高める。
  • 標準 COD ベンチマークでの有効性を検証し、一般化可能性を示す。

提案手法

  • CAMOCI 検出の信頼できる疑似ラベルを生成する三者教員–生徒自己訓練。
  • FoRA(Frequency-aware Low-Rank Adaptation)を用いて SAM に周波数変換と空間変換を介して偽装 priors を注入する。
  • Grad-CAM による背景強調とプロトタイプを用いた埋め込み空間で前景/背景を分離するGradient-aware Contrastive Learning(GCL)。
  • MSFA(Multi-Scale Frequency-aware Attention)を用いて複数スケールで空間的・周波数的手掛かりを統合し境界感度の高いデコードを実現する。

実験結果

リサーチクエスチョン

  • RQ1FoRA は事前学習済みファウンデーションモデルへ偽装特有の priors を注入して非偽装応答を抑制できるか。
  • RQ2勾配を意識した対照学習は WSCOD における前景–背景分離を改善できるか。
  • RQ3マルチスケール周波数認識注意を備えた軽量検出器は CAMO シーンで境界の refine を達成できるか。
  • RQ4提案フレームワークは標準ベンチマーク上で最先端の弱教師付きおよび完全教師付き COD 手法とどのように比較されるか。

主な発見

  • FCL-COD は複数のベンチマークで最先端の弱教師付き COD 手法を上回る。
  • アブレーション実験で FoRA と GCL が疑似ラベルおよび境界 delineation の改善に寄与し、MSFA が最大の利得をもたらす。
  • 全体のフレームワークは SAM ベースのベースラインおよび一部の完全教師付き手法と比較して境界精度と偽装物体のセグメンテーションが優れている。
  • このアプローチは COD 以外の弱教師付き顕著物体検出タスクへもより良く一般化する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。