[논문 리뷰] Boundary-Guided Camouflaged Object Detection
BGNet은 물체 관련 엣지 의미를 이용해 다중 레벨 특징 학습을 안내하는 에지 안내 프레임워크를 도입하여 CAM COD 벤치마크 세 곳에서 최첨단 결과를 달성한다.
Camouflaged object detection (COD), segmenting objects that are elegantly blended into their surroundings, is a valuable yet challenging task. Existing deep-learning methods often fall into the difficulty of accurately identifying the camouflaged object with complete and fine object structure. To this end, in this paper, we propose a novel boundary-guided network (BGNet) for camouflaged object detection. Our method explores valuable and extra object-related edge semantics to guide representation learning of COD, which forces the model to generate features that highlight object structure, thereby promoting camouflaged object detection of accurate boundary localization. Extensive experiments on three challenging benchmark datasets demonstrate that our BGNet significantly outperforms the existing 18 state-of-the-art methods under four widely-used evaluation metrics. Our code is publicly available at: https://github.com/thograce/BGNet.
연구 동기 및 목표
- 위치 기반의 경계 보존을 개선하기 위해 물체 관련 엣지 의미를 활용하는 것을 통해 COD를 촉진한다.
- 전담 엣지 모듈을 갖춘 경계 가이드 네트워크(BGNet)를 제안하여 COD 특징 학습을 향상한다.
- 다중 레벨에 걸친 엣지 단서를 통합하면 더 선명한 물체 경계와 더 나은 위치화를 얻을 수 있음을 보여준다.
- 세 가지 벤치마크에서 BGNet을 다수의 최신 COD 방법과 비교하고 설계 선택을 정당화하기 위한 제거 실험(ablation)을 수행한다.
제안 방법
- 에지 인식 모듈(EAM)은 저수준 엣지 디테일과 고수준 위치 단서를 결합하여 경계 감독 하에 물체 관련 엣지를 추출한다.
- 엣지 가이던스 피처 모듈(EFM)은 지역 채널 주의 메커니즘을 통해 엣지 단서를 백본 피처에 주입하여 경계 표현을 향상시킨다.
- 맥락 집계 모듈(CAM)은 크로스 스케일의 atrous 합성해 다중 레벨 피처를 점진적으로 융합하여 맥락 인식 COD 예측을 강화한다.
- 손실 함수는 가중치가 있는 이진 교차 엔트로피와 마스크에 대한 가중된 IOU를 결합하고 엣지 감독을 위한 다이스 손실을 더하며, 트레이드오프 파라미터 lambda를 3으로 설정한다.
- BGNet 백본은 Res2Net-50이며, 여러 레벨(f2에서 f5)의 피처를 EAM, EFM, CAM을 통해 처리하여 최종 CAM 예측을 생성한다.
실험 결과
연구 질문
- RQ1경계 인식 엣지 정보가 위장 객체 탐지 성능을 어떻게 개선할 수 있는가?
- RQ2다중 백본 레벨에서 엣지 단서를 통합하는 것이 기존 COD 방법과 비교해 물체 경계 및 분할 정확도를 더 높이는가?
- RQ3BGNet의 각 구성 요소(EAM, EFM, CAM)가 전체 COD 성능에 어떤 기여를 하는가?
- RQ4BGNet이 표준 COD 벤치마크(CAMO, COD10K, NC4K)에서 최첨단 방법에 비해 어떤 성능을 보이는가?
주요 결과
| Method | CAMO-테스트 Sα | CAMO-테스트 Eφ | CAMO-테스트 Fβw | CAMO-테스트 M | COD10K-테스트 Sα | COD10K-테스트 Eφ | COD10K-테스트 Fβw | COD10K-테스트 M | NC4K Sα | NC4K Eφ | NC4K Fβw | NC4K M |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| BGNet (Ours) | 0.812 | 0.870 | 0.749 | 0.073 | 0.831 | 0.901 | 0.722 | 0.033 | 0.851 | 0.907 | 0.788 | 0.044 |
- BGNet은 세 가지 COD 벤치마크에서 네 가지 지표(Sα, Eφ, Fβw, M)로 18개 최첨단 방법보다 우수한 성능을 보인다.
- 제한 연구에서 컨텍스트 집계 모듈(CAM)과 경계 단서(EAM)가 상당한 이득을 제공하며, CAM은 Fβw에서 눈에 띄는 개선을 제공한다.
- 로컬 채널 주의(LCA)를 가진 EFM은 엣지 단서를 다중 레벨 피처와 효과적으로 융합하여 경계 의미를 향상시킨다.
- 엣지 추출 입력 선택에서 f2와 f5를 엣지 관련 입력으로 사용할 때 COD 성능이 가장 좋다.
- BGNet은 파라미터, FLOPs, 속도 간의 균형을 잘 유지하면서도 더 높은 정확도를 달성한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.