QUICK REVIEW

[논문 리뷰] Deep Texture-Aware Features for Camouflaged Object Detection

Jingjing Ren, Xiaowei Hu|arXiv (Cornell University)|2021. 02. 05.

Visual Attention and Saliency Detection참고 문헌 36인용 수 32

한 줄 요약

본 논문은 TANet, 깊은 텍스처 인지 보정 프레임워크(TARM)를 제안하여 텍스처 차이를 증폭해 위장 객체 탐지(COD)를 개선하고 COD 벤치마크에서 최첨단 성능을 달성한다.

ABSTRACT

Camouflaged object detection is a challenging task that aims to identify objects having similar texture to the surroundings. This paper presents to amplify the subtle texture difference between camouflaged objects and the background for camouflaged object detection by formulating multiple texture-aware refinement modules to learn the texture-aware features in a deep convolutional neural network. The texture-aware refinement module computes the covariance matrices of feature responses to extract the texture information, designs an affinity loss to learn a set of parameter maps that help to separate the texture between camouflaged objects and the background, and adopts a boundary-consistency loss to explore the object detail structures.We evaluate our network on the benchmark dataset for camouflaged object detection both qualitatively and quantitatively. Experimental results show that our approach outperforms various state-of-the-art methods by a large margin.

연구 동기 및 목표

배경 간 유사성으로 인해 COD를 텍스처 구별의 문제로 제시한다.
배경과 위장 객체 간의 텍스처 차이를 학습하고 증폭하기 위해 텍스처 인지 보정 모듈을 제안한다.
객체의 세부사항과 경계 정확도를 향상시키기 위해 경계 일관성 손실을 도입한다.
표준 벤치마크에서 최신 COD, SOD 및 의미론적 분할 방법과 비교 평가한다.
정성적 시각화와 정량적 지표를 통해 개선을 입증한다.

제안 방법

CNN 계층 전반에 걸쳐 다수의 텍스처 인지 보정 모듈(TARM)을 갖춘 TANet 아키텍처를 도입한다.
각 TARM 내에서 채널 응답의 픽셀별 공분산 행렬을 계산해 텍스처 정보를 포착한다.
특징을 변환하고 텍스처 차이를 증폭하기 위해 친화성 기반 매개변수 맵(gamma, beta)을 학습한다.
고해상도 맵에서 객체 경계 전반의 세부 보존을 강제하기 위해 경계 일관성 손실을 적용한다.
텍스처 보정 전에 특징을 다듬기 위해 다층 감독 및 잔차 보정 블록으로 학습한다.
세 벤치마크 데이터셋에서 표준 COD 지표(S_alpha, E_phi, F_beta^w, MAE)를 사용해 평가한다.

실험 결과

연구 질문

RQ1텍스처 인지 보정이 위장 객체와 비슷한 텍스처의 배경 간 구분을 향상시킬 수 있는가?
RQ2공분산 기반 텍스처 특징과 친화성 변환이 기존 방법 대비 COD 성능을 향상시키는가?
RQ3경계 일관성 손실이 추가 시험 비용 없이 경계 세부사항을 개선하는가?
RQ4COD 벤치마크에서 TANet이 최첨단 COD, SOD 및 의미론적 분할 방법과 어떻게 비교되는가?

주요 결과

TANet은 CHAMELEON, CAMO-Test, COD10K-Test에서 13개의 최첨단 방법과 비교해 평균 성능이 우수하다.
TANet(제안 방법)에서 CHAMELEON: S_alpha=0.888, E_phi=0.911, F_beta^w=0.786, M=0.036; CAMO-Test: S_alpha=0.793, E_phi=0.834, F_beta^w=0.690, M=0.083; COD10K-Test: S_alpha=0.803, E_phi=0.848, F_beta^w=0.629, M=0.041.
SINet과 비교해 TANet이 세 데이터셋 모두에서 S_alpha, E_phi, F_beta^w를 더 높이고 MAE를 더 낮게 달성한다.
소거 연구에서 잔차 보정 블록(RRB)과 경계 일관성 손실(BCL)을 갖춘 TARMs를 추가하면 COD 지표가 점진적으로 향상됨을 보인다.
경계 일관성 손실은 TARMs의 경계 품질과 세부사항을 개선하지만 테스트 비용을 증가시키지 않는다.
정성적 시각화는 TANet으로 텍스처 차이가 증폭되고 COD 맵이 더 정확해짐을 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.