QUICK REVIEW

[논문 리뷰] EXTD: Extremely Tiny Face Detector via Iterative Filter Reuse

Young Joon Yoo, Dongyoon Han|arXiv (Cornell University)|2019. 06. 15.

Face recognition and analysis참고 문헌 58인용 수 36

한 줄 요약

EXTD는 가벼운 백본을 반복적으로 재사용하여 멀티스케일 특징 맵을 생성하는 매우 компакт한 다중 스케일 얼굴 탐지기를 제시하며, 대형 탐지기와 비교 가능한 정확도를 far fewer parameters로 달성합니다.

ABSTRACT

In this paper, we propose a new multi-scale face detector having an extremely tiny number of parameters (EXTD),less than 0.1 million, as well as achieving comparable performance to deep heavy detectors. While existing multi-scale face detectors extract feature maps with different scales from a single backbone network, our method generates the feature maps by iteratively reusing a shared lightweight and shallow backbone network. This iterative sharing of the backbone network significantly reduces the number of parameters, and also provides the abstract image semantics captured from the higher stage of the network layers to the lower-level feature map. The proposed idea is employed by various model architectures and evaluated by extensive experiments. From the experiments from WIDER FACE dataset, we show that the proposed face detector can handle faces with various scale and conditions, and achieved comparable performance to the more massive face detectors that few hundreds and tens times heavier in model size and floating point operations.

연구 동기 및 목표

모바일/CPU 환경에 적합한 ultra-small 얼굴 탐지기의 필요성에 대한 동기 제시.
매개변수 추가 없이 멀티스케일 특징 맵을 생성하기 위한 반복적 백본 공유 제안.
가벼운 백본 재사용으로 매개변수를 크게 줄이더라도 WIDER FACE에서 경쟁력 있는 정확도 달성.
SSD 및 FPN 아키텍처에 대한 반복 공유의 적용 가능성 시연.

제안 방법

f_i = F(f_{i-1})이며 f_0 = E(x)인 반복적인 특징 맵 생성 도입.
SSD와 같은 형태(SDD와 같이 f_i를 직접 사용하는)와 FPN과 같은 형태(upsampling으로 g_i를 생성하고 skip 연결을 활용) 두 가지 아키텍처 구성.
<0.1M 매개변수와 채널을 {32,48,64}로 구성된 역전원 잔여 블록으로 가벼운 백본 설계.
특징 맵당 단일 3x3 분류 및 회귀 헤드 부착; 작은 얼굴의 잘못 탐지를 줄이기 위해 첫 헤드에서 Maxout 적용.
온라인 하드 음수를 마이닝과 스케일 보정된 앵커 매칭을 사용하는 멀티태스크 손실 L = (λ/N_cls) ∑ l_c(c_j,c*_j) + (1/N_reg) ∑ c*_j l_r(r_j,r*_j)으로 학습.
데이터 확장 사용 및 처음부터 학습; WIDER FACE에서 Easy/Medium/Hard에 대한 mAP로 평가.

실험 결과

연구 질문

RQ1반복적 백본 공유가 파라미터 수를 줄이면서 다중 스케일 얼굴에 대한 탐지 성능을 유지할 수 있는가?
RQ2반복적 특징 맵 생성이 소형 얼굴 탐지를 위한 하위 레벨 특징 맵의 의미론에 어떤 영향을 미치는가?
RQ3극한의 매개변수 제약 하에서 SSD-유사 아키텍처와 FPN-유사 아키텍처 간의 트레이드오프는 무엇인가?

주요 결과

EXTD 변형은 S3FD와 같은 대형 탐지기 대비 매개변수 수와 Madds를 크게 감소시키면서도 유의한 mAP를 달성합니다.
EXTD-FPN-64-PReLU는 WIDER FACE에서 Easy 0.921, Medium 0.911, Hard 0.856의 mAP를 달성; 비용은 0.16M 매개변수 및 11.2 Madds.
FPN 기반 아키텍처는 채널 너비에 관계없이 소형 얼굴 탐지에서 SSD 기반보다 일관되게 우수한 성능을 보입니다.
채널 너비를 32에서 64로 증가시키면 Easy/Medium/Hard mAP가 SSD 및 FPN 변형 모두에서 크게 향상됩니다.
순환 백본 공유를 통해 하위 레벨 특징 맵에서 추가 매개변수 없이 더 풍부한 의미 정보를 얻어 소형 얼굴 탐지 성능이 향상됩니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.