QUICK REVIEW

[논문 리뷰] PyramidBox++: High Performance Detector for Finding Tiny Face

Zhihang Li, Xu Tang|arXiv (Cornell University)|2019. 03. 31.

Face recognition and analysis참고 문헌 44인용 수 37

한 줄 요약

PyramidBox++은 균형 잡힌 데이터 샘플링, 이중 피라미드 앵커, 밀도 컨텍스트 모듈, 다중 작업 학습을 사용하여 WIDER FACE에서 작은 얼굴 탐지 성능을 향상시키고 하드 세트에서 최첨단 결과를 달성합니다.

ABSTRACT

With the rapid development of deep convolutional neural network, face detection has made great progress in recent years. WIDER FACE dataset, as a main benchmark, contributes greatly to this area. A large amount of methods have been put forward where PyramidBox designs an effective data augmentation strategy (Data-anchor-sampling) and context-based module for face detector. In this report, we improve each part to further boost the performance, including Balanced-data-anchor-sampling, Dual-PyramidAnchors and Dense Context Module. Specifically, Balanced-data-anchor-sampling obtains more uniform sampling of faces with different sizes. Dual-PyramidAnchors facilitate feature learning by introducing progressive anchor loss. Dense Context Module with dense connection not only enlarges receptive filed, but also passes information efficiently. Integrating these techniques, PyramidBox++ is constructed and achieves state-of-the-art performance in hard set.

연구 동기 및 목표

대규모 스케일 변화와 작은 얼굴이 존재하는 제약 없는 환경에서도 견고한 얼굴 탐지를 촉진한다.
데이터 샘플링 불균형과 컨텍스트 활용 문제를 해결하여 PyramidBox를 개선한다.
추가 감독 신호와 정규화를 제공하기 위해 다중 작업 학습을 활용한다.

제안 방법

균형 데이터 앵커 샘플링(BDAS)을 도입하여 얼굴 스케일 샘플링을 균일하게 한다.
백본 근처에서 점진적 맥락 감독을 가능하게 하는 이중 피라미드 앵커(Dual-PyramidAnchors)를 제안한다.
밀도 연결(Dense connections)이 있는 Dense Context Module을 도입하여 수용 영역을 늘리고 정보 흐름을 개선한다.
세분화(segmentation) 및 앵커 프리(anchor-free) 탐지를 포함한 다중 작업 학습을 활용하여 추가 감독을 제공한다.

실험 결과

연구 질문

RQ1얼굴 스케일 간 샘플링 균형이 WIDER FACE에서 작은 얼굴의 재현률을 얼마나 개선할 수 있는가?
RQ2이중 피라미드 앵커와 밀도 컨텍스트를 도입하면 이전 PyramidBox와 비교해 작은 얼굴의 위치 추정이 개선되는가?
RQ3세분화 및 앵커 프리 작업이 작은 얼굴의 전반적인 탐지 성능에 미치는 영향은 무엇인가?

주요 결과

WIDER FACE에서 PyramidBox++는 검증 세트에서 AP 96.5%(Easy), 95.9%(Medium), 91.2%(Hard)를 달성했고 테스트 세트에서는 95.6%(Easy), 95.2%(Medium), 90.9%(Hard)를 달성했다.
이 방법은 하드 서브셋에서 모든 접근법을 능가하여 강력한 작은 얼굴 탐지 성능을 시사한다.
BDAS는 얼굴 스케일의 샘플링을 더 균일하게 만들어 작은 얼굴 재현율을 향상시킨다.
Dense Context Module과 Dual-PyramidAnchors가 백본 근처에서 특징 학습을 개선하는 데 기여하며, 추가 런타임 비용 없이 작동한다.
세분화 및 앵커-프리 가지를 포함한 다중 작업 학습은 추가 감독을 제공하여 탐지 성능을 향상시킨다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.