[논문 리뷰] YOLO-FaceV2: A Scale and Occlusion Aware Face Detector
논문은 YOLO-FaceV2를 제시합니다. 이는 스케일 변화와 가림을 처리하는 수용 필드 확장 모듈, 가림 인식 주의 네트워크, 적응 샘플 가중치, 그리고 정규화된 Wasserstein 회귀 손실을 통해 WiderFace에서 최첨단 성능을 달성하는 YOLOv5 기반 얼굴 탐지기입니다.
In recent years, face detection algorithms based on deep learning have made great progress. These algorithms can be generally divided into two categories, i.e. two-stage detector like Faster R-CNN and one-stage detector like YOLO. Because of the better balance between accuracy and speed, one-stage detectors have been widely used in many applications. In this paper, we propose a real-time face detector based on the one-stage detector YOLOv5, named YOLO-FaceV2. We design a Receptive Field Enhancement module called RFE to enhance receptive field of small face, and use NWD Loss to make up for the sensitivity of IoU to the location deviation of tiny objects. For face occlusion, we present an attention module named SEAM and introduce Repulsion Loss to solve it. Moreover, we use a weight function Slide to solve the imbalance between easy and hard samples and use the information of the effective receptive field to design the anchor. The experimental results on WiderFace dataset show that our face detector outperforms YOLO and its variants can be find in all easy, medium and hard subsets. Source code in https://github.com/Krasjet-Yu/YOLO-FaceV2
연구 동기 및 목표
- 큰 스케일 변화, 가림 및 쉬운/어려운 샘플의 불균형을 가진 얼굴 탐지 문제를 다루는 것.
- YOLOv5를 기반으로 한 실시간 단일 단계 얼굴 탐지기를 개발하여 작은 얼굴 탐지를 강화하는 것.
- 가림 처리, 규모 인식 및 회귀 강건성을 향상시키는 모듈을 도입하는 것.
- WiderFace에서 평가하고 최첨단 얼굴 탐지기와 비교하는 것.
제안 방법
- P5 레이어에서 확장 확장된 수용 영역을 통해 확장하고 다양한 수용 필드를 만들기 위해 확장된 수용 필드 강화(RFE) 도입.
- 가림 인식 멀티 헤드 주의 모듈인 SEAM을 제안하여 가려진 얼굴 특징을 회복하는 것.
- IoU 통계에 기반해 어려운 샘플 vs. 쉬운 샘플의 가중치를 적응적으로 조정하는 Slide 손실 설계.
- 얼티브 리셉티브 필드에 의해 효과적인 앵커 설계를 맞춤화하여 얼굴 스케일에 더 잘 맞도록 하는 것.
- 작은 얼굴 로컬라이제이션을 개선하기 위해 IoU와 함께 회귀 보조로서 정규화된 Wasserstein 거리(NWD)를 도입하는 것.
실험 결과
연구 질문
- RQ1다중 스케일 융합과 향상된 수용 필드를 결합하면_large-face 성능을 손상시키지 않으면서 작은 얼굴 탐지를 개선할 수 있는가?
- RQ2SEAM이 가림으로 인한 특징 손실을 효과적으로 완화하고 가림 하에서 재현율을 개선하는가?
- RQ3적응 샘플 가중치(Slide)와 효과적인 수용 필드에 기반한 앵커 설계가 쉬움-어려움 샘플의 불균형을 해결할 수 있는가?
- RQ4IoU와 함께 NWD를 도입하면 작은 얼굴의 회귀 강건성이 개선되면서 큰 얼굴에 대한 성능은 유지되는가?
주요 결과
| Method | Easy | Medium | Hard |
|---|---|---|---|
| YOLO-FaceV2 | 0.987 | 0.972 | 0.877 |
- YOLO-FaceV2는 WiderFace 검증에서 Easy 0.987, Medium 0.972, Hard 0.877 달성.
- SEAM의 포함은 WiderFace 검증 부분에서 Easy를 0.88, Medium을 0.82, Hard를 1.06 증가시킴.
- P2를 PAN에 융합하고 RFE를 확장된卷 적인 합성으로 적용하면 Hard 정확도가 2.17포인트 상승(부분집합에 걸친 상대 이득).
- 효과적인 수용 필드에 의해 안내된 앵커 설계는 특히 Hard에서 두드러진 이득을 보이며 0.9의 개선을 가져옴.
- NWD 손실만으로는 IoU를 능가하지 못했지만 IoU와 결합하면 작은 얼굴의 강건성이 개선됨.
- Repulsion Loss(RepGT/RepBox)는 Easy, Medium, Hard를 각각 0.71, 0.63, 0.50만큼 향상시킴.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.