Skip to main content
QUICK REVIEW

[논문 리뷰] Detecting Faces Using Region-based Fully Convolutional Networks

Yitong Wang, Xing Ji|arXiv (Cornell University)|2017. 09. 14.
Face recognition and analysis참고 문헌 15인용 수 94
한 줄 요약

Face R-FCN은 위치 민감 풀링, 다중 스케일 학습/테스트, 온라인 하드 예제 마이닝(OHEM)을 사용하여 WIDER FACE 및 FDDB에서 최첨단 결과를 달성하는 영역 기반의 완전 합성 컨볼루션 네트워크를 통해 얼굴을 탐지합니다.

ABSTRACT

Face detection has achieved great success using the region-based methods. In this report, we propose a region-based face detector applying deep networks in a fully convolutional fashion, named Face R-FCN. Based on Region-based Fully Convolutional Networks (R-FCN), our face detector is more accurate and computational efficient compared with the previous R-CNN based face detectors. In our approach, we adopt the fully convolutional Residual Network (ResNet) as the backbone network. Particularly, We exploit several new techniques including position-sensitive average pooling, multi-scale training and testing and on-line hard example mining strategy to improve the detection accuracy. Over two most popular and challenging face detection benchmarks, FDDB and WIDER FACE, Face R-FCN achieves superior performance over state-of-the-arts.

연구 동기 및 목표

  • 정확하고 효율적인 얼굴 탐지를 위해 영역 기반 완전 합성 네트워크를 활용한다.
  • 작고 다양한 얼굴을 처리하기 위해 R-FCN 프레임워크에 얼굴 특화 설계 요소를 통합한다.
  • 위치 민감 풀링 및 스케일 전략을 통해 특징 표현을 강화한다.
  • 다중 스케일 데이터 및 하드 예제 마이닝으로 학습을 개선하여 도전적인 얼굴 탐지를 강화한다.

제안 방법

  • 공유 계산을 위한 ResNet 백본으로 R-FCN을 기반으로 구축한다.
  • 작은 얼굴을 더 잘 탐지하기 위해 더 작은 앵커와 RoI 풀링 크기를 도입한다.
  • 얼굴 영역 기여도를 재가중하기 위해 위치 민감 평균 풀링을 적용한다.
  • 후반부 스테이지에서 문맥 및 해상도를 유지하기 위해 atrous convolution을 사용한다.
  • 이미지 피라미드를 이용한 다중 스케일 학습 및 테스트와 온라인 하드 예제 마이닝(OHEM)을 적용한다.
  • 테스트 시에 스케일 간 앙상블로 정확도를 향상시킨다.

실험 결과

연구 질문

  • RQ1영역 기반 완전 합성 네트워크를 다양한 스케일과 차폐에 걸친 견고한 얼굴 탐지에 맞게 조정할 수 있는가?
  • RQ2위치 민감 풀링과 더 작은 RoI가 작은 얼굴이나 부분적으로 가려진 얼굴의 탐지 성능을 향상시키는가?
  • RQ3다중 스케일 학습/테스트 및 OHEM이 도전적인 벤치마크에서 얼굴 탐지 정확도에 미치는 영향은 무엇인가?

주요 결과

  • Face R-FCN은 WIDER FACE의 Easy, Medium, Hard 하위 집합에서 이전 방법들보다 우수한 성능을 달성한다.
  • Face R-FCN은 FDDB에서 무제한 학습 프로토콜 하에서 최첨단 결과를 달성하며, 주어진 허용 거짓 양성 수에서 높은 True Positive 비율을 기록한다.
  • 위치 민감 평균 풀링을 도입하면 글로벌 평균 풀링에 비해 임베딩 구별성이 향상된다.
  • 다중 스케일 전략과 OHEM은 학습 효율과 특히 작은 얼굴 탐지에서 hard 예제 탐지 성능을 향상시킨다.
  • 이미지 피라미드(다중 스케일)로 테스트하면 스케일 전반에 걸쳐 견고한 탐지 결과가 얻어진다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.