QUICK REVIEW

[논문 리뷰] Detecting Faces Using Region-based Fully Convolutional Networks

Yitong Wang, Xing Ji|arXiv (Cornell University)|2017. 09. 14.

Face recognition and analysis참고 문헌 15인용 수 94

한 줄 요약

Face R-FCN은 위치 민감 풀링, 다중 스케일 학습/테스트, 온라인 하드 예제 마이닝(OHEM)을 사용하여 WIDER FACE 및 FDDB에서 최첨단 결과를 달성하는 영역 기반의 완전 합성 컨볼루션 네트워크를 통해 얼굴을 탐지합니다.

ABSTRACT

Face detection has achieved great success using the region-based methods. In this report, we propose a region-based face detector applying deep networks in a fully convolutional fashion, named Face R-FCN. Based on Region-based Fully Convolutional Networks (R-FCN), our face detector is more accurate and computational efficient compared with the previous R-CNN based face detectors. In our approach, we adopt the fully convolutional Residual Network (ResNet) as the backbone network. Particularly, We exploit several new techniques including position-sensitive average pooling, multi-scale training and testing and on-line hard example mining strategy to improve the detection accuracy. Over two most popular and challenging face detection benchmarks, FDDB and WIDER FACE, Face R-FCN achieves superior performance over state-of-the-arts.

연구 동기 및 목표

정확하고 효율적인 얼굴 탐지를 위해 영역 기반 완전 합성 네트워크를 활용한다.
작고 다양한 얼굴을 처리하기 위해 R-FCN 프레임워크에 얼굴 특화 설계 요소를 통합한다.
위치 민감 풀링 및 스케일 전략을 통해 특징 표현을 강화한다.
다중 스케일 데이터 및 하드 예제 마이닝으로 학습을 개선하여 도전적인 얼굴 탐지를 강화한다.

제안 방법

공유 계산을 위한 ResNet 백본으로 R-FCN을 기반으로 구축한다.
작은 얼굴을 더 잘 탐지하기 위해 더 작은 앵커와 RoI 풀링 크기를 도입한다.
얼굴 영역 기여도를 재가중하기 위해 위치 민감 평균 풀링을 적용한다.
후반부 스테이지에서 문맥 및 해상도를 유지하기 위해 atrous convolution을 사용한다.
이미지 피라미드를 이용한 다중 스케일 학습 및 테스트와 온라인 하드 예제 마이닝(OHEM)을 적용한다.
테스트 시에 스케일 간 앙상블로 정확도를 향상시킨다.

실험 결과

연구 질문

RQ1영역 기반 완전 합성 네트워크를 다양한 스케일과 차폐에 걸친 견고한 얼굴 탐지에 맞게 조정할 수 있는가?
RQ2위치 민감 풀링과 더 작은 RoI가 작은 얼굴이나 부분적으로 가려진 얼굴의 탐지 성능을 향상시키는가?
RQ3다중 스케일 학습/테스트 및 OHEM이 도전적인 벤치마크에서 얼굴 탐지 정확도에 미치는 영향은 무엇인가?

주요 결과

Face R-FCN은 WIDER FACE의 Easy, Medium, Hard 하위 집합에서 이전 방법들보다 우수한 성능을 달성한다.
Face R-FCN은 FDDB에서 무제한 학습 프로토콜 하에서 최첨단 결과를 달성하며, 주어진 허용 거짓 양성 수에서 높은 True Positive 비율을 기록한다.
위치 민감 평균 풀링을 도입하면 글로벌 평균 풀링에 비해 임베딩 구별성이 향상된다.
다중 스케일 전략과 OHEM은 학습 효율과 특히 작은 얼굴 탐지에서 hard 예제 탐지 성능을 향상시킨다.
이미지 피라미드(다중 스케일)로 테스트하면 스케일 전반에 걸쳐 견고한 탐지 결과가 얻어진다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.