Skip to main content
QUICK REVIEW

[논문 리뷰] Sample and Computation Redistribution for Efficient Face Detection

Jia Guo, Jiankang Deng|arXiv (Cornell University)|2021. 05. 10.
Face recognition and analysis참고 문헌 43인용 수 68
한 줄 요약

이 논문은 Sample Redistribution (SR)와 Computation Redistribution (CR)을 제시하여 VGA 해상도 얼굴 인식의 효율성 및 정확도를 향상시키고, SCRFD 모델과 함께 최첨단 트레이드오프를 달성한다.

ABSTRACT

Although tremendous strides have been made in uncontrolled face detection, efficient face detection with a low computation cost as well as high precision remains an open challenge. In this paper, we point out that training data sampling and computation distribution strategies are the keys to efficient and accurate face detection. Motivated by these observations, we introduce two simple but effective methods (1) Sample Redistribution (SR), which augments training samples for the most needed stages, based on the statistics of benchmark datasets; and (2) Computation Redistribution (CR), which reallocates the computation between the backbone, neck and head of the model, based on a meticulously defined search methodology. Extensive experiments conducted on WIDER FACE demonstrate the state-of-the-art efficiency-accuracy trade-off for the proposed \scrfd family across a wide range of compute regimes. In particular, \scrfdf{34} outperforms the best competitor, TinaFace, by $3.86\%$ (AP at hard set) while being more than \emph{3$ imes$ faster} on GPUs with VGA-resolution images. We also release our code to facilitate future research.

연구 동기 및 목표

  • 제한된 연산으로 VGA 해상도에서 효율적인 얼굴 인식을 촉진한다.
  • 샘플링 재배치(SR)를 제안하여 얕은 검출기 단계의 학습 샘플을 늘린다.
  • 백본, 넥, 헤드 전반의 계산 최적화를 위한 두 단계 CR 전략을 제안한다.
  • 계산 구간 전반에서 WIDER FACE에서 정확도-효율성 트레이드오프 개선을 입증한다.

제안 방법

  • stride-8 특징의 학습 샘플을 특히 증가시키기 위해 대형 크롭으로 Sample Redistribution (SR)를 도입한다.
  • 고정 FLOP 예산을 기반으로 백본, 넥, 헤드에 대한 단순화된 계산 탐색 공간을 설계한다.
  • 두 단계 계산 재배치 수행: (SCRFD 1) 백본 전용 최적화, (SCRFD 2) 백본 가이드하에 백본+넥+헤드 최적화.
  • 실증적 부트스트랩을 사용하여 유망한 계산 분포를 추정하고 탐색 공간을 축소한다.
  • VGA 전용 테스트로 처음부터 모델을 훈련하고 WIDER FACE에서 최첨단 탐지기들과 비교한다.

실험 결과

연구 질문

  • RQ1VGA 해상도에서 작은 얼굴의 탐지를 개선하기 위해 학습 데이터 샘플링을 어떻게 재배치할 수 있는가?
  • RQ2고정된 FLOP 예산에서 정확도를 극대화하기 위해 백본, 넥, 헤드에 대한 계산을 어떻게 재배치해야 하는가?
  • RQ3두 단계 CR 전략이 얼굴 탐지기의 탐지 성능 및 효율성에 미치는 영향은 무엇인가?

주요 결과

  • SR은 stride-8에 대한 양성 샘플을 크게 증가시켜 hard-set AP를 상승시킨다(예: baseline에서 hard AP가 67.32에서 74.47로 상승).
  • 두 단계 CR(백본 전용 후 전체 검출기)은 단일 단계 재배치보다 더 높은 AP를 산출한다(예: CR@two-step가 71.37, 70.98).
  • SCRFD-34GF는 최첨단 효율-정확도을 달성하여 hard에서 TinaFace를 3.86 AP 포인트 앞지르고 VGA 해상도에서 3배 이상 빠르다.
  • SCRFD 모델은 0.5–34 GF 구간에서 상당한 효율성 향상을 제공하며 파라미터 수는 유리하다(예: SCRFD-34GF: 9.80M).
  • VGA 테스트에서 SCRFD-2.5GF는 훨씬 낮은 연산량(~2.5 GF)과 추론 시간으로 경쟁력 있는 정밀도를 달성한다.
  • 두 재배치 전략은 상호보완적이며 여러 계산 예산에서도 견고함을 입증한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.