QUICK REVIEW

[논문 리뷰] Unconstrained Facial Landmark Localization with Backbone-Branches Fully-Convolutional Networks

Zhujin Liang, Shengyong Ding|arXiv (Cornell University)|2015. 07. 13.

Face recognition and analysis참고 문헌 19인용 수 34

한 줄 요약

이 논문은 원시 이미지에서 사전 처리 또는 슬라이딩 윈도우 없이 직접 얼굴 랜드마크 반응 맵을 회귀하는 백본-브랜치를 갖춘 풀 컨볼루션 네트워크 BB-FCN을 제안한다. 공통 백본을 통해 군집 검출을 수행하고, 국소 특징 맵을 통해 전용 브랜치로 정밀 조정을 수행함으로써, 제약 조건이 없는 환경에서도 최신 기술 수준의 정확도를 달성하면서 효율적인 엔드 투 엔드 추론을 유지한다.

ABSTRACT

This paper investigates how to rapidly and accurately localize facial landmarks in unconstrained, cluttered environments rather than in the well segmented face images. We present a novel Backbone-Branches Fully-Convolutional Neural Network (BB-FCN), which produces facial landmark response maps directly from raw images without relying on pre-process or sliding window approaches. BB-FCN contains one backbone and a number of network branches with each corresponding to one landmark type, and it operates in a progressive manner. Specifically, the backbone roughly detects the locations of facial landmarks by taking the whole image as input, and the branches further refine the localizations based on a local observation from the backbone's intermediate feature map. Moreover, our backbone-branches architecture does not contain full-connection layers for location regression, leading to efficient learning and inference. Our extensive experiments show that our model achieves superior performances over other state-of-the-arts under both the constrained (i.e. with face regions) and the "in the wild" scenarios.

연구 동기 및 목표

기존 방법이 얼굴 분할이 불량하여 실패하는 제약 조건이 없는, 혼잡한 환경에서 정확한 얼굴 랜드마크 국소화 문제를 해결하기 위해.
추론 속도와 강인성을 향상시키기 위해 얼굴 검출 또는 슬라이딩 윈도우 기법과 같은 사전 처리 단계에 의존하지 않도록 하기 위해.
중간 백본 레이어에서 유도된 국소 특징 맵을 사용해 랜드마크 위치를 점진적으로 정밀 조정할 수 있는 딥 러닝 아키텍처를 개발하기 위해.
제약 조건이 있는(얼굴가로잡힌) 및 제약 조건이 없는('와일드'한) 얼굴 랜드마크 국소화 시나리오 모두에서 최신 기술 수준의 성능을 달성하기 위해.

제안 방법

공통 백본과 다수의 작업 전용 브랜치를 갖춘 백본-브랜치 풀 컨볼루션 네트워크(BB-FCN)를 설계하며, 각 브랜치는 하나의 얼굴 랜드마크 전용이다.
백본을 사용해 전체 입력 이미지를 처리하고, 초도 랜드마크 추정을 위한 전역 특징 맵을 생성한다.
예측된 랜드마크 위치 주변의 백본 중간 특징 맵에서 국소 특징 패치를 추출한다.
완전 연결 층을 피하기 위해, 국소 관측치를 사용해 반응 맵을 회귀하는 전용 브랜치를 통해 랜드마크 위치를 정밀 조정한다.
랜드마크 국소화 정확도를 최적화하기 위해 공동 손실 함수를 사용해 전체 네트워크를 엔드 투 엔드로 훈련한다.
완전 연결 층을 피하고 풀 컨볼루션 아키텍처를 활용함으로써 파rameter 효율성과 빠른 추론을 확보한다.

실험 결과

연구 질문

RQ1기존 방법과 비교해 볼 때, 풀 컨볼루션 백본-브랜치 아키텍처가 제약 조건이 없는 환경에서 뛰어난 랜드마크 국소화 정확도를 달성할 수 있는가?
RQ2중간 백본 레이어에서 유도된 국소 특징 맵을 통한 점진적 정밀 조정이 국소화 정밀도를 어떻게 향상시키는가?
RQ3사전 처리 및 슬라이딩 윈도우 접근 방식을 제거함으로써 추론 속도와 강인성이 얼마나 향상되는가?
RQ4제안된 BB-FCN 아키텍처가 제약 조건이 있는 경우와 '와일드'한 얼굴 이미지 시나리오 모두에 잘 일반화되는가?

주요 결과

BB-FCN 모델은 제약 조건이 있는 및 제약 조건이 없는 얼굴 랜드마크 국소화 벤치마크에서 최신 기술 수준의 성능을 달성한다.
완전 연결 층이 없기 때문에 더 빠른 훈련과 추론이 가능하면서도 높은 정확도를 유지한다.
중간 백본 레이어의 국소 특징 맵을 사용한 점진적 정밀 조정 메커니즘이 전역 특징만을 사용하는 경우에 비해 국소화 정밀도를 크게 향상시킨다.
얼굴 검출 또는 이미지 사전 처리 단계 없이도 '와일드' 이미지에 대해 효과적으로 일반화된다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.