QUICK REVIEW

[논문 리뷰] Face Recognition via Centralized Coordinate Learning

Xianbiao Qi, Lei Zhang|arXiv (Cornell University)|2018. 01. 17.

Face recognition and analysis참고 문헌 14인용 수 30

한 줄 요약

이 논문은 중심화된 좌표 학습(CCL)을 제안하며, 특징을 원점으로 중심화하고 분류 벡터를 초구면에 제약을 두어 얼굴 특징과 분류 벡터를 동시에 최적화함으로써 특징의 분리도를 크게 향상시킵니다. CASIA Webface에서 460만 장의 이미지만을 사용해 훈련했음에도 불구하고, 6개의 벤치마크(교차 연령 및 대규모 데이터셋 포함)에서 최신 기준(SOTA) 성능을 달성합니다.

ABSTRACT

Owe to the rapid development of deep neural network (DNN) techniques and the emergence of large scale face databases, face recognition has achieved a great success in recent years. During the training process of DNN, the face features and classification vectors to be learned will interact with each other, while the distribution of face features will largely affect the convergence status of network and the face similarity computing in test stage. In this work, we formulate jointly the learning of face features and classification vectors, and propose a simple yet effective centralized coordinate learning (CCL) method, which enforces the features to be dispersedly spanned in the coordinate space while ensuring the classification vectors to lie on a hypersphere. An adaptive angular margin is further proposed to enhance the discrimination capability of face features. Extensive experiments are conducted on six face benchmarks, including those have large age gap and hard negative samples. Trained only on the small-scale CASIA Webface dataset with 460K face images from about 10K subjects, our CCL model demonstrates high effectiveness and generality, showing consistently competitive performance across all the six benchmark databases.

연구 동기 및 목표

학습 중 특징 분포의 불균형으로 인한 딥 얼굴 인식의 일반화 및 수렴 문제를 해결하기 위해.
원점 기준 좌표 공간 전역에 걸쳐 얼굴 특징이 분산되도록 보장하여 특징의 분리도를 향상시키기 위해.
분류 벡터를 초구면에 고정시켜 코사인 유사도 계산의 일관성을 높이기 위해.
적응형 각도 마진 메커니즘을 통해 클래스 간 분리도를 향상시키기 위해.
제한된 훈련 데이터로도 특징과 분류기를 통합 최적화하는 것이 강력한 성능을 낼 수 있음을 보여주기 위해.

제안 방법

각 차원의 평균을 빼어 특징을 원점 중심으로 분포시키며, 각도 간 분리도를 향상시킵니다.
분류 벡터를 단위 L2 노름으로 정규화하여 초구면 상에 위치하도록 강제함으로써 코사인 유사도 계산의 일관성을 확보합니다.
특징 분포에 따라 동적으로 마진을 조정하는 적응형 각도 마진(AAM)을 도입하여 클래스 간 분리도를 향상시킵니다.
중앙화된 특징 학습과 정규화된 분류 벡터를 통합 최적화 프레임워크에 통합하여 훈련 수렴도와 일반화 능력을 향상시킵니다.
특징 중심화 및 각도 마진 제약 조건을 통합한 수정된 손실 함수를 사용하는 표준 CNN을 활용합니다.
모든 평가에 동일하게 CASIA Webface 데이터셋(460만 장의 이미지, 약 1만 명의 주제)을 사용하는 단순하면서도 효과적인 훈련 파이프라인을 구현합니다.

실험 결과

연구 질문

RQ1원점으로 특징을 중심화하는 것이 딥 얼굴 인식에서 클래스 간 각도 분리도와 일반화 능력을 향상시키는가?
RQ2분류 벡터를 초구면에 제약을 두는 것이 훈련 및 추론 중 코사인 유사도 계산의 일관성을 향상시키는가?
RQ3대규모 훈련 데이터가 필요 없이도 적응형 각도 마진이 특징 분리도를 추가로 향상시킬 수 있는가?
RQ4제안된 CCL 방법은 훨씬 더 큰 데이터셋으로 훈련된 최신 기준(SOTA) 모델들과 비교해 어떻게 성능을 낼 수 있는가?
RQ5특징과 분류기를 통합 최적화하는 방식이 교차 연령 및 하드 음성 데이터셋을 포함한 다양한 벤치마크에서 뛰어난 성능을 낼 수 있는가?

주요 결과

적응형 각도 마진을 사용한 CCL은 LFW 벤치마크에서 SphereFace보다 약 1% 높은 99.47%의 정확도를 기록했습니다.
적응형 각도 마진 없이도 CCL은 LFW에서 72.572%의 정확도를 달성했으며, 이는 m=4의 큰 마진을 사용한 SphereFace(72.729%)와 유사한 성능입니다.
CCL은 도전적인 CALFW 데이터셋에서 74.5%의 정확도를 기록하여 강력한 교차 연령 일반화 능력을 입증했습니다.
MegaFace 벤치마크에서 CCL은 상위 수준의 성능을 보였으며, 대규모 갤러리 세트와 아이덴티티 오버랩이 존재하는 상황에서도 상위 10위 검색 정확도에서 뛰어난 성능을 보였습니다.
Coco Loss(76.57% on LFW)와 같은 더 큰 데이터셋으로 훈련된 몇몇 SOTA 모델들보다도 CCL은 CASIA Webface에서 460만 장의 이미지만을 사용해도 뛰어난 성능을 낼 수 있었습니다.
CCL은 LFW, CALFW, CACD, SLLFW, YTF, MegaFace를 포함한 모든 6개의 벤치마크에서 최신 기준 또는 매우 경쟁력 있는 성능을 지속적으로 기록했습니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.