QUICK REVIEW

[논문 리뷰] AdaCos: Adaptively Scaling Cosine Logits for Effectively Learning Deep Face Representations

Xiao Zhang, Rui Zhao|arXiv (Cornell University)|2019. 05. 01.

Face recognition and analysis참고 문헌 44인용 수 27

한 줄 요약

이 논문은 깊이 있는 얼굴 표현 학습을 향상시키기 위해 예측된 분류 확률을 각도 마진과 일치시키기 위해 로그리트를 적응적으로 스케일링하는 하이퍼파rameter가 없는 코사인 기반 소프트맥스 손실인 AdaCos를 제안한다. 학습 중에 스케일 파ram터를 동적으로 조정함으로써 LFW, MegaFace, IJB-C 벤치마크에서 최신 기술 성능을 달성하며, 수동 튜닝 없이도 안정적이고 효과적인 최적화를 보장한다.

ABSTRACT

The cosine-based softmax losses and their variants achieve great success in deep learning based face recognition. However, hyperparameter settings in these losses have significant influences on the optimization path as well as the final recognition performance. Manually tuning those hyperparameters heavily relies on user experience and requires many training tricks. In this paper, we investigate in depth the effects of two important hyperparameters of cosine-based softmax losses, the scale parameter and angular margin parameter, by analyzing how they modulate the predicted classification probability. Based on these analysis, we propose a novel cosine-based softmax loss, AdaCos, which is hyperparameter-free and leverages an adaptive scale parameter to automatically strengthen the training supervisions during the training process. We apply the proposed AdaCos loss to large-scale face verification and identification datasets, including LFW, MegaFace, and IJB-C 1:1 Verification. Our results show that training deep neural networks with the AdaCos loss is stable and able to achieve high face recognition accuracy. Our method outperforms state-of-the-art softmax losses on all the three datasets.

연구 동기 및 목표

기존의 코사인 기반 소프트맥스 손실에서 하이퍼파rameter 튜닝에 민감하고 불안정한 문제를 해결하기 위해.
코사인 기반 손실에서 스케일 및 마진 파ram터가 분류 확률 예측에 미치는 영향을 분석하기 위해.
학습 감독과 일반화를 향상시키기 위해 스케일링을 자동으로 적응시키는 손실 함수를 개발하기 위해.
수동 하이퍼파rameter 튜닝을 제거하면서도 대규모 얼굴 데이터셋에서 정확도를 유지하거나 향상시키기 위해.

제안 방법

클래스 수와 특징의 각도 분포에 기반해 스케일 파ram터를 동적으로 조정하는 새로운 코사인 기반 소프트맥스 손실인 AdaCos를 제안한다.
정확도가 높은 클래스의 예측 확률가 진짜 코사인 유사도를 반영하도록 보장하기 위해 적응형 스케일 파ram터 $\tilde{s}_d^{(t)}$ 를 도입한다.
학습 중에 클래스 간 및 클래스 내 각도 마진 간의 균형을 유지하기 위해 스케일 파ram터를 해석적으로 유도한다.
특징 정규화와 수정된 교차 엔트로피 손실을 사용하여 각도 마진을 최적화하면서도 코사인 유사도의 기하학적 해석을 유지한다.
반복적 튜닝을 피하고 계산 오버헤드를 줄이기 위해 스케일 파ram터에 대해 폐쇄형 해를 사용한다.
기존 빌트인 연산을 활용해 표준 딥러닝 프레임워크에 원활하게 통합되어 쉽게 배포할 수 있다.

실험 결과

연구 질문

RQ1코사인 기반 손실에서 스케일 및 마진 하이퍼파ram터는 예측된 분류 확률에 어떤 영향을 미치는가?
RQ2기존의 코사인 기반 손실은 왜 광범위한 하이퍼파ram터 튜닝이 필요하고 학습 불안정성 문제를 겪는가?
RQ3학습 중에 스케일 파aram터를 자동으로 적응시킬 수 있는가? 이는 감독과 인식 성능 향상에 기여하는가?
RQ4적응형 스케일링 메커니즘이 깊이 있는 얼굴 인식에서 더 나은 일반화와 수렴을 이끌어내는가?

주요 결과

AdaCos는 LFW 벤치마크에서 기존 손실인 ArcFace 및 CosFace를 능가하는 최신 기술 성능을 달성한다.
MegaFace 1M 식별 벤치마크에서, 동일한 학습 데이터와 네트워크 아키텍처를 사용함에도 불구하고 AdaCos는 ArcFace 및 CosFace를 포함한 모든 비교 손실보다 높은 정확도를 기록한다.
IJB-C 1:1 검증 프로토콜에서, 동적 AdaCos는 10^-7의 가짜 수락률(FAR)에서 99.06%의 참 수락률을 달성하여 ArcFace 및 기타 최신 기술 방법을 초월한다.
동적 AdaCos 버전은 IJB-C에서 10^-6 FAR에서 83.28%의 참 수락률을 기록하여 고정된 AdaCos 및 기타 손실보다 뛰어난 성능을 보였다.
AdaCos 학습은 기준 손실보다 더 빠르고 안정적으로 수렴하며, 수동 하이퍼파라미터 튜닝이 필요하지 않다.
제안된 적응형 스케일 파라미터는 예측된 확률이 코사인 유사도의 기하학적 의미와 효과적으로 일치하도록 하여 학습과 추론 간 격차를 줄였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.