Skip to main content
QUICK REVIEW

[논문 리뷰] Support Vector Guided Softmax Loss for Face Recognition

Xiaobo Wang, Shuo Wang|arXiv (Cornell University)|2018. 12. 29.
Face recognition and analysis참고 문헌 38인용 수 44
한 줄 요약

본 논문은 SV-Softmax를 제안하는데, 이는 서포트 벡터(오분류 샘플)에 초점을 맞춰 마이닝 기반 손실과 여백 기반 손실을 융합하고, 벤치마크 전반에서 식별력이 높은 얼굴 특징을 향상시킨다.

ABSTRACT

Face recognition has witnessed significant progresses due to the advances of deep convolutional neural networks (CNNs), the central challenge of which, is feature discrimination. To address it, one group tries to exploit mining-based strategies ( extit{e.g.}, hard example mining and focal loss) to focus on the informative examples. The other group devotes to designing margin-based loss functions ( extit{e.g.}, angular, additive and additive angular margins) to increase the feature margin from the perspective of ground truth class. Both of them have been well-verified to learn discriminative features. However, they suffer from either the ambiguity of hard examples or the lack of discriminative power of other classes. In this paper, we design a novel loss function, namely support vector guided softmax loss (SV-Softmax), which adaptively emphasizes the mis-classified points (support vectors) to guide the discriminative features learning. So the developed SV-Softmax loss is able to eliminate the ambiguity of hard examples as well as absorb the discriminative power of other classes, and thus results in more discrimiantive features. To the best of our knowledge, this is the first attempt to inherit the advantages of mining-based and margin-based losses into one framework. Experimental results on several benchmarks have demonstrated the effectiveness of our approach over state-of-the-arts.

연구 동기 및 목표

  • 전통적인 Softmax 손실을 넘어 얼굴 인식에서 특징 구분력을 개선하도록 동기를 부여한다.
  • 오분류 예시(서포트 벡터)를 의미적으로 식별하고 강조하는 손실을 개발한다.
  • 마이닝 기반 손실과 마진 기반 손실의 강점을 하나의 통합 프레임워크로 결합한다.
  • 기존 손실들과의 관계를 분석하고 표준 벤치마크에서 성능을 평가한다.

제안 방법

  • 오분류된 클래스 점수를 표시하기 위해 이진 서포트 벡터 지시자 I_k를 정의한다.
  • SV-Softmax 손실을 제안한다: L_5 = -log[ exp(s cos(theta_w_y,x)) / ( exp(s cos(theta_w_y,x)) + sum_{k≠y} h(t, cos(theta_w_k,x), I_k) exp(s cos(theta_w_k,x)) ) ], where h(t,·) = exp(s(t-1)(cos(theta_w_k,x) + 1) I_k).
  • I_k = 0 if cos(theta_w_y,x) - cos(theta_w_k,x) ≥ 0; I_k = 1 otherwise.
  • t=1일 때 표준 Softmax를 복구하고, 더 큰 t는 더 어려운(서포트 벡터에 해당하는) 케이스를 강조한다.
  • 마진 기반 의사결정 경계를 사용하여 I_k를 결정하는 방식으로 SV-X-Softmax로 확장한다( SV-X-Softmax (t) 는 f(m, theta) 경계를 사용).
  • 그라디언트 기반 최적화 방정식과 엔드-투-엔드 학습을 위한 SGD 학습 절차를 제공한다.

실험 결과

연구 질문

  • RQ1Explicitly targets misclassified points (support vectors) loss가 전통적인 마이닝 기반 손실(예: F-Softmax) 및 마진 기반 손실(예: Arc-/AM-/A-Softmax)을 대체로 향상시킬 수 있는가?
  • RQ2하나의 SV-Softmax 프레임워크 내에서 마이닝 기반 동기와 마진 기반 동기를 결합하면 더 우수한 구별 특징을 제공하는가?
  • RQ3SV-Softmax가 표준 벤치마크(LFW, MegaFace, Trillion Pairs)에서 마이닝과 마진 손실의 naive 결합과 비교해 어떤 차이가 있는가?

주요 결과

  • SV-Softmax는 오분류 샘플을 의미적으로 강조하는 명시적 서포트 벡터 기반 초점을 정의한다.
  • SV-Softmax는 MegaFace 및 Trillion Pairs 벤치마크에서 종종 기본 Softmax 및 다수의 마이닝 기반 손실보다 우수한 성능을 보인다.
  • 향상된 변형인 SV-Arc-Softmax 및 SV-AM-Softmax는 비-SV 대응 손실과 비교해 경쟁력 있거나 우수한 결과를 보여준다.
  • MegaFace 및 Trillion Pairs에서 SV-AM-Softmax는 많은 경쟁자 대비 현저한 이득을 얻으며, SV-X-Softmax 스타일의 마진을 사용할 때 더 큰 이득이 나타난다.
  • LFW 결과는 강한 베이스라인 대비 완만한 이득이지만, 더 도전적인 벤치마크에서 더 큰 개선이 관측된다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.