Skip to main content
QUICK REVIEW

[论文解读] SphereFace: Deep Hypersphere Embedding for Face Recognition

Weiyang Liu, Yandong Wen|arXiv (Cornell University)|Apr 26, 2017
Face recognition and analysis参考文献 26被引用 412
一句话总结

SphereFace 引入角度边距损失(A-Softmax),用于训练 CNN 实现开放集人脸识别,通过在超球面上强制判别特征。它在 LFW 和 YTF 上使用 WebFace 数据实现近似 SOTA 的结果。

ABSTRACT

This paper addresses deep face recognition (FR) problem under open-set protocol, where ideal face features are expected to have smaller maximal intra-class distance than minimal inter-class distance under a suitably chosen metric space. However, few existing algorithms can effectively achieve this criterion. To this end, we propose the angular softmax (A-Softmax) loss that enables convolutional neural networks (CNNs) to learn angularly discriminative features. Geometrically, A-Softmax loss can be viewed as imposing discriminative constraints on a hypersphere manifold, which intrinsically matches the prior that faces also lie on a manifold. Moreover, the size of angular margin can be quantitatively adjusted by a parameter $m$. We further derive specific $m$ to approximate the ideal feature criterion. Extensive analysis and experiments on Labeled Face in the Wild (LFW), Youtube Faces (YTF) and MegaFace Challenge show the superiority of A-Softmax loss in FR tasks. The code has also been made publicly available.

研究动机与目标

  • 将开放集人脸识别定位为学习具备受控的类内和类间角距离的判别特征。
  • 引入 Angular Softmax (A-Softmax) 损失,在超球面流形上施加角度边距。
  • 为角度边距参数 m 提供理论分析和下界,以逼近理想的 FR 标准。
  • 在标准基准数据集(LFW、YTF、MegaFace)上使用 WebFace 训练数据,展示 SphereFace 的经验有效性。

提出的方法

  • 推导 angular softmax (A-Softmax) 损失,用一个由整数 m 控制的角度边距替换余弦相似度。
  • 构建一个广义 softmax 的泛化,其中真实类的判决边界依赖于 cos(m theta) 而其他类依赖 cos(theta),实现可调角度边距。
  • 引入单调函数 psi(theta),扩展 cos(m theta) 超出原始定义域以实现端到端训练。
  • 将特征嵌入单位超球面(SphereFace),通过强制归一化权重和零偏置,使分类依赖于角度。
  • 推导 m 在二元和多类设置中的下界 m_min,指出 m=4 是逼近开放集标准的实用选择。

实验结果

研究问题

  • RQ1在超球面上进行角度边距学习是否能提升开放集人脸识别的判别性?
  • RQ2应如何选择角度边距参数 m,以逼近理想的类内/类间角度距离标准?
  • RQ3使用 A-Softmax 学习的超球面嵌入是否在标准 FR 基准上优于传统 softmax 与欧几何边距损失?
  • RQ4使用 SphereFace 与 WebFace 训练数据,在 LFW、YTF、MegaFace 等基准上的经验提升是多少?

主要发现

  • A-Softmax 比 softmax 强制更大的角度边距,在超球面上获得更具判别性的特征。
  • LFW 准确率在 m=4 时达到 99.42%(来自 WebFace 训练的 64-layer CNN),YTF 准确率达到 95.0%。
  • L-Softmax 与其他欧几何边距损失在 LFW/YTF 的评估架构上均被 SphereFace 超越。
  • 更深的网络在使用 A-Softmax 时比使用标准 softmax 获得更多收益,在困难基准上有显著提升。
  • SphereFace 在与使用私有数据训练的模型相比展现出竞争力,强调使用公开数据集 CASIA-WebFace 的有效性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。