[论文解读] Face Recognition via Centralized Coordinate Learning
该论文提出中心化坐标学习(CCL),通过将特征集中到原点并将分类向量约束在超球面上,联合优化人脸特征与分类向量,显著提升特征判别能力。仅在CASIA Webface数据集的46万张图像上训练,CCL在六个基准测试中均达到最先进性能,包括跨年龄和大规模数据集,优于在更大规模数据集上训练的模型。
Owe to the rapid development of deep neural network (DNN) techniques and the emergence of large scale face databases, face recognition has achieved a great success in recent years. During the training process of DNN, the face features and classification vectors to be learned will interact with each other, while the distribution of face features will largely affect the convergence status of network and the face similarity computing in test stage. In this work, we formulate jointly the learning of face features and classification vectors, and propose a simple yet effective centralized coordinate learning (CCL) method, which enforces the features to be dispersedly spanned in the coordinate space while ensuring the classification vectors to lie on a hypersphere. An adaptive angular margin is further proposed to enhance the discrimination capability of face features. Extensive experiments are conducted on six face benchmarks, including those have large age gap and hard negative samples. Trained only on the small-scale CASIA Webface dataset with 460K face images from about 10K subjects, our CCL model demonstrates high effectiveness and generality, showing consistently competitive performance across all the six benchmark databases.
研究动机与目标
- 为解决深度人脸识别中因训练期间特征分布不平衡导致的泛化能力差和收敛困难问题。
- 通过确保人脸特征在以原点为中心的坐标空间中均匀分布,提升特征判别能力。
- 通过将分类向量约束在超球面上,稳定余弦相似度计算。
- 通过自适应角度边界机制增强类间可分性。
- 证明仅通过统一优化特征与分类器,即使在训练数据有限的情况下,也能取得优异性能。
提出的方法
- 通过减去每个维度的均值来中心化人脸特征,确保其围绕原点分布,从而改善角度分离。
- 将分类向量归一化为L2单位范数,强制其位于超球面上,以实现余弦相似度计算的一致性。
- 引入自适应角度边界(AAM),根据特征分布动态调整边界,以增强类间判别能力。
- 在联合优化框架中结合中心化特征学习与归一化分类向量,提升训练收敛性与泛化能力。
- 使用标准CNN架构,并采用改进的损失函数,集成特征中心化与角度边界约束。
- 采用简单而高效的训练流程,仅使用CASIA Webface数据集(46万张图像,约10,000名个体)进行所有评估。
实验结果
研究问题
- RQ1将人脸特征集中到原点是否能提升深度人脸识别中的类间角度分离与泛化能力?
- RQ2将分类向量约束在超球面上是否能提升训练与推理过程中余弦相似度的一致性?
- RQ3自适应角度边界是否能在不依赖大规模训练数据的前提下进一步增强特征判别能力?
- RQ4所提出的CCL方法与在更大规模数据集上训练的最先进模型相比表现如何?
- RQ5对特征与分类器进行统一优化,是否能在包括跨年龄与难负样本数据集在内的多样化基准上实现更优性能?
主要发现
- CCL结合自适应角度边界在LFW基准上相比SphereFace提升约1%,准确率达到99.47%。
- 即使不使用自适应角度边界,CCL在LFW上仍达到72.572%的准确率,与使用大边界m=4的SphereFace(72.729%)相当。
- CCL在具有挑战性的CALFW数据集上表现优异(准确率74.5%),展现出强大的跨年龄泛化能力。
- 在MegaFace基准上,CCL位列顶尖方法之中,其top-10检索准确率表现强劲,尽管测试集规模庞大且存在身份重叠。
- CCL优于多个在更大规模数据集上训练的SOTA模型,如Coco Loss(LFW上准确率为76.57%),尽管仅使用了CASIA Webface中的46万张图像。
- 该方法在全部六个基准测试(LFW、CALFW、CACD、SLLFW、YTF和MegaFace)中均持续取得最先进或极具竞争力的结果。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。