[论文解读] Loss Function Search for Face Recognition
本文提出一种基于奖励的搜索方法,通过识别降低Softmax概率可增强特征判别性,从而学习最优的基于边距的Softmax损失函数。作者提出一种统一的公式化方法,简化了搜索空间,实现了高效优化,在MegaFace和Trillion-Pairs等多个基准测试中,性能优于手工设计的损失函数及AutoML方法(如AM-LFS)。
In face recognition, designing margin-based (e.g., angular, additive, additive angular margins) softmax loss functions plays an important role in learning discriminative features. However, these hand-crafted heuristic methods are sub-optimal because they require much effort to explore the large design space. Recently, an AutoML for loss function search method AM-LFS has been derived, which leverages reinforcement learning to search loss functions during the training process. But its search space is complex and unstable that hindering its superiority. In this paper, we first analyze that the key to enhance the feature discrimination is actually extbf{how to reduce the softmax probability}. We then design a unified formulation for the current margin-based softmax losses. Accordingly, we define a novel search space and develop a reward-guided search method to automatically obtain the best candidate. Experimental results on a variety of face recognition benchmarks have demonstrated the effectiveness of our method over the state-of-the-art alternatives.
研究动机与目标
- 识别基于边距的Softmax损失在人脸识别中取得成功的核心原理,重点关注降低Softmax概率。
- 解决手工设计的启发式损失函数的局限性,这些损失函数需要专家调参,且由于设计空间庞大且不稳定,导致性能次优。
- 通过设计更简单、更有效的搜索空间,克服现有AutoML方法(如AM-LFS)的不稳定性与复杂性。
- 开发一种基于奖励的搜索框架,在训练过程中动态优化损失函数参数,以增强特征判别性。
- 在多样且具有挑战性的人脸识别基准上验证所提方法,包括衡量种族偏见和超大规模识别的基准。
提出的方法
- 提出一种统一的数学公式化方法,将所有基于边距的Softmax损失归约为一个控制Softmax概率的单一参数。
- 定义一种新颖且简化的搜索空间,聚焦于调整边距参数以控制Softmax概率,确保强特征判别性。
- 引入随机搜索基线和一种基于奖励的搜索策略,利用验证性能作为奖励信号,引导损失函数采样。
- 开发一种高效的优化框架,基于每个训练周期的奖励反馈,动态更新损失函数候选者的分布。
- 采用可微分的搜索机制,支持端到端训练并实现损失函数的自动适应,避免手动超参数调优。
- 使用交叉熵损失与学习到的、动态采样的边距参数,训练深度人脸识别模型,提升类内紧凑性和类间可分性。
实验结果
研究问题
- RQ1基于边距的Softmax损失为何能提升人脸识别性能的根本机制是什么?
- RQ2如何简化损失函数搜索的设计空间,以相比现有AutoML方法提升稳定性和有效性?
- RQ3一种显式最小化Softmax概率的基于奖励的搜索策略,能否优于手工设计和基于AutoML的损失函数?
- RQ4所提方法在多样化的面部识别基准上(包括极端类别不平衡或种族偏见的情况)的泛化能力如何?
- RQ5降低Softmax概率是否能在不同训练数据分布下,带来更鲁棒和更具判别性的特征学习?
主要发现
- 提升人脸识别中特征判别性的关键在于降低Softmax概率,而不仅仅是增加边距。
- 所提出的Search-Softmax损失在MegaFace上使用CASIA-WebFace-R数据集时,达到96.97%的Rank-1准确率,优于AM-Softmax(96.77%)和AM-LFS(92.51%)。
- 在Trillion-Pairs基准上,Search-Softmax在验证任务中实现70.41%的TPR@FAR=1e-6,相较于在CASIA-WebFace-R上训练的基线Softmax损失提升4%。
- 该方法在所有RFW子集(高加索人、印度人、亚洲人、非洲人)中均持续优于所有基线模型,包括手工设计损失和AM-LFS,展现出对种族偏见的鲁棒性。
- 基于奖励的搜索策略显著优于随机搜索,Search-Softmax在Trillion-Pairs上实现68.67%的TPR@FAR=1e-6,而Random-Softmax为68.03%。
- 所提方法展现出强大的泛化能力,在识别和验证任务中均达到SOTA性能,尤其在极低误报率下表现优异。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。