[论文解读] Virtual Class Enhanced Discriminative Embedding Learning
本文提出Virtual Softmax,一种简单而有效的方法,通过在Softmax损失中注入一个动态的虚拟负类,增强判别性特征学习,从而增大类间角度边界并增强类内紧凑性。该方法在无需人工设计超参数或复杂架构的前提下,在多个物体分类和人脸识别基准上实现了最先进或具有竞争力的性能。
Recently, learning discriminative features to improve the recognition performances gradually becomes the primary goal of deep learning, and numerous remarkable works have emerged. In this paper, we propose a novel yet extremely simple method extbf{Virtual Softmax} to enhance the discriminative property of learned features by injecting a dynamic virtual negative class into the original softmax. Injecting virtual class aims to enlarge inter-class margin and compress intra-class distribution by strengthening the decision boundary constraint. Although it seems weird to optimize with this additional virtual class, we show that our method derives from an intuitive and clear motivation, and it indeed encourages the features to be more compact and separable. This paper empirically and experimentally demonstrates the superiority of Virtual Softmax, improving the performances on a variety of object classification and face verification tasks.
研究动机与目标
- 为解决标准Softmax在深度学习中仅生成可分特征而非判别性特征的局限性。
- 开发一种自动的、无需超参数的替代方法,以替代需要手动退火的基于边距的方法(如L-Softmax和A-Softmax)。
- 通过引入一个虚拟负类,施加更强的决策边界约束,从而提升特征紧凑性和类间可分性。
- 在细粒度分类和人脸识别等多种识别任务中,证明该方法的有效性。
- 提供一种简单、即插即用的Softmax替代方案,增强表征能力,且不增加计算成本。
提出的方法
- Virtual Softmax通过引入一个不参与最终分类但影响训练过程中特征学习的动态虚拟类,推广了标准Softmax。
- 该虚拟类用于强制实现真类与虚拟类之间角度边距的零极限约束,从而促进更大的类间角度边界。
- 该方法修改交叉熵损失以包含虚拟类,从而在不改变模型架构的前提下,有效增强决策边界约束。
- 虚拟类在训练过程中根据当前特征分布动态更新,确保自适应性并避免人工调参。
- 该方法在角度特征空间中具有坚实的数学基础,其中虚拟类作为边界正则化器,提升特征紧凑性和可分性。
- 该方法可兼容任意深度神经网络,并可轻松作为损失函数替换集成到现有训练流程中。
实验结果
研究问题
- RQ1在Softmax损失中注入一个动态虚拟负类,是否能显著提升学习特征的判别能力?
- RQ2Virtual Softmax在特征紧凑性和可分性方面,是否优于标准Softmax以及L-Softmax和A-Softmax等基于边距的方法?
- RQ3该方法是否能在无需任务特定超参数调优的情况下,在多样化识别任务中实现最先进性能?
- RQ4虚拟类注入如何影响嵌入空间中特征的角度分布?
- RQ5在高类别数场景下(如包含67,000个身份的大规模人脸识别),Virtual Softmax是否依然有效?
主要发现
- 在CIFAR-10上,Virtual Softmax的测试错误率为6.68%,优于基线Softmax(7.15%)以及LS*(6.77%)和AS*(6.83%)等先前方法。
- 在CIFAR-100上,Virtual Softmax将错误率降低至24.01%,优于基线Softmax(25.52%)以及所有对比方法,包括LS*(24.32%)和AS*(24.11%)。
- 在CUB200细粒度分类任务中,Virtual Softmax使用V2模型达到81.1%的准确率,优于基线Softmax(77.2%)以及所有先前方法,包括LS*(80.5%)和AS*(80.2%)。
- 在LFW上,Virtual Softmax将验证准确率提升至99.46%,超过基线Softmax(99.10%),并优于NS*(99.16%)和LS*(99.37%)。
- 在SLLFW上,Virtual Softmax达到95.85%的准确率,显著优于基线Softmax(94.59%)以及所有对比方法,包括与NormFace结合时的AS*(96.45%)。
- 在ImageNet32上,Virtual Softmax实现了最高的Top-1准确率48.84%和Top-5准确率74.06%,优于所有基线和先前方法。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。