Skip to main content
QUICK REVIEW

[论文解读] Large Margin Few-Shot Learning

Yong Wang, Xiao-Ming Wu|arXiv (Cornell University)|Jul 8, 2018
Domain Adaptation and Few-Shot Learning参考文献 26被引用 23
一句话总结

本文提出了一种大边缘原则,通过将三元组损失整合到分类损失中,以增强基于度量的 few-shot 学习,显著提升了泛化能力,且计算成本极低。在原型网络和图神经网络上的实验表明,在 5 类 few-shot 基准上性能一致提升,证明了大边缘约束在减少过拟合和增强判别能力方面的有效性。

ABSTRACT

The key issue of few-shot learning is learning to generalize. This paper proposes a large margin principle to improve the generalization capacity of metric based methods for few-shot learning. To realize it, we develop a unified framework to learn a more discriminative metric space by augmenting the classification loss function with a large margin distance loss function for training. Extensive experiments on two state-of-the-art few-shot learning methods, graph neural networks and prototypical networks, show that our method can improve the performance of existing models substantially with very little computational overhead, demonstrating the effectiveness of the large margin principle and the potential of our method.

研究动机与目标

  • 为解决因标注数据有限而导致 few-shot 学习中过拟合的问题。
  • 通过在嵌入空间中施加大边缘约束,提升基于度量的 few-shot 学习模型的泛化能力。
  • 开发一种统一、高效且鲁棒的框架,适用于多种度量学习方法。
  • 通过在最先进模型(如原型网络和图神经网络)上进行广泛实验,验证大边缘约束的有效性。

提出的方法

  • 在标准分类损失基础上增加三元组损失,以在度量空间中强制不同类别之间的大边缘分离。
  • 采用未归一化的三元组损失以提升稳定性和更广的适用性,尤其适用于原型网络等非参数分类器。
  • 将大边缘损失无缝集成到现有度量学习框架中,不改变其核心架构。
  • 测试并比较多种基于边缘的损失函数,包括归一化三元组损失、cosface 和 arcface,以评估其鲁棒性和性能。
  • 将统一框架应用于原型网络和图神经网络,在 Mini-ImageNet 和 Omniglot 数据集上进行训练。
  • 使用边缘超参数 m 和缩放因子 s,其中 s=10,m=0.2 或 0.1 以获得最佳性能。

实验结果

研究问题

  • RQ1在类别嵌入之间施加大边缘约束是否能提升 few-shot 学习中的泛化能力?
  • RQ2所提出的大型边缘框架与 cosface 和 arcface 等现有损失函数相比,在稳定性和性能方面表现如何?
  • RQ3统一的大边缘框架能否有效应用于参数化和非参数化的度量学习模型?
  • RQ4在包含大边缘损失的情况下,是否能在不同 few-shot 学习基准上实现一致的性能提升?

主要发现

  • 所提出的大型边缘框架在原型网络和图神经网络上均显著提升了在 Mini-ImageNet 和 Omniglot 数据集上的性能。
  • 在 Mini-ImageNet 上进行 5 类 1 次学习时,cosface 损失达到 51.04% 的准确率,m=0.2 时达到 51.49%,优于基线 GNN(50.33%)。
  • 未归一化的三元组损失始终优于归一化变体,且更具鲁棒性,未观察到训练失败,而 arcface 在大多数情况下均无法收敛。
  • cosface 损失在 5 类 5 次学习中达到 67.04% 的准确率,略高于基线 GNN(66.41%),证实了边缘约束的有益影响。
  • arcface 损失对边缘超参数 m 高度敏感,大多数 m 值下均出现训练失败,表明在 few-shot 设置下存在不稳定性。
  • 该框架引入的计算开销极小,且可轻松适配现有度量学习模型,展现出广泛的实用潜力。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。