Skip to main content
QUICK REVIEW

[论文解读] Semi-Supervised Few-Shot Learning with Local and Global Consistency

Ahmed Ayyad, Nassir Navab|arXiv (Cornell University)|Mar 6, 2019
Domain Adaptation and Few-Shot Learning被引用 13
一句话总结

本文提出一致原型网络(CPN),一种半监督少样本学习方法,通过新颖的损失项在未标记数据上强制实施局部和全局一致性,从而提升少样本分类性能。CPN在mini-ImageNet 5-shot设置下达到70.1%的准确率,性能达到当前最先进水平,即使仅使用40%的标签,也优于完全监督的原型网络。

ABSTRACT

Learning from a few examples is a key characteristic of human intelligence that AI researchers have been excited about modeling. With the web-scale data being mostly unlabeled, few recent works showed that few-shot learning performance can be significantly improved with access to unlabeled data, known as semi-supervised few shot learning (SS-FSL). We introduce a SS-FSL approach that we denote as Consistent Prototypical Networks (CPN), which builds on top of Prototypical Networks. We propose new loss terms to leverage unlabelled data, by enforcing notions of local and global consistency. Our work shows the effectiveness of our consistency losses in semi-supervised few shot setting. Our model outperforms the state-of-the-art in most benchmarks, showing large improvements in some cases. For example, in one mini-Imagenet 5-shot classification task, we obtain 70.1% accuracy to the 64.59% state-of-the-art. Moreover, our semi-supervised model, trained with 40% of the labels, compares well against the vanilla prototypical network trained on 100% of the labels, even outperforming it in the 1-shot mini-Imagenet case with 51.03% to 49.4% accuracy. For reproducibility, we make our code publicly available.

研究动机与目标

  • 通过在半监督设置下利用大规模未标记数据,提升少样本学习性能。
  • 通过有效整合未标记样本,解决少样本学习中标签数据有限的挑战。
  • 开发一种方法,在嵌入空间中同时保持局部邻域和全局特征分布的一致性。
  • 在显著减少标签样本数量的前提下,实现与完全监督模型相当或更优的性能。
  • 通过公开发布代码,确保方法的可复现性。

提出的方法

  • 通过引入新的损失项扩展原型网络,以利用未标记数据。
  • 提出一种局部一致性损失,鼓励嵌入空间中邻近样本的特征相似。
  • 实现一种全局一致性损失,促使模型预测与特征整体分布对齐。
  • 使用元学习框架优化联合损失,以适应少样本任务。
  • 采用基于原型的分类头,其中类别原型基于标记和未标记数据联合更新。
  • 应用一致性正则化,以提升低样本场景下的泛化能力。

实验结果

研究问题

  • RQ1在未标记数据上强制实施局部和全局一致性是否能提升少样本分类性能?
  • RQ2仅使用40%的标签相比完全监督,性能能提升多少?
  • RQ3在低样本设置下,采用一致性损失的半监督学习是否优于完全监督的原型网络?
  • RQ4一致性正则化是否能稳定并提升在标签数据有限的少样本学习中的泛化能力?
  • RQ5所提出方法在多个基准上的表现与当前最先进方法相比如何?

主要发现

  • CPN在mini-ImageNet 5-shot分类基准上达到70.1%的准确率,超越此前最先进方法的64.59%。
  • 仅使用40%的标签时,CPN在1-shot设置下准确率达到51.03%,优于完全监督原型网络基线的49.4%。
  • 由于有效利用了未标记数据,模型在低样本场景下,特别是5-shot设置下,表现出显著性能提升。
  • 局部与全局一致性损失的结合,产生了更鲁棒且更具泛化能力的特征表示。
  • 该方法在多个基准上均表现优异,表明其具有广泛的适用性。
  • 代码已公开发布,支持可复现性并促进后续研究。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。