Skip to main content
QUICK REVIEW

[论文解读] Leveraging the Feature Distribution in Transfer-based Few-Shot Learning

Yuqing Hu, Vincent Gripon|arXiv (Cornell University)|Jun 6, 2020
Domain Adaptation and Few-Shot Learning参考文献 43被引用 32
一句话总结

本论文提出一种两阶段的基于迁移的少样本学习方法: (1) 对骨干特征应用幂变换以获得近似高斯分布;(2) 应用基于 MAP/Sinkhorn 的最优传输算法(跨步推断)来细化类中心,在多个数据集和骨干网络上实现最先进的结果。

ABSTRACT

Few-shot classification is a challenging problem due to the uncertainty caused by using few labelled samples. In the past few years, many methods have been proposed to solve few-shot classification, among which transfer-based methods have proved to achieve the best performance. Following this vein, in this paper we propose a novel transfer-based method that builds on two successive steps: 1) preprocessing the feature vectors so that they become closer to Gaussian-like distributions, and 2) leveraging this preprocessing using an optimal-transport inspired algorithm (in the case of transductive settings). Using standardized vision benchmarks, we prove the ability of the proposed methodology to achieve state-of-the-art accuracy with various datasets, backbone architectures and few-shot settings.

研究动机与目标

  • 在少样本任务中,证明使用特征分布预处理以使骨干特征与高斯样本分布假设对齐的合理性。
  • 提出一种类似 MAP 的迭代算法,利用 Sinkhorn 传输进行跨步推断的类中心估计。
  • 在多样化数据集和多种骨干网络上展示出色的准确性,且超参量较少。

提出的方法

  • 对骨干特征应用幂变换以降低偏斜并归一化方差(PT),随后进行单位方差投影。
  • 假设类别分布接近高斯分布,并通过迭代的基于 Sinkhorn 的最优传输执行类别中心的 MAP 估计。
  • 使用一个带熵正则化的软分配矩阵 M* 将未标记的查询特征映射到类别中心,并用惯性参数更新中心。
  • 在归纳设置中,预处理后使用最近均值分类;在传导设置中,对合并后的未标记集合应用 MAP/Sinkhorn 过程。
  • 在各数据集上调整少量超参数(β 用于偏斜、λ 用于 Sinkhorn 正则化、α 用于中心更新),在若干迭代(n_steps)后报告结果。

实验结果

研究问题

  • RQ1将特征预处理为高斯样分布是否能够提升基于迁移的少样本学习?
  • RQ2在传导少样本设置中,基于 MAP+Sinkhorn 传输分配是否能改善未标记查询样本的标注?
  • RQ3骨干网络选择和超参数如何影响在标准基准上的性能?
  • RQ4在传导设置中,样本数量对准确率的实际影响如何?
  • RQ5所提方法对类别不平衡和跨域情景是否鲁棒?

主要发现

  • 所提出的 PT+MAP 方法在多个基准(miniImageNet、tieredImageNet、CUB、CIFAR-FS)以及若干骨干网络上达到最先进的准确率。
  • 幂变换(PT)显著将特征分布塑形为接近高斯形状,帮助后续分类。
  • MAP with Sinkhorn-based allocation improves center estimation and label assignment in transductive settings, outperforming baselines and showing notable gains over inductive variants.
  • 该方法在不同的 s(样本数)和 q(未标记样本)下均表现出色,并在跨域评估中保持竞争力。
  • 超参数敏感性有限;峰值性能在验证集和新类上对齐,表明在不同数据集上具有鲁棒性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。