QUICK REVIEW

[论文解读] Meta-Dataset: A Dataset of Datasets for Learning to Learn from Few Examples

Eleni Triantafillou, Tyler Zhu|arXiv (Cornell University)|Mar 7, 2019

Domain Adaptation and Few-Shot Learning参考文献 30被引用 282

一句话总结

介绍 Meta-Dataset，这是一个大规模、覆盖多种任务的少样本学习基准，跨越 10 个数据集，具有多样的任务和评估协议，并引入一种新型元学习模型（Proto-MAML），以更好地对新数据集进行泛化。

ABSTRACT

Few-shot classification refers to learning a classifier for new classes given only a few examples. While a plethora of models have emerged to tackle it, we find the procedure and datasets that are used to assess their progress lacking. To address this limitation, we propose Meta-Dataset: a new benchmark for training and evaluating models that is large-scale, consists of diverse datasets, and presents more realistic tasks. We experiment with popular baselines and meta-learners on Meta-Dataset, along with a competitive method that we propose. We analyze performance as a function of various characteristics of test tasks and examine the models' ability to leverage diverse training sources for improving their generalization. We also propose a new set of baselines for quantifying the benefit of meta-learning in Meta-Dataset. Our extensive experimentation has uncovered important research challenges and we hope to inspire work in these directions.

研究动机与目标

推动建立一个比 Omniglot 和 mini-ImageNet 更真实、多样化的少样本学习基准的需求。
提供一个大规模、多数据集的环境，以在异构数据和不同 episode 结构上评估元学习算法。
评估流行的元学习模型与基线，并分析训练数据来源、预训练和元学习对跨数据集泛化的影响。
提出一种新的元学习器（Proto-MAML），将原型网络与 MAML 风格的适应相结合，以提升在 Meta-Dataset 上的表现。

提出的方法

通过聚合 10 个多样数据集（ImageNet、Omniglot、Aircraft、CUB、Describable Textures、Quick Draw、Fungi、VGG Flowers、Traffic Signs、MSCOCO）来定义一个新的少样本学习基准。
设计一个分层、数据集感知的 episode 采样程序，改变方式数（类别数）和样本数，并纳入类别结构（ImageNet/Omniglot 的层次结构）。
将非 episodic 基线（k-NN、Finetune、cosine classifier 变体）与 episodic 元学习器（Matching Networks、Relation Networks、Prototypical Networks、MAML、Proto-MAML）进行比较。
引入 Proto-MAML，一种元学习器从 Prototypical Network 原型初始化一个与 episode 相关的线性分类器，然后允许对嵌入进行梯度自适应。
探索预训练（ImageNet vs 全数据集）、元训练影响，以及仅推理基线，以量化在异构数据上的元学习带来的收益。
提供可重复的评估协议和 Meta-Dataset 的开源代码。

实验结果

研究问题

RQ1一个多数据集、异质 episode 设计是否能提升元学习器对未见数据集与任务的泛化能力？
RQ2不同的训练来源（仅 ImageNet vs 全数据集）和预训练对跨数据集泛化有何影响？
RQ3在多样数据集上的元学习是否始终有益，还是其优势取决于数据来源和任务配置？
RQ4像 Proto-MAML 这样的混合元学习器是否能在一个大型、多样化的基准上超越标准的元学习器？
RQ5在面对现实的类别不平衡和可变的 shot/way 设置时，当前元学习方法的局限性在哪里？

主要发现

Meta-Dataset 提供了一个具有挑战性且多样的基准，显示性能在数据集和任务配置之间差异显著。
在 ImageNet 上的预训练通常有助于自然图像数据集，但可能会损害与 Omniglot、Quick Draw 等更远的数据集的性能。
在所有数据集上进行训练可以提升某些数据集的性能（如 Omniglot、Quick Draw、Aircraft），但并不能对所有目标数据集普遍提升。
在仅推理与完全元训练基线的评估中，元学习的收益并不一致，特别是在异构数据下；天真的跨数据集训练并不自动带来更好的泛化。
Proto-MAML 通常在各数据集上取得最佳平均排名，Prototypical Networks 表现强劲，Finetune 作为有竞争力的基线。
元学习的价值取决于数据异质性、初始化以及所选的 episode 生成策略，指明未来研究方向。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。