QUICK REVIEW

[论文解读] Dataset Augmentation in Feature Space

Terrance DeVries, Graham W. Taylor|arXiv (Cornell University)|Feb 17, 2017

Domain Adaptation and Few-Shot Learning被引用 67

一句话总结

本文提出一种领域无关的数据增强方法，在一个由序列自编码器学习的特征空间中运作。在相邻上下文向量之间进行外推可以在多领域提升性能，包括语音、运动和图像。

ABSTRACT

Dataset augmentation, the practice of applying a wide array of domain-specific transformations to synthetically expand a training set, is a standard tool in supervised learning. While effective in tasks such as visual recognition, the set of transformations must be carefully designed, implemented, and tested for every new domain, limiting its re-use and generality. In this paper, we adopt a simpler, domain-agnostic approach to dataset augmentation. We start with existing data points and apply simple transformations such as adding noise, interpolating, or extrapolating between them. Our main insight is to perform the transformation not in input space, but in a learned feature space. A re-kindling of interest in unsupervised representation learning makes this technique timely and more effective. It is a simple proposal, but to-date one that has not been tested empirically. Working in the space of context vectors generated by sequence-to-sequence models, we demonstrate a technique that is effective for both static and sequential data.

研究动机与目标

推动一种领域无关的增强方法，避免手工设计的、特定领域的变换。
利用无监督表示学习创建一个特征空间，在该空间中简单的变换能够产生真实感的合成数据。
在多样化数据集上评估外推、内插和基于噪声的增强。
证明特征空间增强在若干任务上可以接近或超越最新技术的结果。

提出的方法

训练一个序列自编码器（两层堆叠的 LSTM）从未标记数据中学习上下文向量特征空间。
通过在解码或输入分类器之前对上下文向量进行变换（噪声、内插、外推）来增强数据。
在每个时间步将上下文向量作为解码器的条件，以获得更好的重构。
对于每个样本，在特征空间中找到K个最近的同类邻居，并通过内插或外推生成合成样本。
在训练序列分类器时使用解码后的上下文向量来重构序列，或直接将它们作为静态分类器的特征。
在时间序列和图像领域对增强进行评估，包括 MNIST、CIFAR-10、AUSLAN、阿拉伯数字、UCF Kinect 和 UJI Pen Characters。

实验结果

研究问题

RQ1在多样化领域中，特征空间的增强是否能提升监督学习的性能？
RQ2在特征空间中，噪声、插值和外推中，哪些变换对提升泛化能力最有效？
RQ3特征空间中的外推是否能提供超出传统输入空间增强的好处，并且是否与领域特定技术互补？

主要发现

在上下文向量之间进行外推显著提高了若干数据集的性能（例如阿拉伯数字：基线误差 1.36% 通过最近邻外推降至 0.74%）。
随机噪声在某些任务上可以略微提高性能，但内插通常会在未仔细定位时损害结果。
邻居之间的内插往往产生更平滑的过渡，而外推增加了变异性，通常在复杂决策边界上提升准确度。
在 MNIST 上，特征空间外推将错误率降至 0.95%（基线 1.093%），在某些设定中还优于输入空间仿射变换。
在 CIFAR-10 上，特征空间外推将错误率降至 29.24%（基线 30.65%），表明与输入空间增强结合时获得互补提升。
在 AUSLAN 和 UCF Kinect 的测试中，特征空间外推显著改善了基线，有时接近或超过领域特定结果。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。