Skip to main content
QUICK REVIEW

[论文解读] Set Transformer: A Framework for Attention-based Permutation-Invariant Neural Networks

Juho Lee, Yoonho Lee|arXiv (Cornell University)|Oct 1, 2018
Image Retrieval and Classification Techniques被引用 408
一句话总结

本文介绍了 Set Transformer,一种基于注意力的架构,用于置换不变的集合输入,包含 SAB、ISAB 和 PMA 模块,并证明了其普遍性,同时在多种集合任务上展示出强大的经验结果。

ABSTRACT

Many machine learning tasks such as multiple instance learning, 3D shape recognition, and few-shot image classification are defined on sets of instances. Since solutions to such problems do not depend on the order of elements of the set, models used to address them should be permutation invariant. We present an attention-based neural network module, the Set Transformer, specifically designed to model interactions among elements in the input set. The model consists of an encoder and a decoder, both of which rely on attention mechanisms. In an effort to reduce computational complexity, we introduce an attention scheme inspired by inducing point methods from sparse Gaussian process literature. It reduces the computation time of self-attention from quadratic to linear in the number of elements in the set. We show that our model is theoretically attractive and we evaluate it on a range of tasks, demonstrating the state-of-the-art performance compared to recent methods for set-structured data.

研究动机与目标

  • 激发在大小可变且顺序无关的集合上的学习。
  • 开发基于注意力机制的置换不变架构。
  • 确立所提 Set Transformer(包含 SAB、ISAB、PMA 模块)的通用性。
  • 在合成和真实世界集合任务上展示经验有效性。

提出的方法

  • 定义并使用基于自注意力的模块(SAB)来建模集合内交互。
  • 使用 ISAB,通过诱导点来近似交互以实现可扩展性。
  • 应用 PMA 通过聚合得到置换不变的集合表示。
  • 证明 Set Transformer 作为一个置换不变的函数逼近器的通用性。
  • 为各种任务提供实用的体系结构描述和训练细节。

实验结果

研究问题

  • RQ1基于注意力的组件(SAB、ISAB、PMA)能否为集合产生置换不变的表示?
  • RQ2Set Transformer 架构是否是置换不变函数的通用函数逼近器?
  • RQ3Set Transformer 的变体在需要集合级推理的任务上的表现如何(最大值、计数、聚类、异常检测和点云分类)?

主要发现

  • Set Transformer 在置换不变函数空间中是一个通用函数逼近器。
  • SAB 与 PMA 使集合内部的置换不变聚合和交互建模成为可能。
  • 带有诱导点的 ISAB 将基于注意力的集合处理扩展到更大规模的集合。
  • 在各任务(最大回归、唯一字符计数、高斯混合、异常检测和 ModelNet40)中,Set Transformer 的变体优于若干基线,使用 SAB+PMA 配置时尤其显著提升。
  • 在大规模数据和 CIFAR-100 的元聚类上的实验展示了可扩展性和强大的经验表现。
  • 运行时分析表明 SAB/ISAB 模块在 GPU 上具有可扩展的性能特征。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。