Skip to main content
QUICK REVIEW

[论文解读] Unsupervised Feature Learning by Cross-Level Discrimination between Instances and Groups

Xudong Wang, Ziwei Liu|arXiv (Cornell University)|Aug 9, 2020
Machine Learning and Data Classification参考文献 43被引用 14
一句话总结

本文提出在实例与组之间进行跨层级判别,以稳定现实世界数据中实例相关性高且类别长尾分布情况下的无监督特征学习。通过同时利用实例间的局部吸引和对共同实例组的远程排斥,并在独立的特征分支上解耦分组与判别任务,该方法在自监督和半监督基准上实现了最先进性能,克服了训练不稳定和退化问题。

ABSTRACT

Unsupervised feature learning has made great strides with invariant mapping and instance-level discrimination, as benchmarked by classification on common datasets. However, these datasets are curated to be distinctive and class-balanced, whereas naturally collected data could be highly correlated within the class (with repeats at the extreme) and long-tail distributed across classes. The natural grouping of instances conflicts with the fundamental assumption of instance-level discrimination. Contrastive feature learning is thus unstable without grouping, whereas grouping without contrastive feature learning is easily trapped into degeneracy. We propose to integrate grouping into instance-level discrimination, not by imposing group-level discrimination, but by imposing cross-level discrimination between instances and groups. Our key insight is that grouping results from not just attraction, but also repulsion. While invariant mapping is achieved by local attraction between augmented instances, instance similarity emerges from long-range repulsion against common instance groups. To further avoid the clash between grouping and discrimination objectives, we also impose them on separate features derived from the common feature. Our extensive experimentation demonstrates not only significant gain on datasets with high correlation and long-tail distributions, but also leading performance on multiple self-supervision and semi-supervision benchmarks, bringing unsupervised feature learning closer to real data applications.

研究动机与目标

  • 解决在实例相关性高且类别长尾分布的现实世界数据中对比学习特征表示的不稳定性问题。
  • 解决无监督表示学习中分组目标与实例级判别之间的冲突问题。
  • 通过解耦分组与判别目标,防止基于分组方法的退化问题。
  • 提升在偏离理想化、类别平衡基准数据集的无监督特征学习泛化能力。
  • 在不显式施加组级判别条件下,将组级结构整合到实例级判别中。

提出的方法

  • 引入跨层级判别,结合增强实例间的局部吸引与对共同实例组的远程排斥。
  • 将特征空间解耦为独立的分支用于分组与判别,以避免目标冲突。
  • 使用不变映射以鼓励数据增强下局部特征的一致性。
  • 通过共享组表示的排斥来建模实例相似性,促进组间的区分性。
  • 在判别分支上应用对比学习,同时在分组分支上通过聚类实现分组。
  • 利用共享主干网络提取的特征,但在独立的特征流上分别应用分组与判别目标。

实验结果

研究问题

  • RQ1如何在实例相关性高且类别长尾分布的数据中稳定无监督特征学习?
  • RQ2实例与组之间的排斥在超越局部吸引的基础上,对提升特征判别性有何作用?
  • RQ3解耦分组与判别目标是否能有效防止自监督表示学习中的退化?
  • RQ4在现实世界数据中,跨层级判别与标准实例级或组级对比学习相比表现如何?
  • RQ5所提出方法在自监督和半监督基准上的泛化能力达到何种程度?

主要发现

  • 所提方法在实例相关性高且类别长尾分布的数据集上实现了显著的性能提升。
  • 在多个自监督基准上,其性能优于标准实例级对比学习和组级方法。
  • 在半监督学习基准上表现领先,表明其具备强大的泛化能力。
  • 解耦分组与判别目标能有效防止退化并提升训练稳定性。
  • 引入对共同组的远程排斥,显著增强了特征的可判别性,超越了局部不变性。
  • 该方法在偏离理想化、平衡数据集的现实世界数据分布上表现出良好的泛化能力。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。