Skip to main content
QUICK REVIEW

[论文解读] Learning deep representations by mutual information estimation and maximization

R Devon Hjelm, Alex Fedorov|arXiv (Cornell University)|Aug 20, 2018
Adversarial Robustness in Machine Learning被引用 1,393
一句话总结

DIM 通过最大化输入与编码器输出之间的互信息来学习无监督表示,包含全局和局部互信息目标,以及对抗性先验匹配以塑造表示。

ABSTRACT

In this work, we perform unsupervised learning of representations by maximizing mutual information between an input and the output of a deep neural network encoder. Importantly, we show that structure matters: incorporating knowledge about locality of the input to the objective can greatly influence a representation's suitability for downstream tasks. We further control characteristics of the representation by matching to a prior distribution adversarially. Our method, which we call Deep InfoMax (DIM), outperforms a number of popular unsupervised learning methods and competes with fully-supervised learning on several classification tasks. DIM opens new avenues for unsupervised learning of representations and is an important step towards flexible formulations of representation-learning objectives for specific end-goals.

研究动机与目标

  • 通过最大化输入与编码器输出之间的互信息,激发无监督表示学习。
  • 证明利用局部输入结构(补丁级MI)得到的表示在分类上优于仅使用全局MI。
  • 引入先验匹配,通过对抗学习将表示约束为期望的统计特性。
  • 证明将全局/局部MI目标与先验匹配结合,在若干数据集上达到有竞争力甚至优于其他方法的结果。

提出的方法

  • 使用DV/JSD/infoNCE风格的MI估计器(受MINE启发)来估计并最大化输入X与编码器输出Y之间的互信息。
  • 可选地最大化Y与局部输入补丁C^{(i)}(X)之间的互信息,以强调局部结构(局部DIM)。
  • 训练一个判别器使编码器输出分布U_{ψ,P}与先验V相匹配,以强制实现期望的统计特性(对抗先验匹配)。
  • 将全局MI、局部MI与先验匹配结合到DIM目标中,使用可调权重α、β、γ,如联合目标(Eq.8)所示。
  • 比较MI估计器(DV、JSD、infoNCE)并分析对负样本和结构选择的鲁棒性。
  • 探索遮挡和坐标预测等增强手段,以进一步利用结构信息并提升分类性能。

实验结果

研究问题

  • RQ1在无监督的情况下,输入与编码器输出之间的互信息是否能产生有用的表示?
  • RQ2通过局部MI最大化强调局部结构是否能提升下游分类性能,相较于全局MI?
  • RQ3通过对抗匹配将编码器输出分布与先验对齐,是否能改善表示的独立性或解耦等性质?
  • RQ4不同的MI估计器(DV、JSD、infoNCE)如何影响学习稳定性和下游任务性能?
  • RQ5遮挡或坐标预测等增强对表示质量有何影响?

主要发现

  • 具有局部MI的DIM(DIM(L))在若干数据集上显著超越其他无监督方法,并且在某些情形下可接近或超过全监督性能。
  • 具有全局MI的DIM(DIM(G))与某些模型相竞争,但在较大规模分类任务上通常落后于DIM(L)和生成基线。
  • 使用对抗性先验匹配约束表示,改善其统计属性并使其与期望先验对齐,如MI/NDM分析所示。
  • infoNCE通常能带来强劲的下游性能,并且对负样本数量可能比DV基方案更鲁棒,而在某些情形下JSD也具有竞争力。
  • 遮挡与坐标预测增强进一步提升DIM的分类准确性,表明利用空间结构有利于表示质量。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。