QUICK REVIEW

[论文解读] Learning deep representations by mutual information estimation and maximization

R Devon Hjelm, Alex Fedorov|arXiv (Cornell University)|Aug 20, 2018

Adversarial Robustness in Machine Learning被引用 1,393

一句话总结

DIM 通过最大化输入与编码器输出之间的互信息来学习无监督表示，包含全局和局部互信息目标，以及对抗性先验匹配以塑造表示。

ABSTRACT

In this work, we perform unsupervised learning of representations by maximizing mutual information between an input and the output of a deep neural network encoder. Importantly, we show that structure matters: incorporating knowledge about locality of the input to the objective can greatly influence a representation's suitability for downstream tasks. We further control characteristics of the representation by matching to a prior distribution adversarially. Our method, which we call Deep InfoMax (DIM), outperforms a number of popular unsupervised learning methods and competes with fully-supervised learning on several classification tasks. DIM opens new avenues for unsupervised learning of representations and is an important step towards flexible formulations of representation-learning objectives for specific end-goals.

研究动机与目标

通过最大化输入与编码器输出之间的互信息，激发无监督表示学习。
证明利用局部输入结构（补丁级MI）得到的表示在分类上优于仅使用全局MI。
引入先验匹配，通过对抗学习将表示约束为期望的统计特性。
证明将全局/局部MI目标与先验匹配结合，在若干数据集上达到有竞争力甚至优于其他方法的结果。

提出的方法

使用DV/JSD/infoNCE风格的MI估计器（受MINE启发）来估计并最大化输入X与编码器输出Y之间的互信息。
可选地最大化Y与局部输入补丁C^{(i)}(X)之间的互信息，以强调局部结构（局部DIM）。
训练一个判别器使编码器输出分布U_{ψ,P}与先验V相匹配，以强制实现期望的统计特性（对抗先验匹配）。
将全局MI、局部MI与先验匹配结合到DIM目标中，使用可调权重α、β、γ，如联合目标(Eq.8)所示。
比较MI估计器(DV、JSD、infoNCE)并分析对负样本和结构选择的鲁棒性。
探索遮挡和坐标预测等增强手段，以进一步利用结构信息并提升分类性能。

实验结果

研究问题

RQ1在无监督的情况下，输入与编码器输出之间的互信息是否能产生有用的表示？
RQ2通过局部MI最大化强调局部结构是否能提升下游分类性能，相较于全局MI？
RQ3通过对抗匹配将编码器输出分布与先验对齐，是否能改善表示的独立性或解耦等性质？
RQ4不同的MI估计器(DV、JSD、infoNCE)如何影响学习稳定性和下游任务性能？
RQ5遮挡或坐标预测等增强对表示质量有何影响？

主要发现

具有局部MI的DIM(DIM(L))在若干数据集上显著超越其他无监督方法，并且在某些情形下可接近或超过全监督性能。
具有全局MI的DIM(DIM(G))与某些模型相竞争，但在较大规模分类任务上通常落后于DIM(L)和生成基线。
使用对抗性先验匹配约束表示，改善其统计属性并使其与期望先验对齐，如MI/NDM分析所示。
infoNCE通常能带来强劲的下游性能，并且对负样本数量可能比DV基方案更鲁棒，而在某些情形下JSD也具有竞争力。
遮挡与坐标预测增强进一步提升DIM的分类准确性，表明利用空间结构有利于表示质量。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。