Skip to main content
QUICK REVIEW

[论文解读] Flows for simultaneous manifold learning and density estimation

Johann Brehmer, K. Cranmer|arXiv (Cornell University)|Mar 31, 2020
Computational Physics and Python Applications参考文献 20被引用 33
一句话总结

引入了学习流形的流(M-flows),它们学习数据流形及其上的可处理密度,将流形学习与密度估计分离,以实现更好的推断与降噪。

ABSTRACT

We introduce manifold-learning flows (M-flows), a new class of generative models that simultaneously learn the data manifold as well as a tractable probability density on that manifold. Combining aspects of normalizing flows, GANs, autoencoders, and energy-based models, they have the potential to represent datasets with a manifold structure more faithfully and provide handles on dimensionality reduction, denoising, and out-of-distribution detection. We argue why such models should not be trained by maximum likelihood alone and present a new training algorithm that separates manifold and density updates. In a range of experiments we demonstrate how M-flows learn the data manifold and allow for better inference than standard flows in the ambient data space.

研究动机与目标

  • 说明需要具备可处理密度的流形结构的模型。
  • 提出一个框架,在学习数据流形的同时在流形上维持密度。
  • 解决仅靠最大似然难以学习正确流形的训练挑战。
  • 提供一种包含独立的流形更新与密度更新的训练策略,以稳定学习。
  • 证明 M-flows 相较于 ambient-flow 基线在流形学习和推断方面的提升。

提出的方法

  • 定义一个可同胚映射 f: U x V -> X,其中流形是层级集 g(u)=f(u,0)。
  • 用一个变换 h 对流形坐标 u 进行建模,并通过基密度 p_u。
  • 通过 p_u 和 g 的雅可比行列式(或等价地 h 的雅可比行列式)计算流形密度 p_M(x)。
  • 通过从基分布抽取 û 并应用 g 获得在学习到的流形上的 x。
  • 提供一个编码器/解码器对,将任意 x 投影到流形上并给出重构误差。
  • 提供具有单独编码器的变体(M-flow with encoder),并讨论潜在轴与流形的对齐。

实验结果

研究问题

  • RQ1学得的流形能否与仅限于该流形的可处理密度配对?
  • RQ2将流形更新与密度更新分离是否能提升学习稳定性和下游推断?
  • RQ3如何评估在流形上和流形外的点的投影、重构和密度?
  • RQ4哪些训练策略最能促进正确的流形形状,同时保持其上的密度准确?
  • RQ5在实验中,M-flows 与 ambient flows 及其他面向流形的模型相比如何?

主要发现

  • M-flows 共同学习一个低维流形及在该流形上定义的可处理密度。
  • 该模型提供将任意数据投影到学习到的流形上的投影、重构误差,以及投影后的流形密度。
  • 朴素的最大似然训练可能误导流形学习,因此需要对流形结构和密度进行分离更新。
  • 在高斯-on-circle、多项式曲面、Lorenz 吸引子、粒子物理、StyleGAN 流形以及真实图像上的实验结果显示相较于 ambient flows,流形感知推断有改进。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。