Skip to main content
QUICK REVIEW

[论文解读] Riemannian Neural Optimal Transport

Alessio Micheli, Yueqi Cao|arXiv (Cornell University)|Feb 3, 2026
3D Shape Modeling and Analysis被引用 0
一句话总结

介绍了 Riemannian Neural OT (RNOT),一种在黎曼流形上直接学习 OT 映射的连续神经框架,避免离散化并以多项式维度复杂度克服维数诅咒。

ABSTRACT

Computational optimal transport (OT) offers a principled framework for generative modeling. Neural OT methods, which use neural networks to learn an OT map (or potential) from data in an amortized way, can be evaluated out of sample after training, but existing approaches are tailored to Euclidean geometry. Extending neural OT to high-dimensional Riemannian manifolds remains an open challenge. In this paper, we prove that any method for OT on manifolds that produces discrete approximations of transport maps necessarily suffers from the curse of dimensionality: achieving a fixed accuracy requires a number of parameters that grows exponentially with the manifold dimension. Motivated by this limitation, we introduce Riemannian Neural OT (RNOT) maps, which are continuous neural-network parameterizations of OT maps on manifolds that avoid discretization and incorporate geometric structure by construction. Under mild regularity assumptions, we prove that RNOT maps approximate Riemannian OT maps with sub-exponential complexity in the dimension. Experiments on synthetic and real datasets demonstrate improved scalability and competitive performance relative to discretization-based baselines.

研究动机与目标

  • 说明在流形上进行 OT 的必要性并指出离散方法的局限性(维数诅咒)。
  • 提出一个在黎曼流形上直接操作的连续、内在神经 OT 框架。
  • 为 RNOT 的近似质量和复杂度建立理论保证。
  • 展示在合成数据和真实流形值数据上的可扩展性与竞争性能。

提出的方法

  • 通过 c-变换在隐式的 c-凹类中表示 OT 势函数,以从构造上强制实现 OT 结构。
  • 用在流形上的特征映射参数化势函数,并通过黎曼指数组合回传输映射:T(x)=exp_x(-∇φ(x)).
  • 使用 Gromov 距离到地标的嵌入创建一个可注入的特征映射 φ,满足假设 2.2。
  • 证明通用性:在隐式 c-凹类内近似势函数可使所诱导的映射收敛到真实 OT 映射。
  • 给出在温和光滑性条件下对网络宽度和深度的 1/ε 次多项式界限,以在 ε-精度下近似 OT 势函数和映射。
  • 通过 Kantorovich 半对偶目标端到端训练,不使用雅可比行列式。
(a) Source $\mu$ (150 Ma)
(a) Source $\mu$ (150 Ma)

实验结果

研究问题

  • RQ1连续、内在的在流形上的神经 OT 映射是否在无离散化的情况下也能实现准确的传输?
  • RQ2在用神经网络学习黎曼 OT 映射时,复杂度和近似保证是什么?
  • RQ3RNOT 势函数是否具有样本外推广性并在维度上多项式扩展?
  • RQ4与基于离散化的基线相比,RNOT 在合成数据和真实流形值数据上的表现如何?

主要发现

ModelKLESSTime (s)
Ours (FPS)0.03 a 0.000.97 a 0.00986 a 2
Ours (RND)0.04 a 0.000.95 a 0.001100 a 1
RCPM0.0037 a 0.00080.996 a 0.00037.3 a 0.6
RCNF2.38 a 0.100.48 a 0.02352 a 6
Moser Flow1.16 a 0.030.82 a 0.00758 a 16
  • 在流形上的离散输出 OT 方法面临维数诅咒:固定精度需要维度指数级增长的参数。
  • RNOT 提供了一个连续方法,内置 c-凹性,可通过指数映射实现样本外生成。
  • 理论结果表明在温和正则性下近似 OT 势函数和映射的复杂度为多项式量级的 ε^{-1},而非指数级。
  • 在 S^2 和 T^2 上的经验结果显示在 KL 散度和 ESS 方面具有竞争力,并且在维度上的可扩展性优于基于离散化的基线。
  • S^2 上的大陆漂移 OT 展现出符合地球物理直觉的可解释的测地线传输。
(b) Target $\nu$ (Present)
(b) Target $\nu$ (Present)

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。