[论文解读] An Interpolating Distance between Optimal Transport and Fisher-Rao
本文提出了一种新的类黎曼距离 WFδ,通过在动力学公式中引入源项,将最优传输(Wasserstein)与费雪-黎曼度量相结合,实现质量传输与质量生成/销毁的联合建模。该方法将最优传输推广至非平衡测度,并证明了测地线的存在性,数值实验表明其在图像插值中通过局部适应质量增长实现了性能提升。
This paper defines a new transport metric over the space of non-negative measures. This metric interpolates between the quadratic Wasserstein and the Fisher-Rao metrics and generalizes optimal transport to measures with different masses. It is defined as a generalization of the dynamical formulation of optimal transport of Benamou and Brenier, by introducing a source term in the continuity equation. The influence of this source term is measured using the Fisher-Rao metric, and is averaged with the transportation term. This gives rise to a convex variational problem defining our metric. Our first contribution is a proof of the existence of geodesics (i.e. solutions to this variational problem). We then show that (generalized) optimal transport and Fisher-Rao metrics are obtained as limiting cases of our metric. Our last theoretical contribution is a proof that geodesics between mixtures of sufficiently close Diracs are made of translating mixtures of Diracs. Lastly, we propose a numerical scheme making use of first order proximal splitting methods and we show an application of this new distance to image interpolation.
研究动机与目标
- 通过引入质量生成/销毁机制,将最优传输推广至非平衡测度,以解决其仅适用于等质量测度的局限性。
- 构建一种类黎曼度量,统一最优传输与费雪-黎曼几何,确保重参数化不变性与几何一致性。
- 提供一种凸变分公式,以支持稳定数值计算与测地线的理论分析。
- 在医学影像与形状插值等质量变化固有的实际应用中实现有效应用。
- 建立原子测度与光滑测度之间测地线行为的理论基础,包括极限情况与结构特性。
提出的方法
- 在连续性方程中引入源项 ζ,构建动力学最优传输问题:∂tρ + ∇·ω = ζ,以允许质量随时间变化。
- 引入惩罚项 ∫∫ |ζ|²/ρ dxdt,源自费雪-黎曼度量,用于衡量质量生成/销毁的成本。
- 将总能量泛函定义为加权和:∫∫ |ω|²/ρ dxdt + δ²∫∫ |ζ|²/ρ dxdt,其中 δ 控制传输与质量变化之间的插值。
- 通过一阶分裂方法求解所得凸变分问题,实现数值实现。
- 利用对偶公式推导最优性条件,并将对偶变量 ϕ 解释为质量增长速率。
- 通过计算总质量不同的密度之间的测地线,将该度量应用于图像插值,特别关注生物图像与合成图像示例。
实验结果
研究问题
- RQ1如何在保持几何与凸性性质的前提下,将最优传输推广至质量不同的测度?
- RQ2在所提出的插值度量中,测地线的结构是怎样的,特别是对于原子测度之间?
- RQ3插值参数 δ 如何影响测地线的行为?当 δ → 0 或 δ → ∞ 时的极限情况是什么?
- RQ4所提出的度量能否实现高效数值实现,并应用于真实世界的图像插值任务?
- RQ5该度量是否保持理想的几何性质,如黎曼结构,以及在测度支撑扰动下的稳定性?
主要发现
- 所提出的 WFδ 度量是唯一从凸、齐次、动力学最小化问题中导出的类黎曼距离,可在最优传输与费雪-黎曼度量之间实现插值。
- 对所有 δ > 0,测地线均存在,且该问题在测度空间中作为凸变分问题具有良好的适定性。
- 当 δ → 0 时,度量收敛至二次 Wasserstein 距离 W2;当 δ → ∞ 时,收敛至费雪-黎曼度量。
- 对于足够接近的 Dirac 质量混合,测地线由平移的 Dirac 混合构成,保持原子结构。
- 数值实验表明,WFδ 在图像插值中比 W2 或部分传输更直观,尤其在组织生长不均的生物图像中表现更优。
- WFδ 测地线中的速度场可局部适应质量增长,而 W2 强制进行全局传输;源项提供了物理解释明确的增长速率(解释为对偶变量 ϕ)。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。