[论文解读] Rates of Estimation of Optimal Transport Maps using Plug-in Estimators via Barycentric Projections
论文分析了使用基于重心投影的插件估计最优传输映射的收敛速率,并显示平滑(小波/核)可以缓解 OT 估计的维数灾难;它还给出 Wasserstein 距离估计的速率以及对 Wasserstein 重心和独立性检验应用的贡献。
Optimal transport maps between two probability distributions $μ$ and $ν$ on $\mathbb{R}^d$ have found extensive applications in both machine learning and statistics. In practice, these maps need to be estimated from data sampled according to $μ$ and $ν$. Plug-in estimators are perhaps most popular in estimating transport maps in the field of computational optimal transport. In this paper, we provide a comprehensive analysis of the rates of convergences for general plug-in estimators defined via barycentric projections. Our main contribution is a new stability estimate for barycentric projections which proceeds under minimal smoothness assumptions and can be used to analyze general plug-in estimators. We illustrate the usefulness of this stability estimate by first providing rates of convergence for the natural discrete-discrete and semi-discrete estimators of optimal transport maps. We then use the same stability estimate to show that, under additional smoothness assumptions of Besov type or Sobolev type, wavelet based or kernel smoothed plug-in estimators respectively speed up the rates of convergence and significantly mitigate the curse of dimensionality suffered by the natural discrete-discrete/semi-discrete estimators. As a by-product of our analysis, we also obtain faster rates of convergence for plug-in estimators of $W_2(μ,ν)$, the Wasserstein distance between $μ$ and $ν$, under the aforementioned smoothness assumptions, thereby complementing recent results in Chizat et al. (2020). Finally, we illustrate the applicability of our results in obtaining rates of convergence for Wasserstein barycenters between two probability distributions and obtaining asymptotic detection thresholds for some recent optimal-transport based tests of independence.
研究动机与目标
- 从来自 μ 和 ν 的样本中推导估计最优传输映射 T0 的动机。
- 为重心投影开发一个统一的稳定性框架,以分析插件估计器。
- 推导自然的离散-离散和半离散插件估计量的收敛速率。
- 证明平滑密度假设(Besov 或 Sobolev)如何提高收敛速率并减轻维数灾难。
- 将结果与 W2 估计、Wasserstein 重心以及独立性检验应用联系起来。
提出的方法
- 引入一个新的稳定性估计(定理 2.1)用于重心投影,所需平滑性极小且不依赖近似之间存在 OT 映射。
- 在 Lipschitz OT 映射假设下,为自然的离散-离散和半离散插件估计量推导收敛速率(定理 2.2)。
- 证明 Besov 平滑密度在 d ≥ 3 时,T0 的速率为 n^{-(1+s)/(d+2s)}(定理 2.4)。
- 证明带核平滑的 Sobolev 平滑密度得到的速率为 m^{-(s+2)/d ∧ 1/2}+n^{-(s+2)/d ∧ 1/2}(定理 2.6)。
- 建立可计算的平滑化度量的离散近似,得到相同的速率(定理 2.8)。
- 将分析扩展到 W2^2(μ,ν) 的收敛速率,并讨论对 Wasserstein 重心和独立性检验的影响。
实验结果
研究问题
- RQ1在使用来自经验测量的重心投影时,OT 映射的插件估计量的收敛速率是多少?
- RQ2通过 Besov 或 Sobolev 密度假设的平滑能否缓解 OT 映射估计中的维度灾难?
- RQ3在类似平滑性假设下,W2^2(μ,ν) 插件估计量的收敛速率是多少?
- RQ4这些速率如何应用于实际的 OT 相关任务,如 Wasserstein 重心和独立性检验?
主要发现
- 一个新的稳定性界限(定理 2.1),用于重心投影,不需要平滑性或近似之间存在 OT 映射。
- 对于离散-离散和半离散插件估计,在 T0 为 Lipschitz 且 ν 支持紧凑时,误差速率为 m^{-2/d}+n^{-2/d},d ≥ 4(定理 2.2)。
- 在 Besov 平滑密度下,速率提升为 n^{-(1+s)/(d+2s)}(定理 2.4)。
- 在带核平滑的 Sobolev 平滑密度下,速率变为 m^{-(s+2)/d ∧ 1/2}+n^{-(s+2)/d ∧ 1/2}(定理 2.6)。
- 同样的平滑驱动速率提升适用于估计 W2^2(μ,ν)(定理 2.4 及相关结果)。
- 可计算的离散化平滑估计量(定理 2.8)在统计与计算复杂度的显式权衡下保持相同速率。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。