[論文レビュー] Rates of Estimation of Optimal Transport Maps using Plug-in Estimators via Barycentric Projections
この論文は、重心投影を用いた最適輸送写像のプラグイン推定量の収束速度を分析し、平滑化(ウェーブレット/カーネル)が次元の呪いを緩和できることを示す;また Wasserstein 距離推定量の収束速度と Wasserstein アベレント(重心)および独立性検定への適用を提供する。
Optimal transport maps between two probability distributions $μ$ and $ν$ on $\mathbb{R}^d$ have found extensive applications in both machine learning and statistics. In practice, these maps need to be estimated from data sampled according to $μ$ and $ν$. Plug-in estimators are perhaps most popular in estimating transport maps in the field of computational optimal transport. In this paper, we provide a comprehensive analysis of the rates of convergences for general plug-in estimators defined via barycentric projections. Our main contribution is a new stability estimate for barycentric projections which proceeds under minimal smoothness assumptions and can be used to analyze general plug-in estimators. We illustrate the usefulness of this stability estimate by first providing rates of convergence for the natural discrete-discrete and semi-discrete estimators of optimal transport maps. We then use the same stability estimate to show that, under additional smoothness assumptions of Besov type or Sobolev type, wavelet based or kernel smoothed plug-in estimators respectively speed up the rates of convergence and significantly mitigate the curse of dimensionality suffered by the natural discrete-discrete/semi-discrete estimators. As a by-product of our analysis, we also obtain faster rates of convergence for plug-in estimators of $W_2(μ,ν)$, the Wasserstein distance between $μ$ and $ν$, under the aforementioned smoothness assumptions, thereby complementing recent results in Chizat et al. (2020). Finally, we illustrate the applicability of our results in obtaining rates of convergence for Wasserstein barycenters between two probability distributions and obtaining asymptotic detection thresholds for some recent optimal-transport based tests of independence.
研究の動機と目的
- μ および ν からサンプルを引いたデータから T0 の推定を動機づける。
- プラグイン推定量を分析するための重心投影の統一的安定性フレームワークを構築する。
- 自然な離散-離散および半離散のプラグイン推定量の収束率を導出する。
- Besov または Sobolev の滑らかな密度仮定が速度を改善し、次元性を緩和する方法を示す。
- 結果を W2 推定、 Wasserstein アベレント、および独立性検定の応用と関連付ける。
提案手法
- 最小限の滑らかさを要し、近似間で OT マップの存在を前提としない新しい安定性推定量(Theorem 2.1)を導入する。
- Lipchitz OT マップ(Theorem 2.2)下で自然な離散-離散および半離散のプラグイン推定量の収束速度を導出する。
- Besov-滑らかな密度の下で、d ≥ 3 のとき T0 の速度が n^{-(1+s)/(d+2s)} の形になることを示す(Theorem 2.4)。
- Sobolev-滑らかな密度とカーネル平滑化を用いると、速度は m^{-(s+2)/d ∧ 1/2}+n^{-(s+2)/d ∧ 1/2} の形になる(Theorem 2.6)。
- 滑らかな測度の平滑化済みディスクリート近似を計算可能にし、同じ収束速度を得る(Theorem 2.8)。
- OT の W2^2(μ,ν) の収束速度の分析へ拡張し、 Wasserstein アベレントおよび独立検定への含意を議論する。
実験結果
リサーチクエスチョン
- RQ1ビヘイビア投影を用いた経験分布からの OT マップのプラグイン推定量の収束率はどのようになるか。
- RQ2Besov または Sobolev 密度仮定による平滑化は OT マップ推定の次元呪いを緩和できるか。
- RQ3同様の滑らかさ仮定の下で W2^2(μ,ν) のプラグイン推定量の収束率はどうなるか。
- RQ4これらの収束率は Wasserstein アベレントや独立性検定などの実用的な OT 関連タスクにどう適用されるか。
主な発見
- 重なりのない安定性境界(Theorem 2.1)を示し、滑らかさや近似間で既存の OT マップを必要としない。
- 離散-離散および半離散のプラグイン推定量で T0 が Lipschitz かつ ν がコンパクトに支持される場合、d ≥ 4 で誤差収束率は m^{-2/d}+n^{-2/d}(Theorem 2.2)。
- Besov-滑らかな密度の下では、収束率は n^{-(1+s)/(d+2s)} に改善する(Theorem 2.4)。
- Sobolev-滑らかな密度とカーネル平滑化の下では、収束率は m^{-(s+2)/d ∧ 1/2}+n^{-(s+2)/d ∧ 1/2} となる(Theorem 2.6)。
- 同じ平滑化ベースの改良は W2^2(μ,ν) の推定にも適用される(Theorem 2.4 および関連結果)。
- 計算可能な離散化平滑推定量(Theorem 2.8)は、統計的計算的複雑性の明確なトadeオフを伴い、同じ収束速度を保持する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。