Skip to main content
QUICK REVIEW

[論文レビュー] Wasserstein-p Central Limit Theorem Rates: From Local Dependence to Markov Chains

Yixuan Zhang, Qiaomin Xie|arXiv (Cornell University)|Jan 13, 2026
Random Matrices and Applications被引用数 0
ひとこと要約

本論文は、局所依存データおよび幾何的エルゴードなマルコフ連鎖に対して、弱いモーメント条件の下で最適な Wasserstein-1 および Wasserstein-p の CLT 収束率を導出し、結果を U-statistics に適用する。

ABSTRACT

Finite-time central limit theorem (CLT) rates play a central role in modern machine learning. In this paper, we study CLT rates for multivariate dependent data in Wasserstein-$p$ ($W_p$) distance, for general $p \geq 1$. We focus on two fundamental dependence structures that commonly arise in machine learning: locally dependent sequences and geometrically ergodic Markov chains. In both settings, we establish the first optimal $O(n^{-1/2})$ rate in $W_1$, as well as the first $W_p$ ($p\ge 2$) CLT rates under mild moment assumptions, substantially improving the best previously known bounds in these dependent-data regimes. As an application of our optimal $W_1$ rate for locally dependent sequences, we further obtain the first optimal $W_1$-CLT rate for multivariate $U$-statistics. On the technical side, we derive a tractable auxiliary bound for $W_1$ Gaussian approximation errors that is well suited for studying dependent data. For Markov chains, we further prove that the regeneration time of the split chain associated with a geometrically ergodic chain has a geometric tail without assuming strong aperiodicity or other restrictive conditions. These tools may be of independent interests and enable our optimal $W_1$ rates and underpin our $W_p$ ($p\ge 2$) results.

研究の動機と目的

  • Wasserstein 距離で多変量依存データの有限時間の正規近似誤差を定量化する。
  • 局所依存データとマルコフ連鎖に対して、緩いモーメント仮定の下で Wasserstein-1 で最適な CLT 収束率を開発する。
  • M依存データに対する Wasserstein-p(p≥2)での CLT 収束率を拡張する。
  • 多変量 U-statistics への Wasserstein-1 CLT 結果を適用する。
  • 依存設定における正規近似誤差の W1 の実用的な境界を導入する。

提案手法

  • Raič の正規近似フレームワークを、依存データを捉える新しい对象を構築することで拡張する。
  • 単一の和項条件付け時の法則の変化に依存する W1 正規近似誤差の補助界を導出する。
  • 大-小ブロック分解を用いて M依存和を独立ブロックに還元し、ブロック長を最適化する。
  • マルコフ連鎖については、スプリットチェーン構成を用いて再生分解を得、時間反転チェーンを分析する。
  • 有界な(2+δ)-モーメントの下で i.i.d. の基準と一致する W1 収束率を証明し、緩いモーメント条件の下で p≥2 の Wp 収束率を導出する。
  • 局所的依存データに対する W1 CLT を活用して U-statistics への応用を提供する。

実験結果

リサーチクエスチョン

  • RQ1 多変量の局所依存データに対して、緩いモーメント条件の下で Wasserstein 距離における最適な CLT 収束率は何か。
  • RQ2 M依存多変量系列に対して、 Wasserstein-p 距離(p≥2)で達成可能な CLT 収束率は何か。
  • RQ3 幾何的エルゴード性を持つマルコフ連鎖に対して、強い非周期性仮定なしで最適な W1 収束率を得られるか。
  • RQ4 split-chain 再生をどのように用いて、マルコフ連鎖の多変量 Wasserstein CLT 収束率を導出できるか。
  • RQ5 これらの収束率が多変量 U-statistics に及ぼす影響は何か。

主な発見

  • 本論文は、多変量局所依存系列に対して有限三次モーメント仮定の下で Wasserstein-1 における最適な O(n^{-1/2}) 収束率を初めて確立した。
  • δ ∈ (0,1] の場合、局所依存データに対して有限な (2+δ)-モーメント条件の下で W1 における O(n^{-δ/2}) 収束率を証明。
  • M依存データに対して、有限な (p+q)-モーメント界の下で q ∈ (0,2] を満たすとき Wp(p≥2)において O(n^{-(p+q-2)/(2(2p+q-2))}) の収束率を得る。
  • マルコフ連鎖では、スプリットチェーンの再生時間が幾何尾を持つことを制約条件なしに示し、幾何的エルゴード連鎖の W1 CLT 収束率を実現。
  • 幾何的エルゴード性を持つマルコフ連鎖に対して O(n^{-1/2}) の W1 収束率を達成し、M依存データに対して最先端と一致する Wp 収束率を提供することで、未解決の問いを解決した。
  • 局所依存フレームワークの下で多変量 U-statistics に対する初の W1 CLT 収束率を得た。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。