[論文レビュー] Wasserstein-p Central Limit Theorem Rates: From Local Dependence to Markov Chains
本論文は、局所依存データおよび幾何的エルゴードなマルコフ連鎖に対して、弱いモーメント条件の下で最適な Wasserstein-1 および Wasserstein-p の CLT 収束率を導出し、結果を U-statistics に適用する。
Finite-time central limit theorem (CLT) rates play a central role in modern machine learning. In this paper, we study CLT rates for multivariate dependent data in Wasserstein-$p$ ($W_p$) distance, for general $p \geq 1$. We focus on two fundamental dependence structures that commonly arise in machine learning: locally dependent sequences and geometrically ergodic Markov chains. In both settings, we establish the first optimal $O(n^{-1/2})$ rate in $W_1$, as well as the first $W_p$ ($p\ge 2$) CLT rates under mild moment assumptions, substantially improving the best previously known bounds in these dependent-data regimes. As an application of our optimal $W_1$ rate for locally dependent sequences, we further obtain the first optimal $W_1$-CLT rate for multivariate $U$-statistics. On the technical side, we derive a tractable auxiliary bound for $W_1$ Gaussian approximation errors that is well suited for studying dependent data. For Markov chains, we further prove that the regeneration time of the split chain associated with a geometrically ergodic chain has a geometric tail without assuming strong aperiodicity or other restrictive conditions. These tools may be of independent interests and enable our optimal $W_1$ rates and underpin our $W_p$ ($p\ge 2$) results.
研究の動機と目的
- Wasserstein 距離で多変量依存データの有限時間の正規近似誤差を定量化する。
- 局所依存データとマルコフ連鎖に対して、緩いモーメント仮定の下で Wasserstein-1 で最適な CLT 収束率を開発する。
- M依存データに対する Wasserstein-p(p≥2)での CLT 収束率を拡張する。
- 多変量 U-statistics への Wasserstein-1 CLT 結果を適用する。
- 依存設定における正規近似誤差の W1 の実用的な境界を導入する。
提案手法
- Raič の正規近似フレームワークを、依存データを捉える新しい对象を構築することで拡張する。
- 単一の和項条件付け時の法則の変化に依存する W1 正規近似誤差の補助界を導出する。
- 大-小ブロック分解を用いて M依存和を独立ブロックに還元し、ブロック長を最適化する。
- マルコフ連鎖については、スプリットチェーン構成を用いて再生分解を得、時間反転チェーンを分析する。
- 有界な(2+δ)-モーメントの下で i.i.d. の基準と一致する W1 収束率を証明し、緩いモーメント条件の下で p≥2 の Wp 収束率を導出する。
- 局所的依存データに対する W1 CLT を活用して U-statistics への応用を提供する。
実験結果
リサーチクエスチョン
- RQ1 多変量の局所依存データに対して、緩いモーメント条件の下で Wasserstein 距離における最適な CLT 収束率は何か。
- RQ2 M依存多変量系列に対して、 Wasserstein-p 距離(p≥2)で達成可能な CLT 収束率は何か。
- RQ3 幾何的エルゴード性を持つマルコフ連鎖に対して、強い非周期性仮定なしで最適な W1 収束率を得られるか。
- RQ4 split-chain 再生をどのように用いて、マルコフ連鎖の多変量 Wasserstein CLT 収束率を導出できるか。
- RQ5 これらの収束率が多変量 U-statistics に及ぼす影響は何か。
主な発見
- 本論文は、多変量局所依存系列に対して有限三次モーメント仮定の下で Wasserstein-1 における最適な O(n^{-1/2}) 収束率を初めて確立した。
- δ ∈ (0,1] の場合、局所依存データに対して有限な (2+δ)-モーメント条件の下で W1 における O(n^{-δ/2}) 収束率を証明。
- M依存データに対して、有限な (p+q)-モーメント界の下で q ∈ (0,2] を満たすとき Wp(p≥2)において O(n^{-(p+q-2)/(2(2p+q-2))}) の収束率を得る。
- マルコフ連鎖では、スプリットチェーンの再生時間が幾何尾を持つことを制約条件なしに示し、幾何的エルゴード連鎖の W1 CLT 収束率を実現。
- 幾何的エルゴード性を持つマルコフ連鎖に対して O(n^{-1/2}) の W1 収束率を達成し、M依存データに対して最先端と一致する Wp 収束率を提供することで、未解決の問いを解決した。
- 局所依存フレームワークの下で多変量 U-statistics に対する初の W1 CLT 収束率を得た。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。