Skip to main content
QUICK REVIEW

[논문 리뷰] Wasserstein-p Central Limit Theorem Rates: From Local Dependence to Markov Chains

Yixuan Zhang, Qiaomin Xie|arXiv (Cornell University)|2026. 01. 13.
Random Matrices and Applications인용 수 0
한 줄 요약

본 논문은 완만한 모멘트 조건 하에서 다변수 로컬 의존 데이터 및 기하적으로 에르고딕한 마르코프 체인에 대한 최적의 Wasserstein-1 및 Wasserstein-p CLT 속도를 제시하고, 이를 다변수 U-통계에 적용한다.

ABSTRACT

Finite-time central limit theorem (CLT) rates play a central role in modern machine learning. In this paper, we study CLT rates for multivariate dependent data in Wasserstein-$p$ ($W_p$) distance, for general $p \geq 1$. We focus on two fundamental dependence structures that commonly arise in machine learning: locally dependent sequences and geometrically ergodic Markov chains. In both settings, we establish the first optimal $O(n^{-1/2})$ rate in $W_1$, as well as the first $W_p$ ($p\ge 2$) CLT rates under mild moment assumptions, substantially improving the best previously known bounds in these dependent-data regimes. As an application of our optimal $W_1$ rate for locally dependent sequences, we further obtain the first optimal $W_1$-CLT rate for multivariate $U$-statistics. On the technical side, we derive a tractable auxiliary bound for $W_1$ Gaussian approximation errors that is well suited for studying dependent data. For Markov chains, we further prove that the regeneration time of the split chain associated with a geometrically ergodic chain has a geometric tail without assuming strong aperiodicity or other restrictive conditions. These tools may be of independent interests and enable our optimal $W_1$ rates and underpin our $W_p$ ($p\ge 2$) results.

연구 동기 및 목표

  • 다변수 의존 데이터에 대한 Wasserstein 거리에서 유한한 시간에 대한 Gaussian 근사 오차를 정량화한다.
  • 로컬 의존 데이터와 마르코프 체인에 대해 완만한 모멘트 가정에서 Wasserstein-1의 최적 CLT 속도를 개발한다.
  • M-의존 데이터에 대해 Wasserstein-p 거리(p≥2)로 CLT 속도 결과를 확장한다.
  • 다변수 U-통계에 Wasserstein-1 CLT 결과를 적용한다.
  • 종속 설정에서 Gaussian 근사 오차의 W1에 대한 실현 가능한 경계치를 제시한다.

제안 방법

  • 의존성을 포착하는 새로운 객체를 구성하여 Raič의 Gaussian 근사 프레임워크를 의존 데이터에 확장한다.
  • 단일 합을 조건화할 때 S_n의 법칙이 어떻게 바뀌는지에 의존하는 W1 Gaussian 근사 오차의 보충 경계를 도출한다.
  • 대형-소형 블록 분해를 이용하여 M-의존 합을 독립 블록으로 축소하고 블록 길이를 최적화한다.
  • 마르코프 체인의 경우 재생 분해를 얻기 위해 분할-사슬(split-chain) 구성을 사용하고 시간 반전 사슬을 분석한다.
  • 유한한(2+δ) 모멘트 하에서 i.i.d. 벤치마크에 일치하는 W1 속도를 증명하고, 완만한 모멘트 조건하에서 p≥2에 대한 Wp 속도를 도출한다.
  • 로컬 의존 데이터에 대해 W1 CLT를 활용하여 U-통계에 대한 적용을 제공한다.

실험 결과

연구 질문

  • RQ1완만한 모멘트 조건 하에서 다변수 로컬 의존 데이터에 대한 Wasserstein 거리에서의 최적 CLT 속도는 무엇인가?
  • RQ2M-의존 다변수 시퀀스에 대해 Wasserstein-p 거리(p≥2)에서 달성할 수 있는 CLT 속도는 무엇인가?
  • RQ3강한 무주기성 가정 없이 기하적으로 에르고딕한 마르코프 체인에 대한 최적 W1 속도를 얻을 수 있는가?
  • RQ4스플릿-체인 재생을 어떻게 활용하여 마르코프 체인에 대한 다변수 Wasserstein CLT 속도를 얻을 수 있는가?
  • RQ5이 속도들이 다변수 U-통계에 어떤 함의를 가지는가?

주요 결과

  • 다변수 로컬 의존 시퀀스에 대해 3차 모멘트 유한 가정하에서 Wasserstein-1의 최적 O(n^{-1/2}) 속도를 처음으로 확립한다.
  • δ가 (0,1]일 때 로컬 의존 데이터에 대해 (2+δ)-모멘트 조건에서 W1의 O(n^{-δ/2}) 속도를 증명한다.
  • M-의존 데이터의 경우 (p+q)-모멘트 경계에서 q∈(0,2]일 때 Wp(p≥2)에서 O(n^{-(p+q-2)/(2(2p+q-2))}) 속도를 얻는다.
  • 마르코프 체인에서 분할 체인의 재생 시간은 유도적 제약 없이 기하적 꼬리를 가지며, 기하적으로 에르고딕한 체인에 대한 W1 CLT 속도를 가능하게 한다.
  • 기하적으로 에르고딕한 마르코프 체인에 대해 O(n^{-1/2}) W1 속도를 달성하고 M-의존 데이터에 대한 현 상태의 연구와 일치하는 Wp 속도를 제공하여 남은 질문을 해결한다.
  • 결과는 로컬 의존 프레임워크에서 다변수 U-통계에 대한 최초의 W1 CLT 속도를 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.