QUICK REVIEW

[논문 리뷰] Stein's method for normal approximation in Wasserstein distances with application to the multivariate Central Limit Theorem

Thomas Bonis|arXiv (Cornell University)|2019. 05. 31.

Geometric Analysis and Curvature Flows참고 문헌 20인용 수 32

한 줄 요약

이 논문은 확률 과정들을 이용하여 Wasserstein 거리(차수 2 이상)에서 정규 근사를 정량화하기 위한 Stein-type 경계(bound)를 개발하고, 모멘트 조건과 교환가능성 가정하에 다변량 CLT의 최적 수렴 속도를 제시한다.

ABSTRACT

We use Stein's method to bound the Wasserstein distance of order $2$ between a measure $\ u$ and the Gaussian measure using a stochastic process $(X_t)_{t \\geq 0}$ such that $X_t$ is drawn from $\ u$ for any $t > 0$. If the stochastic process $(X_t)_{t \\geq 0}$ satisfies an additional exchangeability assumption, we show it can also be used to obtain bounds on Wasserstein distances of any order $p \\geq 1$. Using our results, we provide optimal convergence rates for the multi-dimensional Central Limit Theorem in terms of Wasserstein distances of any order $p \\geq 2$ under simple moment assumptions.

연구 동기 및 목표

다중 차원에서 경험적 합 분포와 가우시안 사이의 Wasserstein 거리를 측정하는 문제를 동기 부여하고 정식화한다.
W2 및 고차 Wasserstein 거리를 구제하는 Stein-연산자 프레임워크를 확률 과정으로 개발한다.
단순 모멘트 가정하에 다변량 중심극한정리의 차원 의존 수렴 속도를 도출한다.
일변량 및 다변량 결과를 확장하여 p≥1인 Wp에 대한 상한을 제시하고 일부 영역에서 최적 스케일링을 보인다.

제안 방법

확률 분포 ν에서 뽑힌 과정 (Xt)와 연결된 불변 연산자 Lν의 계를 도입하여 가우시안 생성자 Lγ와 비교한다.
Lν 대 Lγ의 테일러 전개 기반 분석을 사용하여 편차를 Xt−X0의 모멘트와 연계한다.
과정과 보조량 S(t)를 이용하여 Fisher 정보 I(νt)를 정의하고 이를 시간에 걸쳐 적분하여 W2를 한정한다.
명시적 경계 W2(ν, γ) ≤ ∫0∞ e−t E[S(t)]1/2 dt를 제공하고 S(t)를 Xt−X0의 조건부 모멘트로 표현한다.
일변량 Wp 경계(정리 7)을 도출하고 교환가능성 가정하에서 다변량 Wp 경계(정리 9)를 도출한다.
이 경계를 CLT 설정에 적용하여 합의 모멘트와 차원에 의존하는 속도를 도출한다.

실험 결과

연구 질문

RQ1다중 차원에서 합의 분포와 가우시안 사이의 Wasserstein 거리의 차수 p≥1를 구하는 Stein 방법을 어떻게 적응시킬 수 있는가?
RQ2다변량 중심극한정리에서 Wasserstein 거리의 명시적 수렴 속도를 얻기 위해 필요한 모멘트 및 교환가능성 조건은 무엇인가?
RQ3일변량과 다변량 Wasserstein 경계는 어떻게 비교되며, 단순 모멘트 가정하에서 어떤 최적 속도가 도달하는가?

주요 결과

일반적인 W2 경계가 얻어진다: W2(ν, γ) ≤ ∫0∞ e−t E[S(t)]1/2 dt로, S(t)는 Xt−X0의 조건부 모멘트를 포함한다.
Rd에서 독립적인 X1,...,Xn인 경우 네 번째 모멘트가 유한하면, W2(νn, γ) ≤ C d1/4 ||E[X1X1T] ||XS1/2 / √n (정리 1).
더 높은 차원의 모멘트가 존재하면, Wp(νn, γ)도 루트 n 의 비례로 스케일링되며 추가 항을 가진 경계: Wp(νn, γ) ≤ Cp (d1/4 ||E[X1X1T] ||XS1/2 + E||X1||p+2)1/p / √n (정리 1).
1D에서, Wp(ν, γ)는 Sp(t)를 포함하는 적분으로 유계된다(정리 7).
Rd에서, 교환가능성 가정(X0, Xt)의 분포가 (Xt, X0) 분포와 같을 때, Wp(ν, γ)에 대한 유사한 경계가 성립한다(정리 9).
결과는 고전적인 CLT 속도들을 재확인 및 확장하며, 특정 영역에서 최적 스케일링과 더 약한 모멘트 가정 하의 경계도 제공한다(정리 2, 7, 9, 11).

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.