Skip to main content
QUICK REVIEW

[논문 리뷰] Strong Gaussian approximation for U-statistics in high dimensions and beyond

Weijia Li, Leheng Cai|arXiv (Cornell University)|2026. 03. 11.
Random Matrices and Applications인용 수 0
한 줄 요약

이 논문은 차원이 발산하는 고차원 비퇴화 U-statistics에 대한 강한 Gaussian 근사를 입증하고, 순차 결합을 제공하며, change-point 분석 및 관련 검정에의 응용을 제시한다.

ABSTRACT

We establish a strong Gaussian approximation for high-dimensional non-degenerate U-statistics with diverging dimension. Under mild assumptions, we construct, on a sufficiently rich probability space, a Gaussian process that uniformly approximates the entire sequential U-statistic process. The approximation error is explicitly characterized and vanishes under polynomial growth of the dimension. The key technical contribution is a sharp martingale maximal inequality for completely degenerate U-statistics, combined with a high-dimensional strong approximation for independent sums. This coupling yields functional Gaussian limits without relying on $\mathcal{L}^\infty$-type bounds or bootstrap arguments. The theory is illustrated through three representative examples of U-statistics: the spatial Kendall's tau matrix, the multivariate Gini's mean difference, and the characteristic dispersion parameter. As applications, we derive Brownian bridge approximations for U-statistic-based change-point statistics and develop a self-normalized relevant testing procedure whose limiting distribution is fully pivotal. The framework naturally accommodates bounded kernels and therefore remains valid under heavy-tailed distributions. Overall, our results provide a unified probability-theoretic foundation for high-dimensional inference based on U-statistics.

연구 동기 및 목표

  • U-statistics를 이용한 고차원 추론의 필요성과 강하고 경로상 Gaussian 근사의 필요성을 동기화한다.
  • 차원 d이 증가하는 고차원(벡터 값) U-statistics의 차수 두(Order two)에 대한 순차적 강한 Gaussian 근사를 개발한다.
  • martingale 방법을 사용하여 완전히 degenerate U-statistics에 대한 날카로운 최대 불평등을 제공한다.
  • 자기정규화된 관련 검정 및 U-statistic 기반 change-point 절차에의 응용을 입증한다.

제안 방법

  • Hoeffding 분해를 사용하여 U-statistics를 선형(g)와 퇴화(f) 구성요소로 분리한다.
  • T_k와 동일한 공분산을 갖는 Gaussian 부분합 프로세스 W_k를 구성한다.
  • 모멘트 가정 하에서 최대-노름 오차에 대한 한계를 증명한다: E max2≤k≤n ||T_k−W_k||2 = Op(B sqrt(log n) (d/n)^{1/4−1/(2q)})
  • 퇴화된 U-statistics에 대한 샤프한 마르팅게일 최대 불평등을 확립하고 벡터-valued 마르팅게일 불평등을 적용하기 위해 마르팅게일에 내재시킨다.
  • 잭나이프 투영에 기초한 공분산 추정기를 plug-in으로 제공하고, 주어진 조건하에서 그 일관성을 보인다.
  • 독립적이되 동일분포가 아닐 수 있는 데이터로 결과를 확장하여 글로벌 Gaussian 근사를 제공한다.

실험 결과

연구 질문

  • RQ1차원이 n과 함께 증가하는 순차적 고차원 U-statistics에 대해 강한(경로상의) Gaussian 결합을 구성할 수 있는가?
  • RQ2순차적 U-statistic 프로세스에서 균일한 Euclidean 노름 근사를 달성하기 위한 최소 모멘트 및 degeneracy 조건은 무엇인가?
  • RQ3이 근사들을 자기정규화된 검정 및 이벤트의 좌우에 구속되거나 비대칭적으로 변하는 검정으로 적용해 자체적으로 모아진 검정과 변화점 절차를 개발할 수 있는가?
  • RQ4글로벌(순차적이 아닌) U-statistics에 대해 독립적이되 동일분포가 아닌 설정에서도 이 결과들이 성립하는가?

주요 결과

  • 순차적 고차원 U-statistics에 대한 강한 Gaussian 근사가 명시적 오차율과 함께 확립되며, 다항적 차원 증가 하에서도 이 오차가 소멸한다.
  • 마르팅게일 내재화와 벡터 마르팅게일 불평등을 통해 완전히 degenerate U-statistics에 대한 날카로운 최대 불평등이 도출된다.
  • 고차원 공분산에 대한 plug-in 추정기가 제안된 프레임워크에서 일관성을 보인다.
  • 본 연구의 응용은 Brownian-bridge 한계 하에서의 자기정규화된 관련 검정 및 U-statistic 기반 change-point 절차를 포함한다.
  • 이론은 경계가 있는 커널을 허용하며 모멘트 기반 및 마르팅게일 방법을 통해 무거운 꼬리 분포에 강건하다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.