[论文解读] Strong Gaussian approximation for U-statistics in high dimensions and beyond
论文证明了高维非简并U统计量在维度发散时的强高斯近似,并提供序列耦合性及其在断点分析和相关检验中的应用。
We establish a strong Gaussian approximation for high-dimensional non-degenerate U-statistics with diverging dimension. Under mild assumptions, we construct, on a sufficiently rich probability space, a Gaussian process that uniformly approximates the entire sequential U-statistic process. The approximation error is explicitly characterized and vanishes under polynomial growth of the dimension. The key technical contribution is a sharp martingale maximal inequality for completely degenerate U-statistics, combined with a high-dimensional strong approximation for independent sums. This coupling yields functional Gaussian limits without relying on $\mathcal{L}^\infty$-type bounds or bootstrap arguments. The theory is illustrated through three representative examples of U-statistics: the spatial Kendall's tau matrix, the multivariate Gini's mean difference, and the characteristic dispersion parameter. As applications, we derive Brownian bridge approximations for U-statistic-based change-point statistics and develop a self-normalized relevant testing procedure whose limiting distribution is fully pivotal. The framework naturally accommodates bounded kernels and therefore remains valid under heavy-tailed distributions. Overall, our results provide a unified probability-theoretic foundation for high-dimensional inference based on U-statistics.
研究动机与目标
- 使用U统计量进行高维推断的动机以及需要强、路径逐步的高斯近似。
- 为高维(向量值)二阶U统计量开发一个序列化的强高斯近似。
- 利用鞅方法提供对完全简并U统计量的尖锐最大不等式。
- 展示自规范化相关检验和基于U统计量的断点程序的应用。
提出的方法
- 利用Hoeffding分解将U统计量分解为线性成分(g)和简并成分(f)。
- 构造具有与T_k匹配协方差的高斯部分和过程Wk。
- 在矩条件下证明最大范数误差的界 E max2≤k≤n ||T_k−W_k||2 = Op(B sqrt(log n) (d/n)^{1/4−1/(2q)})。
- 建立针对完全简并U统计量的尖锐马尔可夫最大不等式,并嵌入到一个马尔可夫过程中以应用向量值马尔可夫不等式。
- 给出基于替代投影的协方差估计量并在给定条件下证明其一致性。
- 将结果扩展到独立但非同分布数据以实现全局高斯近似。
实验结果
研究问题
- RQ1是否可以为随n增长的d而增长的序列高维U统计量构建强的(路径逐点)高斯耦合?
- RQ2在序列U统计量过程中实现均匀欧几里得范数近似所需的最小矩条件和简并性条件是什么?
- RQ3如何将这些近似应用于开发自规范化检验和关键或渐近关键的断点程序?
- RQ4在独立但非同分布设置下,这些结果是否对全局(不仅是序列化)U统计量成立?
主要发现
- 为序列高维U统计量建立强高斯近似,并给出明确的误差率,在多项式维度增长下消失。
- 通过马尔可夫嵌入和向量马尔可夫不等式推导出完全简并U统计量的尖锐最大不等式。
- 在提出的框架下显示高维协方差的插件估计量的一致性。
- 应用包括自规范化相关检验和基于U统计量的断点程序,在无效假设下具有布朗桥极限。
- 理论容纳有界核函数,并通过矩基与马尔可夫方法对重尾分布具鲁棒性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。