Skip to main content
QUICK REVIEW

[论文解读] Asymptotics of empirical distribution function for Gaussian subordinated arrays with an application to multiple testing

Sylvain Delattre, Étienne Roquain|arXiv (Cornell University)|Oct 9, 2012
Point processes and geometric inequalities被引用 1
一句话总结

本文为具有维度相关相关矩阵的非平稳高维高斯向量分量的经验分布函数(e.d.f.)建立了渐近理论。结果表明,e.d.f.的行为仅取决于序列 $\gamma_m = m^{-2} \sum_{i \neq j} \Gamma_{i,j}^{(m)}$,从而使得该理论可应用于非平稳、长程依赖设定下的多重检验。

ABSTRACT

This paper introduces a new framework to study the asymptotical behavior of the empirical distribution function (e.d.f.) of Gaussian vector components, whose correlation matrix $\Gamma^{(m)}$ is dimension-dependent. Hence, by contrast with the existing literature, the vector is not assumed to be stationary. Rather, we make a vanishing second order assumption ensuring that the covariance matrix $\Gamma^{(m)}$ is not too far from the identity matrix, while the behavior of the e.d.f. is affected by $\Gamma^{(m)}$ only through the sequence $\gamma_m=m^{-2} \sum_{i eq j} \Gamma_{i,j}^{(m)}$, as $m$ grows to infinity. This result recovers some of the previous results for stationary long-range dependencies while it also applies to various, high-dimensional, non-stationary frameworks, for which the most correlated variables are not necessarily next to each other. Finally, we present an application of this work to the multiple testing problem, which was the initial statistical motivation for developing such a methodology.

研究动机与目标

  • 将经验分布函数的渐近理论从平稳高斯过程推广至更广泛情形。
  • 建立高维、非平稳高斯数组的模型,其中相关性既非局域化也非平稳。
  • 识别出一个充分统计量 $\gamma_m = m^{-2} \sum_{i \neq j} \Gamma_{i,j}^{(m)}$,该统计量可完全决定e.d.f.的渐近行为,即使在相关矩阵依赖维度时亦然。
  • 为复杂、非平稳高维设定下的多重检验程序提供理论基础。

提出的方法

  • 在相关矩阵 $\Gamma^{(m)}$ 上引入一个趋于零的二阶条件,确保当 $m \to \infty$ 时,其保持接近单位矩阵。
  • 定义关键序列 $\gamma_m = m^{-2} \sum_{i \neq j} \Gamma_{i,j}^{(m)}$,以捕捉整体依赖结构。
  • 仅基于 $\gamma_m$ 建立经验分布函数的渐近分布,而无需依赖相关矩阵的完整结构。
  • 通过推导一个其零分布依赖于 $\gamma_m$ 的检验统计量,将渐近结果应用于多重检验。
  • 使用集中与弱收敛技术,证明在基于 $\gamma_m$ 的归一化下,e.d.f. 的收敛性。
  • 证明该方法可作为平稳长程依赖过程的已知结果的特例被恢复。

实验结果

研究问题

  • RQ1对于具有维度相关相关矩阵的高维、非平稳高斯数组,经验分布函数的渐近行为如何?
  • RQ2是否可以仅用单一标量序列 $\gamma_m$ 而非完整相关矩阵来刻画e.d.f.的渐近行为?
  • RQ3所提出的框架是否包含平稳长程依赖过程作为特例?
  • RQ4该理论是否可应用于高维、非平稳设定下的多重检验问题?

主要发现

  • 经验分布函数的渐近分布仅依赖于序列 $\gamma_m = m^{-2} \sum_{i \neq j} \Gamma_{i,j}^{(m)}$,而与 $\Gamma^{(m)}$ 的完整结构无关。
  • 该框架通过允许非平稳性和非局域相关性,推广了现有关于平稳长程依赖过程的结果。
  • 该方法适用于最相关变量未必相邻或聚集的高维设定。
  • 渐近理论支持在由 $\gamma_m$ 捕获的弱依赖假设下,多重检验问题中的有效推断。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。