[논문 리뷰] Asymptotics of empirical distribution function for Gaussian subordinated arrays with an application to multiple testing
이 논문은 차원에 따라 변화하는 공분산 행렬을 가진 비 stationary, 고차원 가우시안 벡터 성분의 경험분포함수(e.d.f.)에 대한 渐近 이론을 개발한다. e.d.f.의 행동이 단지 수열 $\gamma_m = m^{-2} \sum_{i \neq j} \Gamma_{i,j}^{(m)}$에 의존함을 보이며, 이는 비 stationary, 장거리 의존적 설정에서 다중 검정에의 응용 가능성을 제공한다.
This paper introduces a new framework to study the asymptotical behavior of the empirical distribution function (e.d.f.) of Gaussian vector components, whose correlation matrix $\Gamma^{(m)}$ is dimension-dependent. Hence, by contrast with the existing literature, the vector is not assumed to be stationary. Rather, we make a vanishing second order assumption ensuring that the covariance matrix $\Gamma^{(m)}$ is not too far from the identity matrix, while the behavior of the e.d.f. is affected by $\Gamma^{(m)}$ only through the sequence $\gamma_m=m^{-2} \sum_{i eq j} \Gamma_{i,j}^{(m)}$, as $m$ grows to infinity. This result recovers some of the previous results for stationary long-range dependencies while it also applies to various, high-dimensional, non-stationary frameworks, for which the most correlated variables are not necessarily next to each other. Finally, we present an application of this work to the multiple testing problem, which was the initial statistical motivation for developing such a methodology.
연구 동기 및 목표
- 정적 가우시안 과정을 초월하여 경험분포함수의 渐近 이론을 확장하는 것.
- 상관관계가 국소화되거나 정적일 필요가 없는 고차원, 비 stationary 가우시안 배열을 모델링하는 것.
- e.d.f.의 渐近 행동을 지배하는 충분통계량 $\gamma_m = m^{-2} \sum_{i \neq j} \Gamma_{i,j}^{(m)}$를 규명하는 것. 이는 차원에 따라 변화하는 공분산 행렬에도 불구하고 성립한다.
- 복잡한 비 stationary 고차원 설정에서 다중 검정 절차의 이론적 기초를 제공하는 것.
제안 방법
- 공분산 행렬 $\Gamma^{(m)}$에 대해 두 번째 차수 조건이 점점 사라지도록 정의하여, $m \to \infty$일 때 항등행렬에 가까워지도록 보장한다.
- 집합적 의존성 구조를 캡처하기 위해 핵심 수열 $\gamma_m = m^{-2} \sum_{i \neq j} \Gamma_{i,j}^{(m)}$를 정의한다.
- 전체 공분산 행렬의 구조에 관계없이 오직 $\gamma_m$만을 사용하여 경험분포함수의 渐近 분포를 확립한다.
- e.d.f.의 渐近 결과를 다중 검정에 적용하여, 귀무분포가 $\gamma_m$에 의존하는 검정통계량을 유도한다.
- 집중 및 약한 수렴 기법을 사용하여 $\gamma_m$ 기반 정규화 하에서 e.d.f.의 수렴을 증명한다.
- 제안된 방법이 정적 장거리 의존 과정의 기존 결과를 특수한 경우로 포함함을 보여준다.
실험 결과
연구 질문
- RQ1차원에 따라 변화하는 공분산 행렬을 가진 고차원, 비 stationary 가우시안 배열에서 경험분포함수의 渐近 행동은 어떻게 되는가?
- RQ2전체 공분산 행렬이 아니라 단일 스칼라 수열 $\gamma_m$을 사용하여 e.d.f.의 渐近 행동을 특징지울 수 있는가?
- RQ3제안된 프레임워크는 정적 장거리 의존 과정을 특수한 경우로 포함하는가?
- RQ4이 이론은 고차원, 비 stationary 설정에서의 다중 검정에 적용될 수 있는가?
주요 결과
- 경험분포함수의 渐近 분포는 $\Gamma^{(m)}$의 전체 구조가 아니라 오직 수열 $\gamma_m = m^{-2} \sum_{i \neq j} \Gamma_{i,j}^{(m)}$에 의존한다.
- 비 stationary 및 국소화되지 않은 상관관계를 允許함으로써, 기존의 정적 장거리 의존 과정 결과를 일반화한다.
- 가장 상관관계가 높은 변수들이 반드시 인접하거나 군집되어 있지 않은 고차원 설정에도 적용 가능하다.
- e.d.f.의 渐近 이론은 $\gamma_m$이 포괄하는 약한 의존성 가정 하에서 다중 검정 문제에서 타당한 추론을 지원한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.