Skip to main content
QUICK REVIEW

[논문 리뷰] Central limit theorems for functionals of large sample covariance matrix and mean vector in matrix-variate location mixture of normal distributions

Taras Bodnar, Stepan Mazur|arXiv (Cornell University)|2016. 02. 17.
Random Matrices and Applications참고 문헌 42인용 수 13
한 줄 요약

이 논문은 고차원 행렬변량 위치혼합정규분포(MVLMN) 하에서 표본공분산행렬과 평균벡터를 포함하는 이차형식에 대한 중심극한정리(CLTs)를 수립한다. 큰 차원 점근적 영역($p/n \to c \in [0, \infty)$)에서 $\mathbf{l}^\top S\mathbf{x}$ 및 $\mathbf{l}^\top S^{-1}\mathbf{x}$의 점근적 분포를 도출하여, 공분산행렬이 특이행렬일 경우에도 이러한 형식이 정규분포로 수렴함을 보여준다. 주요 기여는 고전적 CLT를 더 일반적이고 비대칭적이며 의존적인 데이터 모형으로 확장하였으며, 이론적 및 수치적 검증을 통해 뒷받meld는다.

ABSTRACT

In this paper we consider the asymptotic distributions of functionals of the sample covariance matrix and the sample mean vector obtained under the assumption that the matrix of observations has a matrix-variate location mixture of normal distributions. The central limit theorem is derived for the product of the sample covariance matrix and the sample mean vector. Moreover, we consider the product of the inverse sample covariance matrix and the mean vector for which the central limit theorem is established as well. All results are obtained under the large-dimensional asymptotic regime where the dimension $p$ and the sample size $n$ approach to infinity such that $p/n o c\in[0 , +\infty)$ when the sample covariance matrix does not need to be invertible and $p/n o c\in [0, 1)$ otherwise.

연구 동기 및 목표

  • 유연하고 타원형이 아닌 분포 모형을 고려한 고차원 환경에서 표본공분산 및 평균벡터 기능에 대한 고전적 중심극한정리(CLTs)를 확장하기 위해.
  • 행렬변량 위치혼합정규(MVLMN) 분포 하에서 이차형식 $\mathbf{l}^\top S\mathbf{x}$ 및 $\mathbf{l}^\top S^{-1}\mathbf{x}$에 대한 점근적 이론을 개발하기 위해.
  • 표본공분산행렬이 특이행렬일 수 있는 고차원 점근적 영역($p, n \to \infty$ 이면서 $p/n \to c \in [0, \infty)$)에서 CLT를 수립하기 위해.
  • 혼합변수 $\nu$에 대한 다양한 분포(절단정규분포 및 일반화된 비대칭 라플라스분포 포함) 하에서 몬테카를로 시뮬레이션을 통해 이론적 결과를 검증하기 위해.

제안 방법

  • 반모수적 행렬변량 위치혼합정규(MVLMN) 모형을 제안: $\mathbf{X} \stackrel{d}{=} \mathbf{Y} + \mathbf{B}\boldsymbol{\nu}^\top$, 여기서 $\mathbf{Y} \sim N_{p,n}(\boldsymbol{\mu}\mathbf{1}_n^\top, \boldsymbol{\Sigma} \otimes \mathbf{I}_n)$ 이고 $\boldsymbol{\nu}$ 는 밀도 함수 $f_\nu$ 를 가진 일반적인 랜덤벡터이다.
  • MVLMN 모형 하에서 표본평균 $\mathbf{x}$ 와 표본공분산 $\mathbf{S}$ 의 정확한 확률적 표현을 도출하여, 이 모형 하에서 $\mathbf{x}$ 와 $\mathbf{S}$ 가 서로 독립임을 보였다.
  • 확률적 표현을 통해 $\mathbf{l}^\top \mathbf{S}\mathbf{x}$ 에 대한 CLT 를 수립하였으며, 이는 $\chi^2_{n-1}$, 정규분포 및 가우시안 변수를 포함한다. 이론적 분산은 모형의 파라미터로부터 유도되었다.
  • $p/n \to c \in [0,1)$ 조건 하에서 $\mathbf{l}^\top \mathbf{S}^{-1}\mathbf{x}$ 에 대한 CLT 를 유도하였으며, 이는 $\chi^2_{n-p}$ 와 $F$-분포 변수를 포함하는 표현을 사용하였다. 이론적 분산은 비대칭성과 고차원성을 반영하였다.
  • 몬테카를로 시뮬레이션을 통해 $\sqrt{n}\sigma^{-1}_\nu(\mathbf{l}^\top \mathbf{S}\mathbf{x} - \mathbf{l}^\top \boldsymbol{\Sigma} \boldsymbol{\mu}_\nu)$ 와 $\sqrt{n}\tilde{\sigma}^{-1}_\nu(\mathbf{l}^\top \mathbf{S}^{-1}\mathbf{x} - \frac{1}{1-c}\mathbf{l}^\top \boldsymbol{\Sigma}^{-1}(\boldsymbol{\mu} + \mathbf{B}\boldsymbol{\omega}))$ 의 점근적 정규성 검증을 수행하였다.
  • 핵밀도추정에 에판에히코비치 대역폭과 교차검증을 활용하여 시뮬레이션된 분포와 이론적 점근정규분포를 비교하였다.

실험 결과

연구 질문

  • RQ1MVLMN 모형 하에서 고차원 점근적 영역에서 $\mathbf{l}^\top \mathbf{S}\mathbf{x}$ 가 정규분포로 수렴하는가?
  • RQ2$p/n \to c \in [0,1)$ 일 때, $\mathbf{S}$ 가 특이행렬일지라도 $\mathbf{l}^\top \mathbf{S}^{-1}\mathbf{x}$ 가 중심극한정리(CLT)를 만족하는가?
  • RQ3혼합분포 $f_\nu$ 의 선택(예: 절단정규분포 또는 일반화된 비대칭 라플라스분포)에 대해 점근정규근사가 얼마나 강인한가?
  • RQ4이론적 $\mathbf{l}^\top \mathbf{S}^{-1}\mathbf{x}$ 의 CLT 는 유한표본에서 정확하게 시뮬레이션 및 검증될 수 있는가?

주요 결과

  • $\sqrt{n}\sigma^{-1}_\nu(\mathbf{l}^\top \mathbf{S}\mathbf{x} - \mathbf{l}^\top \boldsymbol{\Sigma} \boldsymbol{\mu}_\nu)$ 의 점근적 분포는 고차원 영역 $p/n \to c \in [0, \infty)$ 에서 표준정규분포 $N(0,1)$ 으로 수렴한다.
  • $\mathbf{l}^\top \mathbf{S}^{-1}\mathbf{x}$ 에 대해, $\sqrt{n}\tilde{\sigma}^{-1}_\nu\left(\mathbf{l}^\top \mathbf{S}^{-1}\mathbf{x} - \frac{1}{1-c}\mathbf{l}^\top \boldsymbol{\Sigma}^{-1}(\boldsymbol{\mu} + \mathbf{B}\boldsymbol{\omega})\right)$ 의 점근적 분포는 $p/n \to c \in [0,1)$ 이고 $q/n \to \gamma > 0$ 일 때 $N(0,1)$ 으로 수렴한다.
  • $\mathbf{l}^\top \mathbf{S}^{-1}\mathbf{x}$ 의 점근분산 $\tilde{\sigma}^2$ 는 명시적으로 $\frac{1}{(1-c)^3}\left(\left(\mathbf{l}^\top \boldsymbol{\Sigma}^{-1}(\boldsymbol{\mu} + \mathbf{B}\boldsymbol{\omega})\right)^2 + \mathbf{l}^\top \boldsymbol{\Sigma}^{-1}\mathbf{l}(1 + (\boldsymbol{\mu} + \mathbf{B}\boldsymbol{\omega})^\top \boldsymbol{\Sigma}^{-1}(\boldsymbol{\mu} + \mathbf{B}\boldsymbol{\omega}))\right)$ 로 유도되었다.
  • 몬테카를로 시뮬레이션은 $c = 0.95$ 에서도 $\mathbf{l}^\top \mathbf{S}\mathbf{x}$ 와 $\mathbf{l}^\top \mathbf{S}^{-1}\mathbf{x}$ 의 점근정규근사가 정확함을 확인하여 고차원 환경에서의 강인성을 보여주었다.
  • 이론적 점근분포는 특히 $\boldsymbol{\nu}$ 에 대해 일반화된 비대칭 라플라스분포를 사용할 경우 유한표본에서 약간의 비대칭성을 보였지만, $n$ 과 $p$ 가 증가함에 따라 이 비대칭성은 감소하였다.
  • 제안된 CLT 는 표본공분산행렬의 가역성이 필요로 하지 않아, 고전적 CLT 가 실패하는 특이행렬 및 고차원 환경에 적용 가능하다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.