Skip to main content
QUICK REVIEW

[論文レビュー] Optimal Rates of Convergence for Latent Generalized Correlation Matrix Estimation in Transelliptical Distribution

Fang Han, Han Liu|arXiv (Cornell University)|May 29, 2013
Random Matrices and Applications参考文献 34被引用数 25
ひとこと要約

本稿は、変換されたケンドールのtau行列を用いて、潜在的なピアソン積率相関行列を推定するランクベースの相関行列推定量の収束速度の最適レートを、変換楕円分布族のもとで確立する。スペクトルノルムおよび制限付きスペクトルノルムの両方において、モーメント条件を要せず最適収束が保証され、有効ランクと、新規の符号サブガウス条件が解析の鍵をなす。

ABSTRACT

Correlation matrix plays a key role in many multivariate methods (e.g., graphical model estimation and factor analysis). The current state-of-the-art in estimating large correlation matrices focuses on the use of Pearson's sample correlation matrix. Although Pearson's sample correlation matrix enjoys various good properties under Gaussian models, its not an estimator when facing heavy-tail distributions with possible outliers. As a robust alternative, \cite{han2012transelliptical} advocated the use of a transformed version of the Kendall's tau sample correlation matrix in estimating high dimensional latent generalized correlation matrix under the transelliptical distribution family (or elliptical copula). The transelliptical family assumes that after unspecified marginal monotone transformations, the data follow an elliptical distribution. In this paper, we study the theoretical properties of the Kendall's tau sample correlation matrix and its transformed version proposed in \cite{han2012transelliptical} for estimating the population Kendall's tau correlation matrix and the latent Pearson's correlation matrix under both spectral and restricted spectral norms. With regard to the spectral norm, we highlight the role of effective rank in quantifying the rate of convergence. With regard to the restricted spectral norm, we for the first time present a sign subgaussian condition which is sufficient to guarantee that the rank-based correlation matrix estimator attains the optimal rate of convergence. In both cases, we do not need any moment condition.

研究の動機と目的

  • 変換楕円分布族の下で、高次元設定における変換ケンドールのtau相関行列推定量の理論的性質を検討すること。
  • スペクトルノルムおよび制限付きスペクトルノルムの両方において、潜在的な一般化相関行列の推定における最適収束レートを確立すること。
  • 特に、符号サブガウス条件という新たな正則性条件を同定し、モーメント仮定を必要とせずに最適収束を保証すること。
  • スペクトルノルムの下で収束速度を決定づける有効ランクの役割を定量化すること。
  • 重い裾・外れ値に強いデータ環境におけるピアソン相関行列の代替としてのロバスト性を提供すること。

提案手法

  • 本稿は、変換楕円モデルの下で、標本ケンドールのtau相関行列を母集団ケンドールのtau相関行列のロバスト推定量として分析する。
  • 有効ランクの概念を導入し、母集団相関構造の複雑さを測定することで、スペクトルノルムにおける収束レートを導出する。
  • 制限付きスペクトルノルムの下では、最適推定性能を保証するための新しい符号サブガウス条件を導入する。
  • ランクに基づく依存度測度と分布フリーな漸近的近似に依存することで、いかなるモーメント条件も回避する。
  • ランク統計に特化した濃縮不等式と行列摂動理論を用いて、理論的保証を導出する。
  • 非パラメトリックな周辺変換を許容するフレームワークを提供し、単調変換が不明なデータから潜在的なピアソン相関行列を推定可能にする。

実験結果

リサーチクエスチョン

  • RQ1変換楕円モデル下で、ランクベース手法を用いて潜在的な一般化相関行列を推定する際の最適収束レートは何か?
  • RQ2高次元設定において、スペクトルノルムの下で有効ランクは収束速度にどのように影響するか?
  • RQ3制限付きスペクトルノルムの下で、ランクベース推定量の最適収束を保証するのに十分な条件は何か?
  • RQ4有限モーメントを仮定しない状況でも、変換ケンドールのtau推定量は最適レートに到達可能か?
  • RQ5符号サブガウス条件は、制限付きスペクトルノルムの下で最適収束を保証するために十分か?

主な発見

  • 変換ケンドールのtau推定量は、スペクトルノルムの下で最適収束レートに到達し、そのレートは母集団相関行列の有効ランクに依存する。
  • 制限付きスペクトルノルムの下では、本稿は符号サブガウス条件が最適収束を保証するのに十分であることを同定するが、モーメント仮定は不要である。
  • 解析により、収束結果にモーメント条件を要しないことが示され、重い裾や汚染されたデータに対してもロバストであることが保証される。
  • スペクトルノルムの下で収束速度を定量化するうえで、有効ランクが重要なパラメータとして浮き彫りになる。これは相関構造の内因的次元性を反映する。
  • 本稿の推定量は、非正規的尾部に強い重い尾部や外れ値に強い状況において、標本ピアソン相関行列を上回る性能を示す。
  • 理論的枠組みにより、楕円的および変換楕円的モデル下での高次元グラフィカルモデリングおよび要因分析におけるランクベース手法の使用に、きめ細かな理論的基盤を提供する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。