[論文レビュー] Estimating Number of Factors by Adjusted Eigenvalues Thresholding
本稿では、標本相関行列の固有値を活用して高次元要因モデルにおける共通要因の数を推定する新しい手法である調整付き相関閾値化(ACT)を提案する。ランダム行列理論を用いて上位固有値のバイアスおよび推定誤差を補正し、やや厳しい条件下でも、母集団相関行列における1より大きい固有値の数が共通要因の数に等しくなることを示し、共分散ベースの手法よりも高い精度を達成する。
Determining the number of common factors is an important and practical topic in high dimensional factor models. The existing literatures are mainly based on the eigenvalues of the covariance matrix. Due to the incomparability of the eigenvalues of the covariance matrix caused by heterogeneous scales of observed variables, it is very difficult to give an accurate relationship between these eigenvalues and the number of common factors. To overcome this limitation, we appeal to the correlation matrix and show surprisingly that the number of eigenvalues greater than $1$ of population correlation matrix is the same as the number of common factors under some mild conditions. To utilize such a relationship, we study the random matrix theory based on the sample correlation matrix in order to correct the biases in estimating the top eigenvalues and to take into account of estimation errors in eigenvalue estimation. This leads us to propose adjusted correlation thresholding (ACT) for determining the number of common factors in high dimensional factor models, taking into account the sampling variabilities and biases of top sample eigenvalues. We also establish the optimality of the proposed methods in terms of minimal signal strength and optimal threshold. Simulation studies lend further support to our proposed method and show that our estimator outperforms other competing methods in most of our testing cases.
研究の動機と目的
- 観測変数のスケールが不均一であるため、共分散ベースの要因推定手法が失敗するという限界を解消すること。
- 母集団相関行列における1より大きい固有値の数と真の共通要因数の数との間の理論的関連を確立すること。
- ランダム行列理論を用いて、標本相関行列の上位固有値におけるバイアスおよび推定誤差を補正する手法を開発すること。
- 高次元要因モデルにおける共通要因数を特定するための新しい、より信頼性の高い推定量—調整付き相関閾値化(ACT)—を提案すること。
提案手法
- 母集団相関行列に基づくもので、やや厳しい正則性条件下では、1より大きい固有値の数が共通要因数に等しくなる。
- 標本相関行列にランダム行列理論を適用し、最大固有値の推定におけるバイアスを補正する。
- 標本誤差および推定誤差を考慮した調整済み固有値に基づく閾値化ルールを用いる。
- スケール不変性を確保するため、標本共分散行列の代わりに標本相関行列を用いる。
- 次元および標本サイズがともに増大する高次元設定下で、上位固有値の漸近的分布を導出する。
- 最終的な推定量であるACTは、補正済み閾値を超える調整済み固有値の個数として要因数を選択する。
実験結果
リサーチクエスチョン
- RQ1やや厳しい条件下で、母集団相関行列における1より大きい固有値の数が、共通要因数に等しいか?
- RQ2ランダム行列理論を用いて、相関行列の上位標本固有値におけるバイアスおよび推定誤差を補正できるか?
- RQ3提案手法ACTは、既存の共分散ベースの手法と比較して、精度および一貫性において優れているか?
- RQ4高次元データにおける観測変数のスケールの不均一性に対して、本手法は頑健か?
- RQ5静的および動的要因モデルの両方において、真の要因数を信頼性高く検出できるか?
主な発見
- やや厳しい正則性条件下では、母集団相関行列における1より大きい固有値の数が、共通要因数に正確に等しい。
- シミュレーションスタディにおいて、ON、ED、ER、GRといった既存手法と比較して、ACT手法は特に変数スケールが不均一な状況下で顕著に優れている。
- Fama-Frenchおよびモーメンタム要因を用いた実証的応用において、金融危機前後ともに3要因を正しく同定しており、主成分空間と整合的である。
- 3要因を選択した際、決定係数R²が非常に高く(例:全変動の85.90%を説明)、要因空間と真の要因空間との距離が最小限(危機後:‖PA−PB‖₂ = 0.406)に保たれている。
- 射影行列のノルムから、Fama-French要因と主成分要因が生成する空間が非常に一致しており、危機後におけるフロベニウスノルム差は0.708であった。
- モーメンタム要因は主成分によって十分に説明されていないため、ACTが要因構造におけるその支配的でない性質を正しく同定していることが示された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。