Skip to main content
QUICK REVIEW

[論文レビュー] Homoscedasticity tests valid in both low and high-dimensional regressions

Zhaoyuan Li, Jianfeng Yao|arXiv (Cornell University)|Oct 1, 2015
Random Matrices and Applications参考文献 26被引用数 2
ひとこと要約

本稿では、自由度が大きくなるにつれて帰無仮説の下で漸近的に正規分布に従う2つの新しい不純分散検定を提案する。この検定は、低次元および高次元回帰設定の両方をカバーしており、White検定やBreusch-Pagan検定といった従来の手法と比較して、より優れたパワーとサイズを実現する。

ABSTRACT

Testing heteroscedasticity of the errors is a major challenge in high-dimensional regressions where the number of covariates is large compared to the sample size. Traditional procedures such as the White and the Breusch-Pagan tests typically suffer from low sizes and powers. This paper proposes two new test procedures based on standard OLS residuals. Using the theory of random Haar orthogonal matrices, the asymptotic normality of both test statistics is obtained under the null when the degree of freedom tends to infinity. This encompasses both the classical low-dimensional setting where the number of variables is fixed while the sample size tends to infinity, and the proportional high-dimensional setting where these dimensions grow to infinity proportionally. These procedures thus offer a wide coverage of dimensions in applications. To our best knowledge, this is the first procedures in the literature for testing heteroscedasticity which are valid for medium and high-dimensional regressions. The superiority of our proposed tests over the existing methods are demonstrated by extensive simulations and by several real data analyses as well.

研究の動機と目的

  • 標本サイズに比べて説明変数の数が多い高次元設定において、White検定やBreusch-Pagan検定といった古典的不純分散検定の性能が著しく劣化する問題を解決すること。
  • 低次元および高次元の漸近的枠組みの両方で、正しいサイズと高いパワーを維持する検定手順を開発すること。
  • 自由度(説明変数の数に関連)が無限大に近づく際、帰無仮説の下で検定統計量の漸近的正規性を確立すること。
  • 標本サイズと説明変数の数が比例して無限大に近づく比例的高次元設定においても有効な統一的な枠組みを提供すること。
  • 中~高次元回帰文脈において形式的に有効である最初の不純分散検定を提供すること。

提案手法

  • 提案手法は、通常最小二乗法(OLS)の残差を用いて、帰無仮説(等分散性)の下で漸近的に正規分布に従う検定統計量を構築する。
  • 理論的裏付けは、ランダムなハール直交行列の理論に基づき、検定統計量の漸近的分布を導出する。
  • 自由度(説明変数の数に関連)が無限大に近づく際の漸近的正規性が、固定pおよび比例的pの両設定で確立される。
  • 検定統計量は設計行列の次元に強く依存しないように構築されており、高次元回帰の状況にも適用可能である。
  • 誤差項に第二モーメント以上の分布的仮定を必要とせず、一般性が向上する。
  • この手法は、低次元および高次元の両方の枠組みで、正確なサイズと高いパワーを維持するように設計されており、p/n → c ∈ (0, ∞) の設定にも適用可能である。

実験結果

リサーチクエスチョン

  • RQ1p/n → c ∈ (0, ∞) である高次元回帰設定において、正しいサイズと高いパワーを維持する不純分散検定を開発することは可能か?
  • RQ2説明変数の数が標本サイズとともに増加する際、帰無仮説の下で不純分散検定統計量の漸近的正規性を導出することは可能か?
  • RQ3提案手法の検定は、幅広い次元設定において、White検定やBreusch-Pagan検定と比較してサイズおよびパワーの面で優れているか?
  • RQ4特にハール直交行列の理論を含むランダム行列理論を用いて、OLSに基づく不純分散検定の漸近的分布を正当化することは可能か?
  • RQ5本稿の検定は、低次元および高次元回帰フレームワークの両方で形式的に有効である最初のものであるか?

主な発見

  • 自由度が無限大に近づく際、帰無仮説の下で提案手法の検定統計量は漸近的に正規分布に従うことが確認され、低次元および高次元の両方の漸近的枠組みをカバーする。
  • 標本サイズと説明変数の数が比例して無限大に近づく比例的高次元設定においても、検定は有効である。
  • 広範なシミュレーションにより、提案手法はWhite検定やBreusch-Pagan検定といった従来手法よりも、さまざまな次元設定においてサイズとパワーの両面で優れていることが示された。
  • 古典的手法が深刻なサイズの歪みを示す高次元設定でも、提案手法は正確なサイズを維持している。
  • 実データ解析により、既存の代替手法と比較して提案手法の優れた経験的性能がさらに裏付けられた。
  • 著者らの知る限り、本稿は、低次元および高次元回帰設定の両方で形式的に有効である最初の不純分散検定のセットである。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。