[論文レビュー] Performance of Efron and Tibshirani's semiparametric density estimator
この論文は、Efron and Tibshiraniの半パラメトリック密度推定量のバイアスと分散(従ってMSE)を導出し、カーネル法や他の半パラメトリック法と比較し、さまざまな設定での性能を評価する。
Recently, Efron and Tibshirani (Annals of Statistics, 1996) proposed a semiparametric density estimator, which works by multiplying an initial kernel type estimate with a parametric exponential type correction factor, chosen so as to match certain empirical moments. While Efron and Tibshirani investigate and illustrate many aspects of their method, the basic questions of performance, and comparison with other density estimators, were not directly addressed in their article. The purpose of the present paper is to provide formulae for bias and variance and hence mean squared error for the estimator. This additional insight into the method makes it easy to compare its performance with that of other recently proposed semiparametric constructions. A brief comparison study is carried out here. It indicates that the new method, used with lower order polynomials in the exponential correction term, is often better than the kernel estimator, in a reasonable neighbourhood around the normal distribution, but that its performance as a density estimator is more than equalled by other methods. In particular, the recently developed Hjort and Glad estimator (Annals of Statistics, 1995), using a parametric start times a nonparametric correction, wins in eight out of nine test cases, from the list of such suggested by Wand and Jones (Annals of Statistics, 1992).
研究の動機と目的
- Efron and Tibshirani (1996) が提案した半パラメトリック密度推定量の性能を動機づけ、評価する。
- カーネル法および代替半パラメトリック推定量との比較を可能にするバイアスと分散の式を提供する。
- 正規中心の密度および他の競合法に対する推定量の性能を illustrating する。
- 密度推定における帯域幅の選択と推定量選択の実務的影響を論じる。
提案手法
- 半パラメトリック密度推定量を f(x,β) = f̂0(x) ĉ(β)−1 exp{βᵗ t(x)} と形式化し、正規化定数 ĉ(β) を導出する。
- h→0 および nh→∞ の条件下で E[f̂(x)] と Var[f̂(x)] の中心的結果を導出し、E[f̂(x)] = f(x) + (1/2)k2 h^2{f''(x) − f(x)g(x)} + o(h^2) + O(h^2 n^−1) および Var[f̂(x)] = (nh)^−1 R(K) f(x) − n^−1 f(x)^2 + O(h n^−1) を示す。
- g(x) を E t''(X) と Σ^−1 の観点で定義し、それがバイアス修正を支配する様子を示す。
- ET推定量を低次多項式 t(x) の選択と他の推定量(f̂2, f̂3, f̂4, f̂5, およびカーネル)と、バイアスベースの性能指標を用いて比較する。
- t(x) 関数の異なる選択(例えば x, (x,x^2), (x,x^2,x^3), (x,log x))の帯域幅選択と影響についての実務的な議論を提供する。
- β̂ の極限挙動と、それが推定量のバイアス補正と分散に及ぼす影響の概要を示す。
実験結果
リサーチクエスチョン
- RQ1Efron and Tibshirani の半パラメトリック密度推定量は、カーネル推定量と比較して分散を膨張させずにバイアスを低減できるか。
- RQ2h→0 および nh→∞ のとき、推定量のバイアスと分散(および MSE)はどうなるか。
- RQ3どの設定で、どの t(x) の選択で、推定量はカーネル法や他の半パラメトリック競合より優れているか。
- RQ4正規性への近さや t(x) の高次多項式補正との関係で、性能はどのように変化するか。
主な発見
- 推定量の分散は、検討された次数においてカーネル推定量と比較して変わらず、バイアスは g(x) を含む項を含むように修正される。
- 低次多項式の場合、正規性のときバイアス項が消失し、正規密度付近では性能が良いことを予測する一方、すべての点で一様な改善にはならない。
- 正規密度の近傍ではカーネル推定量よりも方法が改善することが多いが、多くの非正規ケースでは Hjort and Glad の f̂3 を筆頭に一部の競合に劣る。
- t(x) の多項式次数を上げても必ずしも性能が向上するわけではなく、推定量の分散のために低次オプションが良い場合がある。
- 全体として、ET推定量は場合によってはカーネル法より優れることがあるが、普遍的に優越ではなく、真の密度が正規から大きく外れると利得は控えめである。
- 競合の中で、単純な分散補正(Jones, 1991)や Hjort–Glad の乗法法が、いくつかのテスト密度で頻繁に非常に良く機能する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。