[논문 리뷰] Performance of Efron and Tibshirani's semiparametric density estimator
본 논문은 Efron and Tibshirani의 준모수적 밀도 추정기에 대한 편향과 분산(따라서 MSE)을 도출하고, 이를 커널 및 다른 준모수적 방법과 비교하며, 다양한 설정에서 성능을 평가한다.
Recently, Efron and Tibshirani (Annals of Statistics, 1996) proposed a semiparametric density estimator, which works by multiplying an initial kernel type estimate with a parametric exponential type correction factor, chosen so as to match certain empirical moments. While Efron and Tibshirani investigate and illustrate many aspects of their method, the basic questions of performance, and comparison with other density estimators, were not directly addressed in their article. The purpose of the present paper is to provide formulae for bias and variance and hence mean squared error for the estimator. This additional insight into the method makes it easy to compare its performance with that of other recently proposed semiparametric constructions. A brief comparison study is carried out here. It indicates that the new method, used with lower order polynomials in the exponential correction term, is often better than the kernel estimator, in a reasonable neighbourhood around the normal distribution, but that its performance as a density estimator is more than equalled by other methods. In particular, the recently developed Hjort and Glad estimator (Annals of Statistics, 1995), using a parametric start times a nonparametric correction, wins in eight out of nine test cases, from the list of such suggested by Wand and Jones (Annals of Statistics, 1992).
연구 동기 및 목표
- Efron and Tibshirani (1996)가 제안한 준모수적 밀도 추정기의 성능을 동기 부여하고 평가한다.
- 커널 및 대안 준모수 추정기와의 비교를 가능하게 하는 편향 및 분산 공식을 제공한다.
- 정규 중심 밀도 및 다른 경쟁 방법과의 관계에서 추정기의 성능을 시각화한다.
- 밀도 추정에서 대역폭 선택 및 추정기 선택에 대한 실용적 함의를 논의한다.
제안 방법
- 준모수적 밀도 추정기를 f(x,β) = f̂0(x) ĉ(β)−1 exp{βᵗ t(x)}로 정형화하고 표준화 상수 ĉ(β)을 유도한다.
- h→0 및 nh→∞ 하에서 E[f̂(x)] 및 Var[f̂(x)]에 대한 중심 결과를 도출하고, E[f̂(x)] = f(x) + (1/2)k2 h^2{f''(x) − f(x)g(x)} + o(h^2) + O(h^2 n^−1) 및 Var[f̂(x)] = (nh)^−1 R(K) f(x) − n^−1 f(x)^2 + O(h n^−1)임을 보여준다.
- x의 정의를 E t''(X) 및 Σ^−1과 관련지어 g(x)를 정의하고 이것이 편향 보정에 어떻게 기여하는지 보여준다.
- 낮은 차수 다항식 t(x) 선택과 다른 추정기들(f̂2, f̂3, f̂4, f̂5, 그리고 커널) 간의 편향 기반 성능 지표를 통해 ET 추정기를 비교한다.
- 다양한 t(x) 함수의 선택(x, (x,x^2), (x,x^2,x^3), (x,log x))이 대역폭 선택에 미치는 영향과 실제적인 논의를 제공한다.
- β̂의 극한 거동과 그것이 추정기의 편향 보정 및 분산에 미치는 영향을 개략적으로 서술한다.
실험 결과
연구 질문
- RQ1Efron and Tibshirani의 준모수적 밀도 추정기가 커널 추정기에 비해 편향을 줄이고 분산을 증가시키지 않는가?
- RQ2h→0 및 nh→∞로 갈 때 추정기의 편향과 분산(및 MSE)은 어떻게 작용하는가?
- RQ3어떤 설정과 어떤 t(x) 선택에서 추정기가 커널 방법이나 다른 준모수적 경쟁자들보다 우수한가?
- RQ4정규성과의 근접성 및 t(x)의 고차다항 보정에서 성능은 어떻게 달라지는가?
주요 결과
- 추정기의 분산은 고려된 차수에서 커널 추정기에 비해 변하지 않는 반면, 편향은 g(x)와 관련된 항을 포함하도록 수정된다.
- 저차 다항식의 경우 편향 항이 정규성에서 소멸하여 정규 밀도 근방에서의 성능이 좋을 것으로 예측되지만 모든 곳에서의 일관된 개선을 보장하지는 않는다.
- 일반적으로 정규 밀도 근방의 이웃에서 커널 추정기에 비해 방법이 개선되지만, 많은 비정규 경우에는 Hjort와 Glad의 f̂3와 같은 일부 경쟁자에 의해 뒤처지는 경우도 있다.
- t(x)의 다항식 차수를 높여도 항상 성능이 향상되지는 않으며, 때로는 추정기 분산으로 인해 저차 विकल्प이 더 나을 수 있다.
- 전반적으로 ET 추정기는 특정 경우에 커널 방법을 능가할 수 있지만 보편적으로 우수하지는 않으며, 실제 밀도가 정규에서 크게 벗어나면 이득이 미미하다.
- 경쟁자들 중에서 간단한 분산 보정(Jones, 1991)과 Hjort–Glad의 곱적 방법이 여러 테스트 밀도에서 자주 매우 좋은 성능을 보인다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.