Skip to main content
QUICK REVIEW

[논문 리뷰] Spatial hierarchical modeling of threshold exceedances using rate mixtures

Rishikesh Yadav, Raphaël Huser|arXiv (Cornell University)|2019. 12. 10.
Hydrology and Drought Analysis참고 문헌 50인용 수 23
한 줄 요약

이 논문은 일반화된 페어토(GP) 분포를 확장하기 위해 감마-감마 혼합을 사용한 공간 베이지안 계층 모델을 제안한다. 이 모델은 일괄적 및 꼬리 행동을 모두 민감하게 모델링하면서도 점근적 GP 성질을 유지할 수 있도록 한다. 모델은 펆제화된 복잡성 사전분포와 MALA를 통한 효율적 MCMC를 사용하여 고차원 추론을 빠르게 하고, 독일 내 관측되지 않은 위치에서의 극단 강수량에 대한 정확한 공간 예측을 가능하게 한다.

ABSTRACT

We develop new flexible univariate models for light-tailed and heavy-tailed data, which extend a hierarchical representation of the generalized Pareto (GP) limit for threshold exceedances. These models can accommodate departure from asymptotic threshold stability in finite samples while keeping the asymptotic GP distribution as a special (or boundary) case and can capture the tails and the bulk jointly without losing much flexibility. Spatial dependence is modeled through a latent process, while the data are assumed to be conditionally independent. Focusing on a gamma-gamma model construction, we design penalized complexity priors for crucial model parameters, shrinking our proposed spatial Bayesian hierarchical model toward a simpler reference whose marginal distributions are GP with moderately heavy tails. Our model can be fitted in fairly high dimensions using Markov chain Monte Carlo by exploiting the Metropolis-adjusted Langevin algorithm (MALA), which guarantees fast convergence of Markov chains with efficient block proposals for the latent variables. We also develop an adaptive scheme to calibrate the MALA tuning parameters. Moreover, our model avoids the expensive numerical evaluations of multifold integrals in censored likelihood expressions. We demonstrate our new methodology by simulation and application to a dataset of extreme rainfall events that occurred in Germany. Our fitted gamma-gamma model provides a satisfactory performance and can be successfully used to predict rainfall extremes at unobserved locations.

연구 동기 및 목표

  • 유한 표본에서 점근적 안정성에서 벗어나는 경우를 수용할 수 있도록 일반화된 페어토(GP) 분포를 확장하는 민감한 단변량 모델을 개발하는 것.
  • 임의의 임계값 선택이 필요 없이 극단 강수량 데이터의 일괄 및 꼬리 부분을 동시에 모델링하는 것.
  • 잠재적인 가우시안 과정를 통해 공간적 의존성을 포함하면서도 원하는 주변 분포를 유지하여 극단 사건의 공간 예측을 가능하게 하는 것.
  • 중간 무거운 尾 꼬리 무게를 가진 참조 GP 모델 쪽으로 모델을 수축시키는 편리한 복잡성 사전분포를 설계하는 것.
  • 메트로폴리스 조정 랑제 방식(MALA)을 사용하여 고차원 설정에서 효율적인 베이지안 추론을 가능하게 하여, 캐시드 가능도에서 비용이 많이 드는 다중 적분을 피하는 것.

제안 방법

  • 임계값 초과에 대해 계층적 감마-감마 혼합 모델을 제안하며, GP 분포의 척도 매개변수를 감마 분포로 표현된 잠재 변수에 의해 확률적으로 이끄는 방식이다.
  • 공간적 의존성을 모델링하기 위해 마테르니 공분산을 가진 잠재 공간 과정를 사용하며, 데이터는 잠재 필드가 주어진 조건 하에서 조건부 독립이 된다.
  • 형태 및 척도 등의 핵심 매개변수에 편리한 복잡성 사전분포를 적용하여 참조 GP 모델 쪽으로 안정적인 수축을 보장한다.
  • 특히 고차원 잠재 변수에 대해 효율적인 MCMC 샘플링을 위해 적응형 튜닝을 적용한 메트로폴리스 조정 랑제 방식(MALA)을 사용한다.
  • 캐시드 가능도에서의 비용이 많이 드는 수치적 적분을 피하기 위해 데이터 증강 기법을 적용하여 계산의 확장성을 향상시킨다.
  • 이중 단계 모델링 접근법을 구현한다: 먼저 로지스틱 회귀를 통해 공간적 극단 사건 발생 여부를 모델링하고, 그 다음에 공간 감마-감마 모델을 사용해 강수량 강도를 모델링한다.

실험 결과

연구 질문

  • RQ1계층적 감마-감마 모델은 임의의 임계값 선택에 의존하지 않고 극단 강수량의 일괄 및 꼬리 행동을 더 잘 포착하기 위해 일반화된 페어토 분포를 확장할 수 있는가?
  • RQ2공간적 의존성을 효과적으로 모델링하면서도 유연한 주변 분포를 유지하고 효율적인 추론을 가능하게 할 수 있는가?
  • RQ3제안된 편리한 복잡성 사전분포 구조는 모델의 강건성과 의미 있는 参照 모델 쪽으로의 수축을 어느 정도 향상시키는가?
  • RQ4적응형 튜닝을 적용한 MALA 기반 MCMC는 캐시드 임계값 초과 모델에서 고차원 잠재 공간 필드를 효율적으로 처리할 수 있는가?
  • RQ5기존 모델들과 비교해 볼 때, 모델은 관측되지 않은 위치에서의 극단 강수량 강도를 얼마나 잘 예측하는가?

주요 결과

  • 감마-감마 모델(D1)은 관측되지 않은 위치에서의 극단 강수량에 대해 가장 우수한 예측 성능을 보였으며, 대부분의 위치에서 경험적 분포와 예측된 분위수 간의 일치가 양호함을 QQ-플롯이 확인했다.
  • 예측 위치 3에서 D1은 약간 극단 분위수를 과소평가했지만, 낮은 분위수에서 높은 분위수까지 전반적으로 만족스러운 성능을 유지했다.
  • 지수-감마 모델(D3 및 D4)은 상당히 열 劣한 성능을 보였으며, 이는 계층적 구성에서 선택된 비모수적 형태의 중요성을 시사한다.
  • D1의 사후 예측 박스플롯은 예측 위치에서 경험적 분포와 매우 유사했지만, 略로 높은 변동성을 보였으며, 이는 모델이 자연스러운 변동성을 잘 포착하고 있음을 확인한다.
  • 적응형 튜닝을 적용한 MALA를 사용함으로써 고차원 설정에서 빠른 수렴과 효율적인 샘플링이 가능했으며, 캐시드 데이터가 있는 경우에도 유사하게 성능을 유지했다.
  • 이중 단계 모델링 접근법—먼저 로지스틱 회귀로 공간적 극단 사건 발생 여부를 모델링하고, 그 다음에 공간 감마-감마 모델로 강도를 모델링하는 방식—은 계산 부담을 줄이고 확장성을 향상시켰다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.