Skip to main content
QUICK REVIEW

[论文解读] Spatial hierarchical modeling of threshold exceedances using rate mixtures

Rishikesh Yadav, Raphaël Huser|arXiv (Cornell University)|Dec 10, 2019
Hydrology and Drought Analysis参考文献 50被引用 23
一句话总结

本文提出一种用于极端降雨事件的时空贝叶斯分层模型,采用伽马-伽马混合分布扩展广义帕累托(GP)分布,从而在保持渐近GP特性的同时,灵活建模数据的主体与尾部分布。该模型采用惩罚复杂性先验,并通过MALA实现高效马尔可夫链蒙特卡洛(MCMC)方法,实现高维空间下快速推理,并准确预测德国未观测位置的极端降水。

ABSTRACT

We develop new flexible univariate models for light-tailed and heavy-tailed data, which extend a hierarchical representation of the generalized Pareto (GP) limit for threshold exceedances. These models can accommodate departure from asymptotic threshold stability in finite samples while keeping the asymptotic GP distribution as a special (or boundary) case and can capture the tails and the bulk jointly without losing much flexibility. Spatial dependence is modeled through a latent process, while the data are assumed to be conditionally independent. Focusing on a gamma-gamma model construction, we design penalized complexity priors for crucial model parameters, shrinking our proposed spatial Bayesian hierarchical model toward a simpler reference whose marginal distributions are GP with moderately heavy tails. Our model can be fitted in fairly high dimensions using Markov chain Monte Carlo by exploiting the Metropolis-adjusted Langevin algorithm (MALA), which guarantees fast convergence of Markov chains with efficient block proposals for the latent variables. We also develop an adaptive scheme to calibrate the MALA tuning parameters. Moreover, our model avoids the expensive numerical evaluations of multifold integrals in censored likelihood expressions. We demonstrate our new methodology by simulation and application to a dataset of extreme rainfall events that occurred in Germany. Our fitted gamma-gamma model provides a satisfactory performance and can be successfully used to predict rainfall extremes at unobserved locations.

研究动机与目标

  • 开发灵活的单变量模型,扩展广义帕累托(GP)分布以处理阈值超限数据,适应有限样本中渐近稳定性偏离的情况。
  • 联合建模极端降水数据的主体与尾部分布,同时不损失灵活性,避免对阈值选择的任意性。
  • 通过潜变量高斯过程引入空间依赖性,同时保持理想的边缘分布,实现极端事件的空间预测。
  • 设计惩罚复杂性先验,使模型向具有中等厚尾特性的简化GP参考模型收缩。
  • 利用马尔可夫链蒙特卡洛(MALA)实现高维设置下的高效贝叶斯推理,避免右删失似然函数中昂贵的多重积分。

提出的方法

  • 提出一种用于阈值超限的分层伽马-伽马混合模型,其中GP分布的尺度参数由一个服从伽马分布的潜变量随机驱动。
  • 使用具有马尔可夫(Matérn)协方差的空间潜过程来建模空间依赖性,同时在给定潜变量场的条件下,观测数据条件独立。
  • 对关键参数(如形状和尺度)应用惩罚复杂性先验,确保向具有中等尾重特性的参考GP模型稳健收缩。
  • 采用自适应调优的马尔可夫链蒙特卡洛(MALA)算法进行高效MCMC抽样,尤其适用于高维潜变量。
  • 通过数据增广技术规避右删失似然函数中的昂贵数值积分,提升计算可扩展性。
  • 实施两步建模方法:首先通过逻辑回归建模空间极端事件的发生,然后通过空间伽马-伽马模型建模强度。

实验结果

研究问题

  • RQ1分层伽马-伽马模型能否在不依赖任意阈值选择的前提下,有效扩展广义帕累托分布,以更好地捕捉极端降雨的主体与尾部分布?
  • RQ2如何在保持灵活边缘分布的同时,有效建模极端降雨事件的空间依赖性,并实现高效推理?
  • RQ3所提出的惩罚复杂性先验结构在多大程度上提升了模型的稳健性并实现向有意义参考模型的收缩?
  • RQ4基于MALA的MCMC方法结合自适应调优,能否高效处理右删失阈值超限模型中的高维潜空间场?
  • RQ5与替代模型相比,该模型在未观测位置预测极端降雨强度方面的表现如何?

主要发现

  • 伽马-伽马模型(D1)在未观测位置的极端降雨预测中表现出最佳整体性能,QQ图显示大多数站点的经验与预测分位数之间具有良好一致性。
  • 模型D1在预测站点3处对极端分位数有轻微低估,但整体在低至高分位数范围内表现仍令人满意。
  • 指数-伽马模型(D3和D4)表现显著更差,表明分层构造中参数形式选择的重要性。
  • D1的后验预测箱线图在预测站点处与经验分布高度吻合,尽管变异性略高,证实了模型捕捉自然变异性能力。
  • 采用自适应调优的MALA方法实现了快速收敛与高效抽样,即使在右删失数据的高维设置下亦表现良好。
  • 两步建模方法——首先通过逻辑回归建模空间极端事件的发生,再通过空间伽马-伽马模型建模强度——降低了计算负担并提升了可扩展性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。