Skip to main content
QUICK REVIEW

[论文解读] Small area estimation of dependent extreme value indices

Koki Momoki, Takuma Yoshida|arXiv (Cornell University)|Jan 7, 2026
Hydrology and Drought Analysis被引用 0
一句话总结

论文提出一种带相关随机效应的混合效应模型,在多区域中共同估计Pareto型尾部指数(EVIs),通过借助信息提升POT分析中各区域的EVI估计。

ABSTRACT

In extreme value analysis, tail behavior of a heavy-tailed data distribution is modeled by a Pareto-type distribution in which the so-called extreme value index (EVI) controls the tail behavior. For heavy-tailed data obtained from multiple population subgroups, or areas, this study efficiently predicts the EVIs of all areas using information among areas. For this purpose, we propose a mixed effects model, which is a useful approach in small area estimation. In this model, we represent differences among areas in the EVIs by latent variables called random effects. Using correlated random effects across areas, we incorporate the relations among areas into the model. The obtained model achieves simultaneous prediction of EVIs of all areas. Herein, we describe parameter estimation and random effect prediction in the model, and clarify theoretical properties of the estimator. Additionally, numerical experiments are presented to demonstrate the effectiveness of the proposed method. As an application of our model, we provide a risk assessment of heavy rainfall in Japan.

研究动机与目标

  • 需要在本地数据有限时,说明为何需要在多区域估计极端值指数(EVIs)。
  • 开发一个混合效应POT框架,使区域特定的EVIs能够通过相关随机效应相连。
  • 提供EVIs在各区域的估计(最大似然)和预测(条件众数)程序。
  • 在区域数量和每个区域观测数增加的条件下,建立估计量的渐近性质。
  • 通过仿真和日本降雨风险应用,展示性能提升。

提出的方法

  • 通过 Pareto 型尾部建模 EVIs,其中 gamma_j = exp(mu + v_j) ,v_j 为相关随机效应。
  • 假设 V = (V_1,...,V_J) ~ N_J(0, sigma^2 D) ,具有已知相关矩阵 D 以编码区域间关系。
  • 使用峰值超越阈值(POT)并带 Pareto 型尾部来形成阈值超越的似然(通过Pareto 密度近似)。
  • 通过近似最大似然估计,把随机效应作为潜变量并对其积分来估计(mu, sigma^2)。
  • 给定观测到的超越值,通过最大化条件联合密度(模式)来预测随机效应;得到预测的EVIs为 tilde_gamma_j = exp(mu + tilde_v_j)。
  • 提供一个用于拟合该模型的 R/TMB 实现说明。

实验结果

研究问题

  • RQ1在个体区域样本较小时,如何利用多区域信息来提升 EVI 的估计?
  • RQ2将相关随机效应引入对区域特定 EVIs 的准确性和精确性有何影响?
  • RQ3一个统一的混合效应 POT 框架是否能对大量区域同时产生可靠的预测?
  • RQ4在区域数量增加时,提出的估计量的理论性质(一致性、渐近正态性)是什么?
  • RQ5不同的区域间相关矩阵 D 的设定如何在仿真和真实数据中影响性能?

主要发现

  • 提出的相关随机效应 POT 模型在多组仿真中相比区域逐一的 Hill 估计,能改善区域级 EVI 的估计。
  • 恰当结构化的相关矩阵 D 可以在独立随机效应或单位矩阵 D 情况下显著降低均方误差。
  • 渐近理论表明 mu 估计量在 sqrt-consistent,速率依赖于 D,sigma^2 具有 sqrt(J) 的速率,且在给定条件下建立了渐近正态性。
  • 增加区域数量 J 并利用区域间相关可以收紧估计方差,潜在地优于孤立区域分析。
  • 仿真显示 D 可以基于空间距离或尾部依赖性考量构造,从而在相关区域之间借力。
  • 将方法应用于日本降雨数据,使用所提方法时尾部风险预测更稳定、可解释性更强,与区域逐一估计相比。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。