[论文解读] A comparative review of generalizations of the extreme value distribution
本文综述了极值分布的推广形式,识别出具有灵活偏度、峰度和重尾特性的分布。基于风速数据和蒙特卡洛模拟,研究发现广义极值分布(GEV)以及两个极值分布的混合模型在实际应用中最为合适,因其在灵活性与可识别性之间达到了良好平衡,而其他分布则因过度参数化和不可识别性而受限。
The extreme value distribution, also known as the Gumbel distribution, is widely applied for extreme value analysis but has certain drawbacks in practice because it is a non heavy-tailed distribution and is characterized by constant skewness and kurtosis. Our goal is to present a literature review of the distributions that contain the extreme value distribution embedded in them and to identify those that have flexible skewness and kurtosis and those that are heavy-tailed. The generalizations of the extreme value distribution are described and compared using an application to a wind speed data set and Monte Carlo simulations. We show that some distributions suffer from overparameterization and coincide with other generalized Gumbel distributions with a smaller number of parameters, i.e., are non-identifiable. Our study suggests that the generalized extreme value distribution and a mixture of two extreme value distributions should be considered in practical applications.
研究动机与目标
- 识别能够提供灵活偏度和峰度的极值分布推广形式。
- 评估哪些分布具有重尾特性且适用于极端事件建模。
- 评估参数可识别性,避免极值建模中的过度参数化。
- 通过真实风速数据和蒙特卡洛模拟比较不同分布的性能。
- 为实际应用中的极值分析推荐最实用的分布。
提出的方法
- 系统性回顾将极值分布作为特例包含在内的分布。
- 将广义极值(GEV)分布和两个极值分布的混合模型应用于真实风速数据集。
- 通过蒙特卡洛模拟比较竞争分布的统计行为。
- 通过检查过度参数化模型中的不可识别参数化形式,评估参数可识别性。
- 利用解析表达式和模拟结果评估偏度与峰度的灵活性。
- 基于拟合优度和参数稳定性评估模型性能。
实验结果
研究问题
- RQ1哪些极值分布的推广形式能够实现灵活的偏度和峰度?
- RQ2其中哪些分布表现出适合极端事件建模的重尾特性?
- RQ3与更简单且可识别的替代模型相比,过度参数化模型在统计可靠性方面表现如何?
- RQ4广义极值分布和两个极值分布的混合模型在拟合真实风速数据方面是否优于其他模型?
- RQ5哪些分布因冗余参数而不可识别,以及如何检测此类问题?
主要发现
- 广义极值分布(GEV)提供了灵活的偏度与峰度,并在拟合风速数据方面表现良好。
- 两个极值分布的混合模型提供了更高的灵活性,且在建模复杂极端事件模式方面非常有效。
- 多个提出的推广形式存在过度参数化问题且不可识别,限制了其实际应用。
- 具有恒定偏度与峰度的分布(如原始极值分布)无法充分描述多样的极端事件行为。
- 蒙特卡洛模拟结果证实,GEV和混合模型能够保持稳定的参数估计并优于过度参数化的替代方案。
- 本研究识别出某些分布因与更简单的广义Gumbel形式等价而存在冗余,强调了在模型选择中保持简洁性的重要性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。