Skip to main content
QUICK REVIEW

[论文解读] Predicting Weather Uncertainty with Deep Convnets

Peter Grönquist, Tal Ben‐Nun|arXiv (Cornell University)|Nov 2, 2019
Meteorological Phenomena and Simulations被引用 7
一句话总结

本文提出使用三维卷积神经网络(Convnets)通过从少量数值天气模拟中学习,以极低的计算成本预测天气预报不确定性。通过改进三维U-Net架构并引入空间和时间动态,该模型仅使用一次未扰动模拟即可实现与五个集合轨迹相当的离散度估计精度,显著减少了对大规模集合模拟的需求。

ABSTRACT

Modern weather forecast models perform uncertainty quantification using ensemble prediction systems, which collect nonparametric statistics based on multiple perturbed simulations. To provide accurate estimation, dozens of such computationally intensive simulations must be run. We show that deep neural networks can be used on a small set of numerical weather simulations to estimate the spread of a weather forecast, significantly reducing computational cost. To train the system, we both modify the 3D U-Net architecture and explore models that incorporate temporal data. Our models serve as a starting point to improve uncertainty quantification in current real-time weather forecasting systems, which is vital for predicting extreme events.

研究动机与目标

  • 通过用深度学习替代大规模集合系统,减少数值天气预报(NWP)中不确定性量化带来的计算负担。
  • 探索深度学习模型是否能仅通过少量模拟(包括一次未扰动轨迹)准确估计预报离散度。
  • 评估3D U-Net和混合架构(如CNN-LSTM)在建模多压力层大气数据中空间与时间依赖关系方面的有效性。
  • 评估使用深度学习近似完整集合离散度在实时天气预报中的可行性。

提出的方法

  • 采用带有残差跳跃连接的3D U-Net架构,以在不同气压层和网格点间保留空间信息。
  • 引入仿射卷积以建模多个大气参数和气压层之间的空间关系。
  • 探索使用CNN-LSTM架构进行时间建模,基于先前时间步预测未来时间步(t = 3h, 6h)的预报离散度。
  • 在ERA5再分析数据(2000–2011年)上训练模型,使用2010–2011年作为测试集,并采用80/20划分进行训练/验证,通过打乱数据避免时间偏差。
  • 采用分布式数据并行训练以处理高分辨率全球数据,并计划扩展至流水线并行和模型并行以提升可扩展性。
  • 对输入数据(温度、风速、湿度等)在7个气压层和40×136个空间网格点上进行标准化处理,以TFRecord格式保存,以实现高效训练。

实验结果

研究问题

  • RQ1仅基于一次未扰动模拟训练的深度学习模型,能否以高精度近似大规模集合预报系统的离散度?
  • RQ23D U-Net和混合CNN-LSTM架构在建模大气不确定性空间与时间动态方面的有效性如何?
  • RQ3在仅依赖模型架构的基础上,引入初始参数(如风速、湿度)是否能提升离散度估计性能?
  • RQ4随着输入轨迹数量的增加,模型性能如何变化?是否趋近于完整集合的精度?
  • RQ5与运行多个完整NWP模拟相比,使用深度学习进行不确定性量化具有何种计算优势?

主要发现

  • 仅使用一次未扰动轨迹的基线3D U-Net模型,其离散度估计精度与四个扰动集合成员相当。
  • 通过多层输入处理引入空间效应后,性能达到与五个集合轨迹相当的水平,匹配ERA5集合规模的一半。
  • 加入时间建模后,t = 6h的预测性能得到提升,表明时间动态在不确定性估计中具有重要价值。
  • 在ENS10数据集(10个成员集合)上,模型在输入轨迹超过五个后性能提升趋缓,表明由于集合规模较小,模型已出现饱和。
  • 该模型在单张V100 GPU上实现七层气压和一个大气参数的2天预报耗时约15毫秒,而Cray XC40超算运行51个成员集合需约1小时。
  • 尽管略有改善,但输入初始参数对性能的提升不如网络架构设计显著,表明模型结构在预测性能中起主导作用。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。