Skip to main content
QUICK REVIEW

[论文解读] A data-driven approach to precipitation parameterizations using convolutional encoder-decoder neural networks

Pablo Larraondo, Luigi J. Renzullo|arXiv (Cornell University)|Mar 25, 2019
Meteorological Phenomena and Simulations被引用 25
一句话总结

本文提出一种数据驱动方法,利用卷积编码器-解码器神经网络仅从大地位势高度估计总降水量,表明这些模型能够以高精度学习大气场中的复杂空间关系。该方法优于传统机器学习模型,并识别出对降水量预测最具影响力的若干大气层次。

ABSTRACT

Numerical Weather Prediction (NWP) models represent sub-grid processes using parameterizations, which are often complex and a major source of uncertainty in weather forecasting. In this work, we devise a simple machine learning (ML) methodology to learn parameterizations from basic NWP fields. Specifically, we demonstrate how encoder-decoder Convolutional Neural Networks (CNN) can be used to derive total precipitation using geopotential height as the only input. Several popular neural network architectures, from the field of image processing, are considered and a comparison with baseline ML methodologies is provided. We use NWP reanalysis data to train different ML models showing how encoder-decoder CNNs are able to interpret the spatial information contained in the geopotential field to infer total precipitation with a high degree of accuracy. We also provide a method to identify the levels of the geopotential height that have a higher influence on precipitation through a variable selection process. As far as we know, this paper covers the first attempt to model NWP parameterizations using CNN methodologies.

研究动机与目标

  • 开发一种基于机器学习的方法,仅使用大地位势高度作为输入,在数值天气预报(NWP)中推导出降水量参数化方案。
  • 评估卷积编码器-解码器神经网络在学习大地位势高度与总降水量之间空间关系方面的性能。
  • 将深度学习模型的预测准确性与传统机器学习方法(如线性回归和随机森林)进行比较。
  • 通过变量选择过程,识别出对降水量估计最具影响力的大地位势高度大气层次。
  • 证明仅从单一基本NWP场即可学习复杂非线性降水量模式的可行性,凸显深度学习在NWP参数化中的潜力。

提出的方法

  • 采用编码器-解码器卷积神经网络(CNN),特别是受计算机视觉启发的架构,将二维大地位势高度场映射为总降水量场。
  • 在40年欧洲扩展区域的ERA-Interim再分析数据上进行训练,输入为多个大气层次的大地位势高度。
  • 采用基于图像块的训练策略,利用大地位势场的局部空间区域来预测相应的局部降水量。
  • 应用变量选择过程,识别出对准确降水量估计贡献最大的大气层次的大地位势高度。
  • 评估多种最先进的CNN架构,包括改进的U-Net,以确定在降水量预测中表现最佳的模型。
  • 将模型性能与基线方法(线性回归、LASSO和随机森林)进行比较,使用相关系数和RMSE等指标在选定测试位置进行评估。

实验结果

研究问题

  • RQ1卷积编码器-解码器网络是否能够仅从大地位势高度预测总降水量,而无需其他物理场?
  • RQ2哪种编码器-解码器CNN架构在从大地位势高度场估计降水量方面表现最佳?
  • RQ3哪些大地位势高度的大气层次对降水量预测最具信息量?
  • RQ4在该降水量估计任务中,深度学习模型的性能与传统机器学习方法相比如何?
  • RQ5在多大程度上可以利用大地位势高度中的空间和天气尺度模式来推断复杂的降水量场?

主要发现

  • 改进的U-Net编码器-解码器架构在所有测试的CNN模型中,对总降水量场的重建精度最高。
  • 编码器-解码器CNN在性能上显著优于传统机器学习模型,最佳模型的相关系数超过0.52。
  • 随机森林模型相较于线性模型改进有限,但未能捕捉到降水量模式的空间锐度和结构特征。
  • 变量选择过程成功识别出对准确降水量估计贡献最大的特定大气层次的大地位势高度。
  • 尽管仅使用大地位势高度,最佳性能的CNN模型仍以显著的空间保真度捕捉到了大尺度和中尺度的降水量特征。
  • 结果表明,即使缺乏湿度或温度等其他物理变量,深度学习模型也能提取大地位势高度与降水量之间的复杂非线性关系。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。