[论文解读] Learning to Advect: A Neural Semi-Lagrangian Architecture for Weather Forecasting
PARADIS 引入一种受物理启发的神经架构,具有一个可微分的神经半拉格朗日平流算子,在1°分辨率下实现最优或接近最佳的预报,同时与0.25°基线相比降低了训练成本。
Recent machine-learning approaches to weather forecasting often employ a monolithic architecture, where distinct physical mechanisms (advection, transport), diffusion-like mixing, thermodynamic processes, and forcing are represented implicitly within a single large network. This representation is particularly problematic for advection, where long-range transport must be treated with expensive global interaction mechanisms or through deep, stacked convolutional layers. To mitigate this, we present PARADIS, a physics-inspired global weather prediction model that imposes inductive biases on network behavior through a functional decomposition into advection, diffusion, and reaction blocks acting on latent variables. We implement advection through a Neural Semi-Lagrangian operator that performs trajectory-based transport via differentiable interpolation on the sphere, enabling end-to-end learning of both the latent modes to be transported and their characteristic trajectories. Diffusion-like processes are modeled through depthwise-separable spatial mixing, while local source terms and vertical interactions are modeled via pointwise channel interactions, enabling operator-level physical structure. PARADIS provides state-of-the-art forecast skill at a fraction of the training cost. On ERA5-based benchmarks, the 1 degree PARADIS model, with a total training cost of less than a GPU month, meets or exceeds the performance of 0.25 degree traditional and machine-learning baselines, including the ECMWF HRES forecast and DeepMind's GraphCast.
研究动机与目标
- Motivating 并解决单一端到端 DL 天气模型在捕捉平流主导动力学方面的局限性。
- 引入一个神经半拉格朗日算子,将潜在特征沿学习到的轨迹传输。
- 强化受物理启发的分解,分解为平流、扩散和反应,以提高物理一致性。
- 开发一个 光谱训练课程,以在球面谐和中保持小尺度能量和相位信息。
- 在 ERA5 基准的1°分辨率上展示最先进的预测能力,并在 cyclone 跟踪方面具有竞争力。
提出的方法
- 在球面上沿学习到的速度场使用可微分的双三次插值实现潜在特征的平流(NSL)层。
- 编码器–处理器–解码器的潜在空间表述;投影到一个便于传输的子空间以进行平流。
- 通过算子层分解为平流(速度网络)、扩散(深度可分离卷积)和反应(1x1卷积)。
- 使用 Lie–Trotter 算子分割,在子步中依次积分 A_net、D_net、R_net。
- 通过 Geocyclic Padding 与极点处理处理球面几何,以在全球范围内保持连续性。
- 三阶段训练课程:反向 Huber 损失、自回归微调,以及光谱微调(AMSE)以在球面谐波中保持振幅/相位。

实验结果
研究问题
- RQ1 物理启发的算子分解(平流–扩散–反应)是否能提升全球天气预测,相较于单一端到端 DL 模型?
- RQ2 将可微分的神经半拉格朗日平流嵌入是否能改善长距离传输并保持小尺度的光谱能量?
- RQ3 在1°与0.25°基线相比,何种分辨率与训练策略能达到最先进或可比的预测技能?
- RQ4 显式的潜在空间传输如何影响气旋轨迹和强度预报?
- RQ5 面向光谱保真度的训练是否能缓解 ML 天气预测中的双重惩罚效应?
主要发现
| Model | z500_1d | z500_5d | z500_10d | t850_1d | t850_5d | t850_10d | q700_1d | q700_5d | q700_10d | u850_1d | u850_5d | u850_10d | v850_1d | v850_5d | v850_10d | w850_1d | w850_5d | w850_10d | msl_1d | msl_5d | msl_10d | 2t_1d | 2t_5d | 2t_10d |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| HRES | 4.38e+01 | 3.09e+02 | 8.00e+02 | 7.37e-01 | 1.93e+00 | 3.70e+00 | 7.71e-04 | 1.47e-03 | 1.97e-03 | 1.52e+00 | 3.99e+00 | 6.68e+00 | 1.52e+00 | 3.98e+00 | 6.71e+00 | 2.62e-01 | 3.26e-01 | 3.58e-01 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
| GraphCast | 4.05e+01 | 2.78e+02 | 7.29e+02 | 5.66e-01 | 1.61e+00 | 3.38e+00 | 5.19e-04 | 1.11e-03 | 1.64e-03 | 1.10e+00 | 3.25e+00 | 5.87e+00 | 1.10e+00 | 3.27e+00 | 5.88e+00 | 1.25e-01 | 1.66e-01 | 1.95e-01 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
| Pangu | 4.76e+01 | 2.99e+02 | 7.84e+02 | 6.78e-01 | 1.76e+00 | 3.59e+00 | 5.97e-04 | 1.26e-03 | 1.85e-03 | 1.29e+00 | 3.52e+00 | 6.32e+00 | 1.30e+00 | 3.56e+00 | 6.33e+00 | - | - | - | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
| PARADIS | 3.94e+01 | 2.73e+02 | 7.27e+02 | 5.79e-01 | 1.59e+00 | 3.33e+00 | 5.31e-04 | 1.15e-03 | 1.72e-03 | 1.09e+00 | 3.20e+00 | 5.87e+00 | 1.10e+00 | 3.22e+00 | 5.90e+00 | 1.04e-01 | 1.50e-01 | 1.81e-03 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
| PARADIS AMSE | 4.01e+01 | 2.91e+02 | 7.87e+02 | 6.03e-01 | 1.68e+00 | 3.50e+00 | 5.42e-04 | 1.23e-03 | 1.81e-03 | 1.11e+00 | 3.46e+00 | 6.36e+00 | 1.09e-01 | 1.71e-01 | 2.14e-01 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 | 0.0 |
- PARADIS 在 ERA5 基准的1°分辨率下,对大多数变量和提前期实现最佳或第二最佳的 RMSE。
- 潜在空间中的平流通过神经半拉格朗日传输改善对长距离传输和动态变量(如 u、v、w)的处理。
- PARADIS 在2020年覆盖的80个风暴中提供具有竞争力的热带气旋轨迹预报,平均位置误差相同或更好于高分辨率基线。
- 多尺度光谱保真度得以维持,并可通过 AMSE 加强,在略微增加 RMSE 的同时提升小尺度能量和相位一致性。
- 训练成本显著降低(训练成本为 0.8 GPU 月;推理阶段每10天预报 3.5 GPU 秒)。
- 在1° ERA5 数据上,PARADIS 在多种提前期和变量上达到或超过 ECMWF HRES、GraphCast 与 Pangu Weather 的性能。

更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。