Skip to main content
QUICK REVIEW

[論文レビュー] Learning to Advect: A Neural Semi-Lagrangian Architecture for Weather Forecasting

Carlos Pereira, Stéphane Gaudreault|arXiv (Cornell University)|Jan 29, 2026
Model Reduction and Neural Networks被引用数 0
ひとこと要約

PARADIS は differentiable neural semi-Lagrangian advection operator を用いた物理インスパイアを受けたニューラルアーキテクチャを導入し、1°分解能で最先端またはほぼ最高の予測精度を達成するとともに、0.25°のベースラインと比較して学習コストを低減します。

ABSTRACT

Recent machine-learning approaches to weather forecasting often employ a monolithic architecture, where distinct physical mechanisms (advection, transport), diffusion-like mixing, thermodynamic processes, and forcing are represented implicitly within a single large network. This representation is particularly problematic for advection, where long-range transport must be treated with expensive global interaction mechanisms or through deep, stacked convolutional layers. To mitigate this, we present PARADIS, a physics-inspired global weather prediction model that imposes inductive biases on network behavior through a functional decomposition into advection, diffusion, and reaction blocks acting on latent variables. We implement advection through a Neural Semi-Lagrangian operator that performs trajectory-based transport via differentiable interpolation on the sphere, enabling end-to-end learning of both the latent modes to be transported and their characteristic trajectories. Diffusion-like processes are modeled through depthwise-separable spatial mixing, while local source terms and vertical interactions are modeled via pointwise channel interactions, enabling operator-level physical structure. PARADIS provides state-of-the-art forecast skill at a fraction of the training cost. On ERA5-based benchmarks, the 1 degree PARADIS model, with a total training cost of less than a GPU month, meets or exceeds the performance of 0.25 degree traditional and machine-learning baselines, including the ECMWF HRES forecast and DeepMind's GraphCast.

研究の動機と目的

  • モノリシックなディープラーニング気象モデルが対流支配ダイナミクスを捉える際の限界を動機づけ、解決する。
  • Learned trajectories に沿って潜在特徴を輸送するニューラル半ラグランジュオペレーターを導入する。
  • 対流、拡散、反応への物理インスパイアされた分解を課して物理的一貫性を向上させる。
  • 極小スケールのエネルギーと位相情報を保持するスペクトル訓練カリキュラムを開発する。
  • ERA5 ベンチマークで 1° 解像度の最先端または同等の予測スキルを示し、競争力のある台風追跡を達成する。

提案手法

  • 球面上で学習された速度場に沿って潜在特徴を移流させる Neural Semi-Lagrangian (NSL) レイヤーを、微分可能な三次三次補間を用いて適用する。
  • Encoder–Processor–Decoder による潜在空間の定式化;移流に適した輸送可能サブ空間への射影。
  • オペレータレベルでの分解:移流(速度ネットワーク)、拡散(深さ方向分離畳み込み)、反応(1x1 畳み込み)。
  • Lie–Trotter オペレーター分割を用いて A_net, D_net, R_net をサブステップ内で逐次積分。
  • Geocyclic Padding と極部処理を用いた球面幾何の扱いにより地球全体での連続性を保つ。
  • 三段階の訓練カリキュラム:反転Huber損失、自己回帰微調整、スペクトル微調整(AMSE)を通じて球面調和関数の振幅/位相を保持する。
Figure 1 : Tracking of cyclone eye for Hurricane Laura (August 2020) using different models and the observed trajectory (IBTrACS dataset (Knapp et al. , 2010 ; Gahtan et al. , 2024 ) ).
Figure 1 : Tracking of cyclone eye for Hurricane Laura (August 2020) using different models and the observed trajectory (IBTrACS dataset (Knapp et al. , 2010 ; Gahtan et al. , 2024 ) ).

実験結果

リサーチクエスチョン

  • RQ1物理インスパイアされたオペレータ分解(移流-拡散-反応)は、モノリシックなDLモデルと比較して全球的な天気予報を改善できるか?
  • RQ2微分可能なニューラル半ラグランジュ移流を埋め込むことは長距離輸送を改善し、小スケールスペクトルエネルギーを保持するか?
  • RQ31°と0.25°のベースラインに対して、どの解像度と訓練戦略が最先端または同等の予測スキルをもたらすか?
  • RQ4潜在空間の explicit 輸送は台風追跡と強度予測にどのような影響を与えるか?
  • RQ5スペクトル適合性に焦点を当てた訓練はMLベースの天気予測におけるダブルペナルティ効果を緩和できるか?

主な発見

Modelz500_1dz500_5dz500_10dt850_1dt850_5dt850_10dq700_1dq700_5dq700_10du850_1du850_5du850_10dv850_1dv850_5dv850_10dw850_1dw850_5dw850_10dmsl_1dmsl_5dmsl_10d2t_1d2t_5d2t_10d
HRES4.38e+013.09e+028.00e+027.37e-011.93e+003.70e+007.71e-041.47e-031.97e-031.52e+003.99e+006.68e+001.52e+003.98e+006.71e+002.62e-013.26e-013.58e-010.00.00.00.00.00.0
GraphCast4.05e+012.78e+027.29e+025.66e-011.61e+003.38e+005.19e-041.11e-031.64e-031.10e+003.25e+005.87e+001.10e+003.27e+005.88e+001.25e-011.66e-011.95e-010.00.00.00.00.00.0
Pangu4.76e+012.99e+027.84e+026.78e-011.76e+003.59e+005.97e-041.26e-031.85e-031.29e+003.52e+006.32e+001.30e+003.56e+006.33e+00---0.00.00.00.00.00.0
PARADIS3.94e+012.73e+027.27e+025.79e-011.59e+003.33e+005.31e-041.15e-031.72e-031.09e+003.20e+005.87e+001.10e+003.22e+005.90e+001.04e-011.50e-011.81e-030.00.00.00.00.00.0
PARADIS AMSE4.01e+012.91e+027.87e+026.03e-011.68e+003.50e+005.42e-041.23e-031.81e-031.11e+003.46e+006.36e+001.09e-011.71e-012.14e-010.00.00.00.00.00.00.00.00.0
  • PARADIS は 1° 解像度で ERA5 ベンチマークの多くの変数とリードタイムで最良または2番目に良い RMSE を達成する。
  • 潜在空間での移流的なニューラル半ラグランジュ輸送は長距離輸送と動的変数(例:u, v, w)の取り扱いを改善する。
  • PARADIS は 2020年の80例の竜巻を通じて、より高解像度のベースラインと同等またはそれよりも良い平均位置誤差で熱帯低気圧の追跡予測を提供する。
  • 多スケールのスペクトル適合性は維持され、AMSE で微調整すると小スケールエネルギーと位相の整合性が向上しつつ RMSE はわずかに増減する。
  • 訓練コストが大幅に削減される(訓練に 0.8 GPU-month、推論時の 10日予報あたり 3.5 GPU秒)。
  • 1° ERA5 データ上で PARADIS は ECMWF HRES、GraphCast、Pangu Weather のパフォーマンスと複数のリードタイムと変数で同等以上を達成する。
Figure 2 : Diagram of the PARADIS model.
Figure 2 : Diagram of the PARADIS model.

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。