[論文レビュー] UPS: Efficiently Building Foundation Models for PDE Solving via Cross-Modal Adaptation
UPSは多様な時空間PDEデータを共通表現に統合し、事前学習済みLLMsをPDE解法へ適応させるトランスフォーマーベースのモデルを訓練することで、データ効率が高くPDEBenchタスク全体で最先端の性能を達成します。
We present Unified PDE Solvers (UPS), a data- and compute-efficient approach to developing unified neural operators for diverse families of spatiotemporal PDEs from various domains, dimensions, and resolutions. UPS embeds different PDEs into a shared representation space and processes them using a FNO-transformer architecture. Rather than training the network from scratch, which is data-demanding and computationally expensive, we warm-start the transformer from pretrained LLMs and perform explicit alignment to reduce the modality gap while improving data and compute efficiency. The cross-modal UPS achieves state-of-the-art results on a wide range of 1D and 2D PDE families from PDEBench, outperforming existing unified models using 4 times less data and 26 times less compute. Meanwhile, it is capable of few-shot transfer to unseen PDE families and coefficients.
研究の動機と目的
- 領域・次元・解像度を跨ぐ多様な時間依存PDEを解くためのデータ効率の高い基盤モデルアプローチを提案する。
- FNOベースのPDE埋め込み、LLMs、および予測ヘッドを組み合わせた統一データ表現と3部構成のアーキテクチャを提案する。
- PDE埋め込みとテキスト埋め込みを整合させる2段階のクロスモーダル適応を活用し、複数のPDEファミリに渡って微調整を行う。
- PDEBenchで性能とサンプル効率の向上を示し、少数ショット・ゼロショット転送能力を強力に発揮する。)
提案手法
- 多様なPDE軌跡を複数の次元・解像度・量を跨ぐ共有表現空間に統一する。
- PDE特化の埋め込みネットワークと Fourier Neural Operator (FNO) 層を用いてPDEデータから解像度不変特徴を抽出する。
- PDEに関するメタデータを、テキスト形式のPDE記述として埋め込み、PDE特徴と結合してLLM本体へ処理する前に組み込む。
- PDE埋め込みネットワーク、モデル本体としての事前学習済みLLM層、次ステップのPDE状態を予測する線形予測ヘッドの3部構成アーキテクチャを採用する。
- 2段階で訓練する: (i) モダリティ整列損失(MMDベース)とタスク損失(nRMSE)を用いた埋め込み事前学習; (ii) 複数のPDEファミリにまたがるマルチタスク微調整。
- RoBERTa、T5、CLIPなどのさまざまなLLMバックボーンとの互換性を示し、ニューラルオペレータの格子・解像度不変性を実証する。)

実験結果
リサーチクエスチョン
- RQ1統一表現とアーキテクチャは、異なるPDEファミリ・次元・解像度間のクロスドメイン転移を可能にするか。
- RQ2事前学習済みLMMのクロスモーダル適応は、多様なPDE解法タスクでデータ効率と予測精度を向上させるか。
- RQ3部分的なメタデータ(テキスト形式のPDE記述)が神経演算子フレームワークの学習と一般化にどう影響するか。
- RQ4見落としたPDEファミリ、係数、解像度への少数ショット・ゼロショット転送におけるUPSの性能はどうなるか。
主な発見
| # Params | Advection nRMSE | Burgers nRMSE | Diffusion-Sorption nRMSE | Navier-Stokes nRMSE | Shallow-Water nRMSE | Navier-Stokes Incomp nRMSE | Incomp Navier-Stokes nRMSE |
|---|---|---|---|---|---|---|---|
| 149M | 0.0033 | 0.0399 | 0.0009 | 0.0056 | 0.0019 | 0.0174 | 0.104 |
| 7.7M | 0.67 | 0.34 | 0.15 | 0.72 | 0.083 | 5.1 | 0.1903 |
| 466K | 0.011 | 0.042 | 0.0017 | 0.068 | 0.0044 | 0.36 | 0.0942 |
| 125M | 0.0098 | 0.12 | 0.0016 | 0.062 | 0.006 | 0.3549 | 0.1529 |
| 116M | - | - | - | - | 0.0024 | 0.0281 | - |
| 409M | - | - | - | - | 0.0022 | 0.0208 | - |
| 8.5K | 1.1 | 0.96 | 0.22 | - | 0.017 | - | - |
- UPSはPDEBenchのタスク10件中8件で最先端の性能を達成し、しばしばベースラインに対して大きなマージンを示す。
- 分布内タスクでは、UPS (RoBERTa-Base) が7データセット中6データセットで最小nRMSEを達成し、1Dおよび2Dで強い性能を示す。
- UPSは未知のPDEファミリ・係数・高解像度への強力な少数ショット・ゼロショット転送を示し、限られたデータ下でいくつかのベースラインを上回る。
- Stage-1の埋め込み事前学習(モダリティ整列とタスク学習を含む)は性能に不可欠で、メタデータの組み込みが結果を改善する。
- 本手法はデータ・計算効率が高く、PDEファミリごとに5K未満のトレーニング軌跡を使用し、シングルGPUでの訓練を実現する。

より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。