Skip to main content
QUICK REVIEW

[論文レビュー] Data-Driven Integration Kernels for Interpretable Nonlocal Operator Learning

Savannah L. Ferretti, Jerry Lin|arXiv (Cornell University)|Mar 11, 2026
Climate variability and models被引用数 0
ひとこと要約

データ駆動型統合カーネルを用いて非局所情報の集約を局所予測から分離し、解釈可能なカーネルを生み出す。南アジアモンスーン降水に対してパラメータ数を抑えつつほぼベースライン並みの予測性能を達成。

ABSTRACT

Machine learning models can represent climate processes that are nonlocal in horizontal space, height, and time, often by combining information across these dimensions in highly nonlinear ways. While this can improve predictive skill, it makes learned relationships difficult to interpret and prone to overfitting as the extent of nonlocal information grows. We address this challenge by introducing data-driven integration kernels, a framework that adds structure to nonlocal operator learning by explicitly separating nonlocal information aggregation from local nonlinear prediction. Each spatiotemporal predictor field is first integrated using learnable kernels (defined as continuous weighting functions over horizontal space, height, and/or time), after which a local nonlinear mapping is applied only to the resulting kernel-integrated features and any optional local inputs. This design confines nonlinear interactions to a small set of integrated features and makes each kernel directly interpretable as a weighting pattern that reveals which horizontal locations, vertical levels, and past timesteps contribute most to the prediction. We demonstrate the framework for South Asian monsoon precipitation using a hierarchy of neural network models with increasing structure, including baseline, nonparametric kernel, and parametric kernel models. Across this hierarchy, kernel-based models achieve near-baseline performance with far fewer trainable parameters, showing that much of the relevant nonlocal information can be captured through a small set of interpretable integrations when appropriate structural constraints are imposed.

研究の動機と目的

  • 地球物理プロセスにおける解釈可能な非局所演算子学習の必要性を動機づける。
  • 非局所の集約を局所予測と切り離す二段階フレームワークとしての統合カーネル学習を導入する。
  • 技能と解釈性のトレードオフを研究するための非パラメトリックおよびパラメトリックなカーネルベースモデルの階層を開発する。
  • ERA5/IMERGデータを用いて南アジアモンスーン降水に適用し、解釈性と性能を示す。
  • 非局所影響のカーネルベース要約を提供し、物理制約付きパラメータ化のガイドとなる。

提案手法

  • 学習可能なカーネルを水平・高度・時間へ適用して得られるカーネル統合特徴量により非局所依存を表現する。
  • 非局所演算子を F ∘ 𝒦 の組み合わせとして近似し、𝒦 をカーネル統合ステップ、F を局所的非線形写像とする。
  • グリッド化された予測場上でカーネルを正規化と有効性マスキングとともに離散化し、カーネル重み k_i,n,m,r^(ℓ) を得る。
  • 下流の共有ニューラルネットワークでモデルを訓練し、非局所エンコードによる差異が生じるようにする。
  • 階層を探る:全柔軟ベースライン、非パラメトリックカーネル、パラメトリックカーネル(ガウス、ガウス混合、トップハット、指数関数)。
  • ERA5予測子(RH, θ_e, θ_e*)と局所入力(感覚熱・潜熱フラックス、陸域分率)を用いて南アジアモンスーン降水で評価する。
Figure 1: Schematic of integration kernel learning. Learned kernels summarize predictor fields across horizontal space, height, and/or time into features, which are combined with local inputs and passed to a downstream nonlinear model to predict the local output
Figure 1: Schematic of integration kernel learning. Learned kernels summarize predictor fields across horizontal space, height, and/or time into features, which are combined with local inputs and passed to a downstream nonlinear model to predict the local output

実験結果

リサーチクエスチョン

  • RQ1非局所情報のアーキテクチャ的エンコード(ベースライン対カーネルベース)はモンスーン降水の予測技能にどう影響するか?
  • RQ2水平・垂直・時間的非局所性の相対的重要性はこのレジームで降水を予測する際にどの程度か?
  • RQ3カーネル統合特徴は解釈可能で物理的に意味のある非局所影響のパターンを提供するか?
  • RQ4非パラメトリックとパラメトリックなカーネルモデルは精度と解釈性の点でどう比較されるか?
  • RQ5カーネル統合特徴は後続の物理的パラメータ化のためのコンパクトな要約を提供できるか?

主な発見

ModelR^2MSE
(x0,p0,t0)0.4110.680
(x0,p0,t)0.4320.656
(x,p0,t0)0.4400.647
(x0,p^TH,t0)0.4810.599
(x0,p^EXP,t0)0.4820.598
(x0,p^G,t0)0.4840.596
(x0,p^MG,t0)0.4870.592
(x0,p^MIX,t0)0.4880.592
(x0,p^k,t0)0.4960.582
(x,p,t0)0.5280.546
(x,p,t)0.5820.482
  • カーネルモデルは完全に柔軟なベースラインよりはるかに少ない訓練可能パラメータでほぼベースライン並みの予測性能を達成する。
  • 南アジアモンスーンにおいて、 studied scale 内では垂直な非局所性が予測技能に最も寄与し、水平および時間的文脈は二次的である。
  • 非パラメトリックカーネルモデルは入力次元を削減しても全ベースラインと同等の性能を達成(例:R^2 0.496 vs 0.528;MSE 0.582 vs 0.546)。
  • パラメトリックカーネル(ガウス、ガウス混合、指数、トップハット)は規則化を追加しつつ技能の損失はごく限定的(R^2 ≈ 0.481–0.488;MSE ≈ 0.592–0.599)
  • 学習された垂直カーネルは下部対流圏にわたる予測子固有の構造を明らかにし、対流の物理的制御と整合(例:RH が 900–1000 hPa および 650–500 hPa付近で重み付け、θ_e と θ_e* パターン)
  • カーネルは解釈可能な重み付けパターンを生み、物理的に解釈可能なパラメータ化を制約し、非局所機構の象徴回帰を支援する。
Figure 2: Test set R 2 (top) and MSE (bottom) for baseline (blue), nonparametric kernel (yellow), and parametric kernel (red) models, computed in standardized log1p-transformed precipitation space. Model labels indicate nonlocal dimensions, with subscript 0 denoting locality. Superscript $k$ denotes
Figure 2: Test set R 2 (top) and MSE (bottom) for baseline (blue), nonparametric kernel (yellow), and parametric kernel (red) models, computed in standardized log1p-transformed precipitation space. Model labels indicate nonlocal dimensions, with subscript 0 denoting locality. Superscript $k$ denotes

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。