[论文解读] Data-Driven Integration Kernels for Interpretable Nonlocal Operator Learning
该论文引入数据驱动的积分核,将非本地信息聚合与局部预测分离,获得可解释的核并在南亚季风降水预测中实现接近基线的预测能力,同时参数更少。
Machine learning models can represent climate processes that are nonlocal in horizontal space, height, and time, often by combining information across these dimensions in highly nonlinear ways. While this can improve predictive skill, it makes learned relationships difficult to interpret and prone to overfitting as the extent of nonlocal information grows. We address this challenge by introducing data-driven integration kernels, a framework that adds structure to nonlocal operator learning by explicitly separating nonlocal information aggregation from local nonlinear prediction. Each spatiotemporal predictor field is first integrated using learnable kernels (defined as continuous weighting functions over horizontal space, height, and/or time), after which a local nonlinear mapping is applied only to the resulting kernel-integrated features and any optional local inputs. This design confines nonlinear interactions to a small set of integrated features and makes each kernel directly interpretable as a weighting pattern that reveals which horizontal locations, vertical levels, and past timesteps contribute most to the prediction. We demonstrate the framework for South Asian monsoon precipitation using a hierarchy of neural network models with increasing structure, including baseline, nonparametric kernel, and parametric kernel models. Across this hierarchy, kernel-based models achieve near-baseline performance with far fewer trainable parameters, showing that much of the relevant nonlocal information can be captured through a small set of interpretable integrations when appropriate structural constraints are imposed.
研究动机与目标
- 说明需要在地球物理过程中的可解释非本地算子学习的动机。
- 引入积分核学习作为一个两步框架,将非本地聚合与局部预测分离。
- 开发一系列基于核的模型(非参数与参数)以研究技能与可解释性之间的权衡。
- 将该框架应用于使用ERA5/IMERG数据的南亚季风降水预测,以展示可解释性与性能。
- 提供基于核的非本地影响摘要,可用于指导物理约束的参数化。
提出的方法
- 通过在水平空间、高度和/或时间上应用可学习的核,表示通过核集成得到的特征来捕捉非本地依赖。
- 将非本地算子近似为组成 F ∘ 𝒦 的形式,其中 𝒦 是核积分步骤,F 是局部非线性映射。
- 在格点化的预测场上对核进行离散化,使用归一化和有效性掩码得到核权重 k_i,n,m,r^(ℓ)。
- 用共享的下游神经网络训练模型,确保差异来自非本地编码而非其他。
- 探讨一个层级结构:基线的全灵活模型、非参数核、以及参数核(高斯、高斯混合、顶帽、指数)。
- 在南亚季风降水的 ERA5 预测要素(相对湿度 RH、等焓位 θ_e、θ_e*)以及局部输入(感热通量/潜热通量、陆地分数)上进行评估。

实验结果
研究问题
- RQ1非本地信息的架构编码(基线 vs. 基于核)如何影响季风降水的预测能力?
- RQ2水平、垂直和时间非本地性在该区域降水预测中的相对重要性如何?
- RQ3核集成特征是否提供可解释的、物理有意义的非本地影响模式?
- RQ4非参数与参数核模型在准确性和可解释性方面有何比较?
- RQ5核集成特征是否能提供有用的紧凑摘要,供后续物理参数化使用?
主要发现
| Model | R^2 | MSE |
|---|---|---|
| (x0,p0,t0) | 0.411 | 0.680 |
| (x0,p0,t) | 0.432 | 0.656 |
| (x,p0,t0) | 0.440 | 0.647 |
| (x0,p^TH,t0) | 0.481 | 0.599 |
| (x0,p^EXP,t0) | 0.482 | 0.598 |
| (x0,p^G,t0) | 0.484 | 0.596 |
| (x0,p^MG,t0) | 0.487 | 0.592 |
| (x0,p^MIX,t0) | 0.488 | 0.592 |
| (x0,p^k,t0) | 0.496 | 0.582 |
| (x,p,t0) | 0.528 | 0.546 |
| (x,p,t) | 0.582 | 0.482 |
- 核模型在接近基线的预测性能下,使用的可训练参数远少于全灵活基线模型。
- 垂直非本地性在研究尺度内对南亚季风的预测技能贡献最大,水平和时间上下文为次级。
- 非参数核模型在输入维度减少的情况下达到与完整基线相似的性能(例如 R^2=0.496 对 0.528;MSE=0.582 对 0.546)。
- 参数核(高斯、高斯混合、指数、顶帽)提供额外的正则化,技能损失较小(R^2 约 0.481–0.488;MSE 约 0.592–0.599)。
- 学习得到的垂直核在下平对流层的预测变量结构上具有区域性特征,与对对流的已知物理控制相一致(如在 900–1000 hPa 与 650–500 hPa 处对 RH 的加权,以及 θ_e 与 θ_e* 的模式)。
- 核提供可解释的加权模式,可用于约束物理可解释的非局部机制的参数化,并支持用于非局部机制的符号回归。

更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。