[论文解读] On the Foundations of Earth and Climate Foundation Models
定义一个理想的地球与气候基础模型,具备十一项所需特征,评估最前沿状态,并勾勒实现统一、可持续地球系统FM的数据和设计方向。
Foundation models have enormous potential in advancing Earth and climate sciences, however, current approaches may not be optimal as they focus on a few basic features of a desirable Earth and climate foundation model. Crafting the ideal Earth foundation model, we define eleven features which would allow such a foundation model to be beneficial for any geoscientific downstream application in an environmental- and human-centric manner.We further shed light on the way forward to achieve the ideal model and to evaluate Earth foundation models. What comes after foundation models? Energy efficient adaptation, adversarial defenses, and interpretability are among the emerging directions.
研究动机与目标
- 激发对统一的地球与气候基础模型的需求,使之能够处理多样数据模态和下游任务。
- 定义一组具体的必备与可取特征,以指导在遥感EO、天气和气候领域的FM设计。
- 评估当前具有代表性的地球与气候基础模型在这些特征上的表现,找出差距与未来工作的优先级。
- 提出数据构建与模型设计原则,实现理想、低碳、物理一致的FM。
- 讨论评估基准并推动地球FM的标准化基准测试的进展。
提出的方法
- 提出一个框架与特征清单(十一项特征),用于理想的地球与气候基础模型。
- 评估具有代表性的EO与气候FM及其与所提出特征的对齐程度。
- 概述面向理想FM的数据导向和模型导向路径,包括数据多样性、地理定位和多模态融合。
- 提出架构与训练策略,如动态编码器、时空建模和地理专家混合。
- 讨论评估基准以及在EO、天气和气候模态之间实现标准化任务的必要性。
实验结果
研究问题
- RQ1理想的地球与气候基础模型应具备哪些核心特征?
- RQ2当前的地球与气候基础模型在EO、天气和气候领域相对于这些特征的表现如何?
- RQ3需要哪些数据与架构设计策略来实现一个全面、可扩展且低碳的地球FM?
- RQ4需要哪些框架与基准来全面评估跨多任务和多模态的地球FM?
主要发现
| FMs | 1. 地理定位嵌入 | 2. 平衡分布 | 3. 尺度感知 | 4. 波长嵌入 | 5. 时间变量 | 6. 多传感感知 | 7. 任务无关 | 8. 低碳化 | 9. 不确定性 | 10. 物理一致性 | 11. 语言对齐 |
|---|---|---|---|---|---|---|---|---|---|---|---|
| SatMAE | ✗ | ✗ | ✗ | ✔ | ✔ | ✗ | ✔ | ✗ | ✗ | ✗ | ✗ |
| Scale-MAE | ✗ | ✗ | ✔ | ✗ | ✗ | ✗ | ✔ | ✗ | ✗ | ✗ | ✗ |
| SatlasPretrain | ✗ | ✗ | ✗ | ✗ | ✔ | ✔ | ✔ | ✗ | ✗ | ✗ | ✗ |
| SSL4EO-L | ✗ | ✔ | ✗ | ✗ | ✗ | ✔ | ✔ | ✗ | ✗ | ✗ | ✗ |
| SkySense | ✔ | ✗ | ✗ | ✗ | ✔ | ✔ | ✔ | ✗ | ✗ | ✗ | ✗ |
| DOFA | ✗ | ✗ | ✗ | ✔ | ✗ | ✔ | ✔ | ✔ | ✗ | ✗ | ✗ |
| FourCastNet | ✔ | ✔ | ✗ | - | ✔ | ✔ | ✔ | ✔ | ✔ | ✗ | ✗ |
| Pangu-Weather | ✔ | ✔ | ✗ | - | ✔ | ✔ | ✔ | ✔ | ✗ | ✗ | ✗ |
| GraphCast | ✔ | ✔ | ✗ | - | ✔ | ✔ | ✔ | ✗ | ✗ | ✗ | ✗ |
| ClimaX | ✔ | ✔ | ✗ | - | ✔ | ✔ | ✔ | ✗ | ✗ | ✗ | ✗ |
| NeuralGCM | ✔ | ✔ | ✔ | - | ✔ | ✔ | ✔ | ✗ | ✗ | ✔ | ✗ |
| FengWu-GHR | ✔ | ✔ | ✔ | - | ✔ | ✔ | ✔ | ✗ | ✗ | ✗ | ✗ |
- 当前模型与理想FM之间存在差距,许多模型仅覆盖八个必备特征中的两到三个。
- EO 基础模型更为成熟,通常能够实现地理定位嵌入和时间特征,但气候FM在高分辨率、多传感器整合与物理一致性方面落后。
- 具有代表性的 EO 与气候FM在特征覆盖方面存在差异,虽有进展但尚未形成统一、功能齐全的FM。
- 前进路径强调全面的数据整合、动态编码、时空多尺度建模、GeoMoE、持续预训练、不确定性量化、物理对齐和语言对齐。
- 确定了基准需求:数据多样性、代表性任务,以及 EO、天气和气候数据之间的组件间交互。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。