[论文解读] Machine learning with data assimilation and uncertainty quantification for dynamical systems: a review
对数据同化与不确定性量化如何提升高维动力系统的机器学习,以及机器学习如何反过来推动数据同化与不确定性量化的综合评述。
Data Assimilation (DA) and Uncertainty quantification (UQ) are extensively used in analysing and reducing error propagation in high-dimensional spatial-temporal dynamics. Typical applications span from computational fluid dynamics (CFD) to geoscience and climate systems. Recently, much effort has been given in combining DA, UQ and machine learning (ML) techniques. These research efforts seek to address some critical challenges in high-dimensional dynamical systems, including but not limited to dynamical system identification, reduced order surrogate modelling, error covariance specification and model error correction. A large number of developed techniques and methodologies exhibit a broad applicability across numerous domains, resulting in the necessity for a comprehensive guide. This paper provides the first overview of the state-of-the-art researches in this interdisciplinary field, covering a wide range of applications. This review aims at ML scientists who attempt to apply DA and UQ techniques to improve the accuracy and the interpretability of their models, but also at DA and UQ experts who intend to integrate cutting-edge ML approaches to their systems. Therefore, this article has a special focus on how ML methods can overcome the existing limits of DA and UQ, and vice versa. Some exciting perspectives of this rapidly developing research field are also discussed.
研究动机与目标
- 阐明 ML 如何解决高维动力学系统中数据同化与不确定性量化的核心挑战。
- 综述数据同化(DA)和不确定性量化(UQ)如何提升 ML 模型的鲁棒性、可解释性和准确性。
- 总结降维建模方法及其与 ML、DA 和 UQ 的整合。
- 突出在数值天气预报(NWP)、环境建模和 CFD 等领域的关键应用,并讨论未来展望。
提出的方法
- 将方法分为使用 ML 的数据同化(DA)和由 DA/UQ 辅助的 ML。
- 讨论将 4D-Var 与 ML 联系起来的概率和变分表述。
- 分析基于卡尔曼滤波的与变分数据同化方法及其不确定性量化的含义。
- 回顾用于ROM的 ML 技术,包括自编码器、POD/PGD 以及基于 DL 的代理模型。
- 在 ML/DA 背景下考察 Monte Carlo、Polynomial Chaos 和 conformal predictions 等不确定性量化方法。
实验结果
研究问题
- RQ1ML 方法如何克服传统 DA 和 UQ 的局限性,如可解释性和模型误差处理?
- RQ2数据同化原理如何提高高维动力学系统中 ML 预测的可靠性与不确定性量化?
- RQ3降维模型在实现可扩展的 ML-DA-UQ 集成中的作用是什么?
- RQ4在气候、CFD 和地球科学领域,将 ML 与 DA 和 UQ 融合的主要应用与挑战是什么?
- RQ5在这一跨学科领域,未来研究有哪些有前景的视角和方法学空白?
主要发现
- ML 与 DA/UQ 相互促进,ML 通过可微分模型提升 DA,DA 为 ML 预测提供原理性的不确定性控制。
- 变分 DA 与 4D-Var 与基于梯度的 ML 优化存在形式上的联系,使模型误差与观测误差能够联合处理。
- 集合卡尔曼滤波、局部化和膨胀在 ML-DA 情境下仍然是高维问题的实用解决方案。
- 基于 DL 的 ROM,包括自编码器和图神经网络,在高维预测和代理建模方面展现出强大潜力,且不确定性量化引导可靠性。
- 不确定性量化方法如 Monte Carlo、Polynomial Chaos 和 conformal predictions 对在噪声和数据稀缺条件下评估 ML 预测至关重要。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。