Skip to main content
QUICK REVIEW

[论文解读] Physics Guided Machine Learning Methods for Hydrology

Ankush Khandelwal, Shaoming Xu|arXiv (Cornell University)|Dec 2, 2020
Hydrology and Watershed Management Studies参考文献 13被引用 29
一句话总结

本文提出了一种物理引导的深度学习框架,通过使用分层LSTM架构与SWAT模型相结合,显式建模中间水文状态(土壤水分和积雪)来提升径流预测性能。通过引入物理约束并利用200年合成数据集,该方法减少了对数据的依赖性,并在标准数据驱动LSTM基础上提升了性能,实测NSE为0.73,RMSE为0.50。

ABSTRACT

Streamflow prediction is one of the key challenges in the field of hydrology due to the complex interplay between multiple non-linear physical mechanisms behind streamflow generation. While physics based models are rooted in rich understanding of the physical processes, a significant performance gap still remains which can be potentially addressed by leveraging the recent advances in machine learning. The goal of this work is to incorporate our understanding of hydrological processes and constraints into machine learning algorithms to improve the predictive performance. Traditional ML models for this problem predict streamflow using weather drivers as input. However there are multiple intermediate processes that interact to generate streamflow from weather drivers. The key idea of the approach is to explicitly model these intermediate processes that connect weather drivers to streamflow using a multi-task learning framework. While our proposed approach requires data about intermediate processes during training, only weather drivers will be needed to predict the streamflow during testing phase. We assess the efficacy of the approach on a simulation dataset generated by the SWAT model for a catchment located in the South Branch of the Root River Watershed in southeast Minnesota. While the focus of this paper is on improving the performance given data from a single catchment, methodology presented here is applicable to ML-based approaches that use data from multiple catchments to improve performance of each individual catchment.

研究动机与目标

  • 为解决将物理水文过程整合进机器学习模型时存在的性能差距问题。
  • 通过嵌入物理约束和利用SWAT模拟生成的合成数据,减少对大规模观测数据集的依赖。
  • 通过显式建模中间水文状态(如土壤水分、积雪)提升模型的泛化能力和可解释性。
  • 评估物理信息架构是否在径流预测中优于标准数据驱动的深度学习模型。
  • 探究标准LSTM在无显式架构引导的情况下,隐式学习物理记忆状态的程度。

提出的方法

  • 设计了一种分层深度学习架构,为中间水文状态(土壤水分、积雪)和流量(蒸散发、地表径流)分别设置独立的LSTM,并将其输入最终的径流预测头。
  • 通过预算约束损失函数整合质量守恒等物理原理,确保水文各组件之间的一致性。
  • 使用SWAT模型生成的200年合成数据集对模型进行预训练,以提升收敛性,减少对真实世界数据的依赖。
  • 采用多任务学习设置进行训练,先分别训练各子任务(如土壤水分、积雪)以优化误差传播,再进行联合训练。
  • 通过将LSTM隐藏状态与实际土壤水分和积雪时间序列进行相关性分析,评估模型的物理可解释性,验证网络是否学习到有意义的物理表征。
  • 在合成数据集的训练集和测试集上,使用RMSE和纳什-萨特克利夫效率(NSE)评估框架,并通过消融实验比较包含与不包含物理组件的配置。

实验结果

研究问题

  • RQ1在深度学习架构中显式建模中间水文状态(如土壤水分和积雪)是否能提升径流预测的准确性?
  • RQ2在缺乏架构或损失函数引导的情况下,标准LSTM在多大程度上能隐式学习物理记忆状态?
  • RQ3引入质量守恒等物理约束如何影响模型性能和收敛性?
  • RQ4使用SWAT模型生成的200年合成数据集是否能提升模型泛化能力并减少数据需求?
  • RQ5在分布外数据上的鲁棒性方面,该分层架构与端到端深度学习模型相比表现如何?

主要发现

  • 所提出的物理引导架构在未见数据上实现了0.73的测试NSE和0.50的RMSE,显著优于标准LSTM(NSE:0.62,RMSE:0.72)。
  • 同时显式建模土壤水分和积雪作为中间任务时性能最佳,相比无物理信息的基线LSTM,RMSE降低了28%。
  • 消融实验表明,仅包含土壤水分即可提升性能,但加入积雪后进一步增强了准确性和鲁棒性。
  • 相关性分析显示,标准LSTM虽能学习到类似土壤水分和积雪的特征,但保真度较低且衰减动力学更慢,表明其物理对齐性有限。
  • 分层设计通过为每个中间状态分配专用LSTM,更有效地建模了具有不同时间尺度的过程,提升了学习效率。
  • 使用SWAT生成的200年合成数据集显著缩短了收敛时间并提升了泛化能力,尤其在低数据场景下表现突出。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。