QUICK REVIEW

[論文レビュー] Physics Guided Machine Learning Methods for Hydrology

Ankush Khandelwal, Shaoming Xu|arXiv (Cornell University)|Dec 2, 2020

Hydrology and Watershed Management Studies参考文献 13被引用数 29

ひとこと要約

本論文では、階層的LSTMアーキテクチャとSWATモデルを組み合わせることで、土壌水分と積雪量といった中間水文的状態を明示的にモデル化することにより、流出予測の性能を向上させる物理的制約付きディープラーニングフレームワークを提案する。物理的制約を組み込み、200年分の合成データセットを活用することで、データ依存性を低減し、標準的なデータ駆動型LSTMよりも性能を向上させ、未学習データに対してテストNSeが0.73、RMSEが0.50を達成した。

ABSTRACT

Streamflow prediction is one of the key challenges in the field of hydrology due to the complex interplay between multiple non-linear physical mechanisms behind streamflow generation. While physics based models are rooted in rich understanding of the physical processes, a significant performance gap still remains which can be potentially addressed by leveraging the recent advances in machine learning. The goal of this work is to incorporate our understanding of hydrological processes and constraints into machine learning algorithms to improve the predictive performance. Traditional ML models for this problem predict streamflow using weather drivers as input. However there are multiple intermediate processes that interact to generate streamflow from weather drivers. The key idea of the approach is to explicitly model these intermediate processes that connect weather drivers to streamflow using a multi-task learning framework. While our proposed approach requires data about intermediate processes during training, only weather drivers will be needed to predict the streamflow during testing phase. We assess the efficacy of the approach on a simulation dataset generated by the SWAT model for a catchment located in the South Branch of the Root River Watershed in southeast Minnesota. While the focus of this paper is on improving the performance given data from a single catchment, methodology presented here is applicable to ML-based approaches that use data from multiple catchments to improve performance of each individual catchment.

研究の動機と目的

機械学習モデルに物理的水文プロセスを統合することで、流出予測における性能ギャップを是正すること。
SWATシミュレーションから得た合成データと物理的制約を埋め込むことで、大規模な観測データセットへの依存を低減すること。
中間水文的状態（例：土壌水分、積雪量）をディープラーニングアーキテクチャの明示的構成要素としてモデル化することで、一般化性能と解釈可能性を向上させること。
物理的インフォームドなアーキテクチャが、標準的なデータ駆動型ディープラーニングモデルよりも流出予測で優れた性能を示すかどうかを評価すること。
標準的なLSTMが、明示的なアーキテクチャ的ガイダンスなしに、物理的記憶状態をどの程度暗黙的に学習するかを調査すること。

提案手法

中間水文的状態（土壌水分、積雪量）と流出量（蒸発散、表面流出）のための別個のLSTMを備えた階層的ディープラーニングアーキテクチャを設計し、それらを最終的な流出予測ヘッドに統合する。
質量保存則などの物理的原則を、予測の整合性を保証するための予算制約損失関数を通じてアーキテクチャに統合する。
200年分の合成データセットをSWATモデルから生成し、事前学習および収束性の向上に活用することで、実世界データへの依存度を低減する。
マルチタスク学習の枠組みでモデルを訓練し、個々のタスク（例：土壌水分、積雪量）を別々に学習した後、共同学習に移行することで誤差伝搬を最適化する。
LSTM隠れ状態と実際の土壌水分および積雪量時系列との相関を分析することで、ネットワークが意味的な物理的表現を学習しているかを物理的解釈可能性の観点から評価する。
RMSEおよびナッシュ＝サットクリフ効率（NSE）を用いて、合成データセットの訓練およびテスト分割でフレームワークを評価し、物理的コンponentsを含む・含まない構成のアブレーションスタディを実施する。

実験結果

リサーチクエスチョン

RQ1中間水文的状態（土壌水分および積雪量）をディープラーニングアーキテクチャの明示的構成要素としてモデル化することで、流出予測の精度が向上するか？
RQ2アーキテクチャ的または損失関数的ガイダンスなしに、標準的なLSTMが物理的記憶状態をどの程度暗黙的に学習するか？
RQ3質量保存のような物理的制約を組み込むことで、モデルの性能および収束性にどのような影響を与えるか？
RQ4SWATから得た200年分の合成データセットを用いることで、モデルの一般化性能が向上し、データ要件が低減するか？
RQ5分布外データに対するロバストネスの観点から、階層的アーキテクチャはエンドツーエンドのディープラーニングモデルと比較してどの程度優れているか？

主な発見

提案された物理的制約付きアーキテクチャは、未学習データに対してテストNSeが0.73、RMSEが0.50を達成し、標準的なLSTM（NSe: 0.62、RMSE: 0.72）を著しく上回った。
土壌水分と積雪量の両方を中間タスクとしてモデル化した場合が最良の性能を示し、物理的要素を含まないベースラインLSTMと比較してRMSEを28％低減した。
アブレーションスタディの結果、土壌水分を単独で含めることでベースラインより性能が向上したが、積雪量を追加することでさらに精度とロバストネスが向上した。
相関分析の結果、標準的なLSTMは土壌水分および積雪量に類似した特徴を学習しているが、忠実度が低く、遅延ダイナミクスも遅いため、物理的整合性に制限があることが示された。
階層的設計により、異なる時間スケールを持つプロセスのモデリングが向上し、各中間状態に専用のLSTMを割り当てることで学習効率が向上した。
SWATから得た200年分の合成データセットの使用により、収束時間の短縮と一般化性能の向上が顕著に見られ、特にデータが少ない状況で顕著であった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。