Skip to main content
QUICK REVIEW

[論文レビュー] Deep Multiscale Model Learning

Yating Wang, Siu Wun Cheung|arXiv (Cornell University)|Jun 13, 2018
Model Reduction and Neural Networks参考文献 5被引用数 18
ひとこと要約

本稿では、非局所的マルチコンtinuum(NLMC)マルチスケールモデル低減法と深層ニューラルネットワークを統合することで、非線形PDEのデータに依存する粗格子モデルを構築する、新しいフレームワークであるDeep Multiscale Model Learning(DMML)を提案する。マルチスケールの概念を用いて物理的自由度と接続性を定義し、観測データと計算データのハイブリッドを用いてネットワークを訓練することで、限られた観測データでも物理的制約を組み込んだ正確な予測が可能となり、数値実験では完全にデータ駆動型またはシミュレーションのみのアプローチを著しく上回る性能を示した。

ABSTRACT

The objective of this paper is to design novel multi-layer neural network architectures for multiscale simulations of flows taking into account the observed data and physical modeling concepts. Our approaches use deep learning concepts combined with local multiscale model reduction methodologies to predict flow dynamics. Using reduced-order model concepts is important for constructing robust deep learning architectures since the reduced-order models provide fewer degrees of freedom. Flow dynamics can be thought of as multi-layer networks. More precisely, the solution (e.g., pressures and saturations) at the time instant $n+1$ depends on the solution at the time instant $n$ and input parameters, such as permeability fields, forcing terms, and initial conditions. One can regard the solution as a multi-layer network, where each layer, in general, is a nonlinear forward map and the number of layers relates to the internal time steps. We will rely on rigorous model reduction concepts to define unknowns and connections for each layer. In each layer, our reduced-order models will provide a forward map, which will be modified ("trained") using available data. It is critical to use reduced-order models for this purpose, which will identify the regions of influence and the appropriate number of variables. Because of the lack of available data, the training will be supplemented with computational data as needed and the interpolation between data-rich and data-deficient models. We will also use deep learning algorithms to train the elements of the reduced model discrete system. We will present main ingredients of our approach and numerical results. Numerical results show that using deep learning and multiscale models, we can improve the forward models, which are conditioned to the available data.

研究の動機と目的

  • 観測データと物理的制約を組み込んだ非線形マルチスケールPDEの粗格子モデルを構築する、堅牢なフレームワークの開発。
  • マルチスケールシミュレーションにおける観測データの不足という課題に対し、深層学習を用いて観測データと計算データを統合することで、一般化性能とデータ効率を向上させる。
  • マルチスケールモデル低減の概念を深層ニューラルネットワークのアーキテクチャに組み込むことで、アップスケールモデルの精度と一般化性能を向上させる。
  • マルチスケールモデル低減がネットワークアーキテクチャ設計をどのように導くことができるかを示し、物理的解釈可能性と自由度の低減を実現する。
  • 観測データが限られている状況でも、観測データと計算データのハイブリッドトレーニングがモデル性能を向上させることを検証する。

提案手法

  • 本手法は、物理的意味を持つ自由度(例:解の平均値など)を定義するために非局所的マルチコンtinuum(NLMC)手法を基盤として用いる。
  • シミュレーションの各タイムステップを深層ニューラルネットワークのレイヤーとしてモデル化し、時刻$n+1$における解を、時刻$n$の解と入力パラメータからの非線形写像として予測する。
  • ネットワークアーキテクチャはマルチスケールモデル低減の知見に基づいて設計され、接続性と未知数が物理的影響領域と局所的不均一性を反映するようにする。
  • ハイブリッドトレーニング戦略により、異なる透水率分布を持つシミュレーションから得た計算データと観測データを統合し、一般化性能とデータ効率を向上させる。
  • 予測された最終時刻解と観測された解との差を最小化する損失関数を用いてネットワークを訓練する。純粋な観測データ、純粋なシミュレーションデータ、および混合データでそれぞれ別々のネットワークをトレーニングする。
  • 各レイヤーがタイムステップに対応する多層構造を採用し、前向きマップを深層学習で学習しつつも、マルチスケール構造を保持する。

実験結果

リサーチクエスチョン

  • RQ1深層学習とマルチスケールモデル低減を効果的に組み合わせることで、非線形PDEの正確なデータ依存型粗格子モデルを構築できるか?
  • RQ2観測データと計算データの両方を含めたトレーニングが、学習モデルの性能と一般化能力に与える影響は何か?
  • RQ3影響領域や低次元自由度といったマルチスケールの概念が、マルチスケールシミュレーションにおける深層ニューラルネットワークのアーキテクチャとトレーニングをどのように改善できるか?
  • RQ4データ不足がモデルの精度に与える影響は何か?また、ハイブリッドデータトレーニングはこの問題を緩和できるか?
  • RQ5学習された深層ネットワークは、高い予測精度を達成しつつも、物理的整合性をどの程度保持できるか?

主な発見

  • 例1では、混合データ駆動型ネットワークが最終時刻予測において平均誤差5.6%を達成し、純粋なシミュレーションネットワーク(誤差52.3%)を著しく上回った。これは観測データの統合による利点を示している。
  • 例2では、混合データ駆動型ネットワークが平均誤差8.5%、純粋な観測データ駆動型ネットワークが2.6%を記録した。これは、限られた観測データでも精度向上が著しく見られるということを示している。
  • 例3では、透水率対比が高く、データが著しく異なる条件下でも、混合ネットワーク(平均誤差8.8%)が純粋なシミュレーションネットワーク(誤差64.3%)を著しく上回った。これはハイブリッドデータトレーニングの価値を裏付けている。
  • 混合データでトレーニングされたネットワーク($\mathcal{N}_m$)は、純粋なシミュレーションネットワークよりも観測データにはるかに近い予測を生成し、平均誤差は8.8%(対して64.3%)であった。
  • 図10の解の比較から、混合データでトレーニングされたネットワーク($\mathcal{N}_m$)は、テストサンプル全体にわたり信頼性が高く物理的に妥当な予測を生成していることが確認された。
  • 結果から、マルチスケールモデル低減から導かれる粗自由度を用いることで、特にデータが少ない状況下でもモデルのロバストネスが向上し、過学習が抑制されることを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。