Skip to main content
QUICK REVIEW

[論文レビュー] Variational approach for learning Markov processes from time series data

Hao Wu, Frank Noé|arXiv (Cornell University)|Jul 14, 2017
Model Reduction and Neural Networks参考文献 61被引用数 45
ひとこと要約

本稿では、時系列データから最適な低次元特徴写像と線形マルコフ過程モデルを学ぶデータ駆動型手法である変分的アプローチ(VAMP)を紹介する。コプマン作用素のスペクトル分解を活用することで、VAMP- $r$ スコアがモデル最適化を可能にし、VAMP-Eはハイパーパrameterチューニングのための交差検証を可能にし、可逆的・非可逆的、定常的・非定常的プロセスの両方において、正確な動的挙動の近似を達成する。

ABSTRACT

Inference, prediction and control of complex dynamical systems from time series is important in many areas, including financial markets, power grid management, climate and weather modeling, or molecular dynamics. The analysis of such highly nonlinear dynamical systems is facilitated by the fact that we can often find a (generally nonlinear) transformation of the system coordinates to features in which the dynamics can be excellently approximated by a linear Markovian model. Moreover, the large number of system variables often change collectively on large time- and length-scales, facilitating a low-dimensional analysis in feature space. In this paper, we introduce a variational approach for Markov processes (VAMP) that allows us to find optimal feature mappings and optimal Markovian models of the dynamics from given time series data. The key insight is that the best linear model can be obtained from the top singular components of the Koopman operator. This leads to the definition of a family of score functions called VAMP-r which can be calculated from data, and can be employed to optimize a Markovian model. In addition, based on the relationship between the variational scores and approximation errors of Koopman operators, we propose a new VAMP-E score, which can be applied to cross-validation for hyper-parameter optimization and model selection in VAMP. VAMP is valid for both reversible and nonreversible processes and for stationary and non-stationary processes or realizations.

研究の動機と目的

  • 時系列データからマルコフ的動的挙動を変分的原理を用いて統一的フレームワークで学ぶこと。
  • 非線形な複雑な動的挙動を低次元空間で線形化する最適な特徴写像を同定すること。
  • データから導出された線形マルコフモデルの品質を定量化するスコア関数(VAMP- $r$)を提供すること。
  • ハイパーパrameter最適化とモデル選択に適した交差検証対応スコアであるVAMP-Eを導入すること。
  • 可逆的および非可逆的プロセス、ならびに定常的および非定常的システムへの適用可能性を拡張すること。

提案手法

  • 本手法はコプマン作用素のスペクトル分解に基づく。コプマン作用素の主要な特異成分が、線形マルコフ近似のための最適な特徴空間を定義する。
  • VAMP- $r$ は、コプマン作用素の特異値から導かれる変分的スコアとして定義され、特徴写像と遷移行列の最適化を可能にする。
  • 本手法は、動的挙動の完全な知識が不要な時間遅れ相関を用いて、データからコプマン作用素の作用を推定する。
  • 遷移行列は、時間遅れ相関行列の特異値分解(SVD)を切り詰めて構築され、コプマン作用素の低ランク近似を保証する。
  • VAMP-Eは、変分的スコアと近似誤差の関係から導出され、交差検証によるモデル選択を可能にする。
  • 本手法は離散的および連続的状態空間を扱い、経験的期待値推定を用いて非定常プロセスに対しても対応可能である。

実験結果

リサーチクエスチョン

  • RQ1非線形マルコフ過程を時系列データから線形化する最適な特徴写像を学ぶために、変分的原理を定式化できるか?
  • RQ2線形マルコフモデルの品質を、モデル選択やハイパーパrameterチューニングを可能にする形で定量化できるか?
  • RQ3コプマン作用素のスペクトル近似誤差と、モデル最適化に用いられる変分的スコアとの関係は何か?
  • RQ4本フレームワークを非可逆的および非定常的力学系に拡張可能か?
  • RQ5予測精度とロバスト性の観点から、VAMP- $r$ スコアは既存の手法と比較してどのように差がつくか?

主な発見

  • VAMP- $r$ は、特徴空間における時間遅れ観測値間の相関を測定することで、線形マルコフモデルの品質を一貫して定量化するスコア関数を提供する。
  • VAMP- $r$ スコアはコプマン作用素の近似誤差と直接関連しており、原理的かつ整合的なモデル最適化を可能にする。
  • VAMP-Eは、モデルの期待予測誤差を推定することで、ハイパーパrameter選択のための効果的な交差検証を可能にする。
  • 二重渦系の例では、累積誤差指標で誤差 ≈ 0.015 と低く抑えられ、長時間にわたる動的挙動の予測が正確に達成されている。
  • 本手法は、ノイズや非線形性が存在する高次元時系列からも、低次元のマルコフ的モデルを効果的に学習可能である。
  • 分子動力学、流体動力学、確率過程など多様な系に対してロバストに機能し、可逆的および非可逆的動的挙動の両方で実証された性能を示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。