Skip to main content
QUICK REVIEW

[論文レビュー] Learning nonlinear dynamical systems from a single trajectory

Dylan J. Foster, Alexander Rakhlin|arXiv (Cornell University)|Apr 30, 2020
Receptor Mechanisms and Signaling参考文献 42被引用数 24
ひとこと要約

本稿では、単一の軌道から形式 $x_{t+1} = \sigma(\Theta^\star x_t) + \varepsilon_t$ の非線形力学系を、最適な標本複雑度と線形実行時間で計算的に効率的に学習するアルゴリズムを提示する。グローバル安定性の条件を確立し、適切に条件付けられた状態共分散を保証するとともに、従来の一般化線形モデル学習を従属データに拡張し、スペクトルノルムの束縛なしで $\Theta^\star$ を回復可能とし、ReLU などの非厳密増加リンク関数に対しても対応可能となる。

ABSTRACT

We introduce algorithms for learning nonlinear dynamical systems of the form $x_{t+1}=σ(Θ^{\star}x_t)+\varepsilon_t$, where $Θ^{\star}$ is a weight matrix, $σ$ is a nonlinear link function, and $\varepsilon_t$ is a mean-zero noise process. We give an algorithm that recovers the weight matrix $Θ^{\star}$ from a single trajectory with optimal sample complexity and linear running time. The algorithm succeeds under weaker statistical assumptions than in previous work, and in particular i) does not require a bound on the spectral norm of the weight matrix $Θ^{\star}$ (rather, it depends on a generalization of the spectral radius) and ii) enjoys guarantees for non-strictly-increasing link functions such as the ReLU. Our analysis has two key components: i) we give a general recipe whereby global stability for nonlinear dynamical systems can be used to certify that the state-vector covariance is well-conditioned, and ii) using these tools, we extend well-known algorithms for efficiently learning generalized linear models to the dependent setting.

研究の動機と目的

  • 単一の観測軌道から非線形力学系を効率的に学習するアルゴリズムの開発。
  • 重み行列 $\Theta^\star$ の回復において、最適な標本複雑度と線形実行時間の達成。
  • $\Theta^\star$ に関する仮定を緩和し、スペクトルノルムの有界性を不要とし、ReLU などの非厳密増加リンク関数に対しても回復可能とする。
  • 非線形系のグローバル安定性と統計的学習に不可欠な適切に条件付けられた状態共分散との関連を示す一般枠組みの確立。

提案手法

  • グローバル安定性を活用して、状態ベクトル共分散行列が適切に条件付けられていることを証明する新しいアルゴリズムを提案。
  • 系の安定性(スペクトル半径および共分散カーネルのトレースを介して)を、従属データ設定下での推定共分散行列の可逆性に結びつける一般的手続きを導入。
  • 時間的依存性を考慮した下で、既知の一般化線形モデル学習手法を、オフセットラデマッハ複雑度の分析を通じて時系列文脈に適応。
  • パラメータノルムにおける $\Theta^\star$ への収束を保証するため、慎重に選ばれたステップサイズ $\eta_t$ を用いた投影勾配降下型の更新を採用。
  • 依存構造を考慮した $\varepsilon_t x_t^\top$ を含む推定量プロセスのバインドに、集中不等式およびチェインニングの議論を用いる。
  • $\|\Theta^{(t)} - \Theta^\star\|_F^2$ に関する再帰的不等式を導出し、統計的誤差項への指数的減衰を示し、有限時間収束を導出。

実験結果

リサーチクエスチョン

  • RQ1単一の軌道から、最適な標本複雑度と線形時間で非線形力学系の重み行列 $\Theta^\star$ を学習可能か?
  • RQ2$\Theta^\star$ のスペクトルノルムに束縛を課さずに、どのような条件下で学習可能か?
  • RQ3ReLU などの非厳密増加リンク関数を有する非線形系に対しても、効率的学習アルゴリズムを拡張可能か?
  • RQ4非線形系のグローバル安定性が、学習に適した推定共分散行列が適切に条件付けられていることをどのように保証するか?
  • RQ5パラメータノルムにおける学習アルゴリズムの有限標本収束速度は何か?また、系の次元およびノイズのスケーリングにどのように依存するか?

主な発見

  • $t \geq 8cB^2 e^{\frac{8\rho \mathsf{tr}(K)}{1-\rho}} \log\left(\frac{nW^4}{R^2 d^2 (\log(1/\delta) + \log(1 + 2n\sqrt{R}))}\right)$ 回の反復後、 $\|\Theta^{(t)} - \Theta^\star\|_F^2 \leq 2c \cdot e^{\frac{8\rho \mathsf{tr}(K)}{1-\rho}} \cdot \frac{R^2 d^2 (\log(1/\delta) + \log(1 + 2n\sqrt{R}))}{nW^2}$ が成立する。
  • 収束速度は、スペクトル半径 $\rho$ および共分散カーネル $K$ のトレースに依存し、線形ケースにおけるスペクトルノルムを一般化する。
  • $\|\Theta^\star\|_2$ の有界性を要件とせず、代わりに $\rho$ および $\mathsf{tr}(K)$ を含む一般化された安定性条件に依存する。
  • ReLU などの非厳密増加リンク関数に対しても、深層学習で一般的なため、従来の研究とは異なり、本手法は耐性を示す。
  • 標本複雑度は最適であり、実行時間はステップ数 $n$ に対して線形であるため、スケーラブルである。
  • 解析により、グローバル安定性が適切に条件付けられた状態共分散をもたらし、従属データにおける統計的一貫性にとって不可欠であることが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。