QUICK REVIEW
[論文レビュー] Spectral Filtering for General Linear Dynamical Systems
Elad Hazan, Holden Lee|arXiv (Cornell University)|Feb 12, 2018
Control Systems and Identification参考文献 11被引用数 19
ひとこと要約
本稿では、潜在状態を有する一般線形力学系(LDS)におけるオンライン予測のための多項式時間アルゴリズムを提示する。非対称な遷移行列を取り扱うために、新規の凸緩和を用いたスペクトルフィルタリングを採用する。スペクトル半径に依存しない$Õ(\sqrt{T})$のレグレットを達成し、敵対的ノイズや一般のシステムダイナミクス下でも効率的な学習を可能にする。
ABSTRACT
We give a polynomial-time algorithm for learning latent-state linear dynamical systems without system identification, and without assumptions on the spectral radius of the system's transition matrix. The algorithm extends the recently introduced technique of spectral filtering, previously applied only to systems with a symmetric transition matrix, using a novel convex relaxation to allow for the efficient identification of phases.
研究の動機と目的
- 観測不能な潜在状態と未知のダイナミクスを有する一般線形力学系における、証明可能な効率性を持つオンライン予測アルゴリズムの開発。
- 先行研究のスペクトルフィルタリング手法に起因する制限の克服。特に、対称な遷移行列を仮定していたため、一般(非対称)LDSでは失敗していた点。
- レグレットバウンドにおけるスペクトル半径$\rho(A)$への依存を排除すること。不安定または悪条件なシステムでもロバストな性能を実現可能にする。
- 指数時間の離散化手法を用いる先行研究とは異なり、最適なレグレット保証を備えた多項式時間の解決策を提供すること。
- 非凸設定におけるレグレット最小化に適用可能な、LDSにおける位相とパラメータの同時同定のための新規な凸緩和の確立。
提案手法
- 複素固有値の位相とシステムパラメータを同時に同定できる新規な凸緩和を導入し、非凸LDS設定下での効率的学習を可能にする。
- 過去の入力と出力の依存関係をモデル化するため、潜在状態次元$d$に等しいサイズの自己回帰的時間窓を採用し、ノイズや複雑なダイナミクスに対するロバスト性を向上させる。
- 入出力データから構築したハンケル行列に対するスペクトルフィルタリングを実施。複素固有値に対応するため、位相に依存する分解を適用。
- インパulse応答を固有構造から導かれる低ランク部分空間で近似する波フィルタリング法を適用。固有値が複素数であっても有効。
- 疑似LDS予測子とレグレット最小化を組み合わせ、予測が平均二乗誤差の観点で「後悔」の観点で最良のLDSに近づくことを保証。
- システム関連多項式のノルムを用いて、自己回帰近似の誤差をバウンドし、安定性と収束性を保証。
実験結果
リサーチクエスチョン
- RQ1スペクトルフィルタリングは、複素固有値を有する一般(非対称)線形力学系に拡張可能か?
- RQ2非凸LDS学習において、固有位相とシステムパラメータの同時同定を可能にする凸緩和を設計可能か?
- RQ3スペクトル半径$\rho(A)$に依存しない多項式時間アルゴリズムが、$\tilde{O}(\sqrt{T})$のレグレットを達成可能か?
- RQ4サイズ$d$の自己回帰モデルは、潜在状態と複雑なダイナミクスを有する一般LDSをどれほどよく近似できるか?
- RQ5敵対的ノイズ下でのオンラインLDS予測において、近似誤差とレグレットのトレードオフはいかほどか?
主な発見
- アルゴリズムは$\mathsf{Regret}(T) \leq \tilde{O}(\sqrt{T}) + K \cdot L$というレグレットバウンドを達成する。ここで$L$は敵対的摂動による避けられない損失であり、$K$はシステム次元およびノルムに多項式的に依存する。
- レグレットはスペクトル半径$\rho(A)$に依存せず、先行手法が$\tilde{O}(1/(1-\rho(A)))$に依存していた点に比して顕著な改善である。
- 実行時間はすべての自然パラメータに関して多項式的であり、一般LDS予測においてこの保証を持つ最初の効率的アルゴリズムである。
- 自己回帰モデルの近似誤差は、システム関連多項式のノルムによってバウンドされ、安定性と収束性が保証される。
- 遷移行列$A$が非対称で複素固有値を有する場合でも、$\tilde{O}(\sqrt{T})$のレグレットを達成でき、先行スペクトルフィルタリングの主要な制限を克服した。
- 理論的解析により、アルゴリズムの誤差が$\tilde{O}(\sqrt{T})$項と、ノイズ依存項$O(R_{\infty}^2 \tau^3 R_{\Theta}^2 R_{\Psi}^2 L)$に支配されることを確認。すべての定数はシステムパrametersに多項式的に依存する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。