Skip to main content
QUICK REVIEW

[論文レビュー] Near optimal finite time identification of arbitrary linear dynamical systems

Tuhin Sarkar, Alexander Rakhlin|arXiv (Cornell University)|Dec 4, 2018
Control Systems and Identification被引用数 70
ひとこと要約

この論文は、単一の軌道から一般的なLTIシステムをOLSで推定する際の非漸近的有限時間誤差界を導出し、安定、限界安定、爆発的領域をカバーし、OLSが不一致となる条件を示す。

ABSTRACT

We derive finite time error bounds for estimating general linear time-invariant (LTI) systems from a single observed trajectory using the method of least squares. We provide the first analysis of the general case when eigenvalues of the LTI system are arbitrarily distributed in three regimes: stable, marginally stable, and explosive. Our analysis yields sharp upper bounds for each of these cases separately. We observe that although the underlying process behaves quite differently in each of these three regimes, the systematic analysis of a self--normalized martingale difference term helps bound identification error up to logarithmic factors of the lower bound. On the other hand, we demonstrate that the least squares solution may be statistically inconsistent under certain conditions even when the signal-to-noise ratio is high.

研究の動機と目的

  • 入力なしで X_{t+1}=AX_t+η_{t+1} の OLS 推定量に対する鋭い非漸近的同定誤差界を提供する
  • 安定、限界安定、爆発的領域を通じて任意の固有値分布にも適用可能な境界を開発する
  • 爆発的設定における OLS の一貫性には A の正則性が不可欠であることを示す
  • 誤差制御におけるサンプル共分散と自己正規化マルチゲイン項の役割を強調する
  • 正則性条件が満たされない場合に OLS が不一致となり得ることを示す

提案手法

  • Λ を A のヤードン形式として系を X_{t+1}=AX_t+η_{t+1} にモデル化し、Y_T=∑_{t=0}^T X_tX_t' および S_T=∑_{t=0}^T X_tη_{t+1}' を分析する
  • サブガウシアンノイズと自己正規化濃度補間を利用した自己正規化マルチゲイン項に対する非漸近的境界を定式化する(命題 3.1 を活用)
  • 三つの領域 S0(安定)、S1(限界安定)、S2(爆発)における Y_T の振る舞いを特徴づけ、決定論的な上界/下界(V_up, V_dn)を導出する
  • 正則性の下で可逆性条件を用いて z_t=A^{-t}x_t に変換し、 explosive case では U_T と F_T を分析する
  • 反集中化とサブガウシアン尾部不等式を用いて境界を鋭くし、ほぼ最適なレートを得る(対数因子まで)
  • δ に依存する下界を示し、A が不正則な場合に OLS が不一致となることを示す

実験結果

リサーチクエスチョン

  • RQ1安定、限界安定、爆発的領域を跨る X_{t+1}=AX_t+η_{t+1} における A の OLS 推定量について、どのような有限時間非漸近誤差界が導出できるか?
  • RQ2任意の固有値分布に対して OLS が一貫性を保つのは A のどの正則性条件下か?
  • RQ3各領域で共分散サンプルの性質と説明変数とノイズ間の交差項が同定誤差に与える影響はどうなるか?
  • RQ4導出された境界は厳密か、異なる領域で下界が上界に一致するか?
  • RQ5これらの結果は入力 U_t の存在やヘビー尾ノイズ分布の存在拡張できるか?

主な発見

  • 安定および限界安定な A に対して、非漸近的誤差は O(sqrt(log(1/δ))/√T) または近似的な最適レート(対数因子を除く)でスケールする
  • 爆発的 A では正則性が成り立つ場合、誤差は時間 T とともに指数的に減衰し、δ に依存する境界は 1/δ に比例する
  • 本解析はサンプル共分散と自己正規化マルチゲイン項を結合することにより、領域特有の鋭い境界を提供する
  • A の正則性(固有値が 1 より大きいものの幾何的重複度が 1) は爆発的設定における OLS の一貫性には不可欠であり、そうでない場合 OLS は不一致となる
  • A が不規則な場合、信号対ノイズ比が高くても、サンプル共分散の悪条件性のため OLS が不一致となり得る
  • 固有値が安定、限界安定、爆発の各領域にまたがり任意に分布していても、結果は一般的なケースをカバーし、いくつかのケースでは下界も一致する

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。