QUICK REVIEW

[論文レビュー] Bayesian Inference and Learning in Gaussian Process State-Space Models with Particle MCMC

Roger Frigola, Fredrik Lindsten|arXiv (Cornell University)|Jun 12, 2013

Gaussian Processes and Bayesian Inference参考文献 21被引用数 82

ひとこと要約

本稿では、非パラメトリックなダイナミクスを学習するための完全ベイジアン推論フレームワークを、ガウス過程状態空間モデル（GP-SSM）に適用し、粒子マルコフ連鎖モンテカルロ法（PMCMC）を用いて、潜在状態と非パラメトリックなダイナミクスを同時に推定する手法を提案する。ガウス過程事前分布を用いた遷移関数の周辺化により、固定されたパラメトリックな形式を仮定せず、正確なスムージングと予測不確実性の評価が可能となり、高い非線形性と不確実性を示す複雑な力学系において、最先端の性能を達成する。

ABSTRACT

State-space models are successfully used in many areas of science, engineering and economics to model time series and dynamical systems. We present a fully Bayesian approach to inference \emph{and learning} (i.e. state estimation and system identification) in nonlinear nonparametric state-space models. We place a Gaussian process prior over the state transition dynamics, resulting in a flexible model able to capture complex dynamical phenomena. To enable efficient inference, we marginalize over the transition dynamics function and infer directly the joint smoothing distribution using specially tailored Particle Markov Chain Monte Carlo samplers. Once a sample from the smoothing distribution is computed, the state transition predictive distribution can be formulated analytically. Our approach preserves the full nonparametric expressivity of the model and can make use of sparse Gaussian processes to greatly reduce computational complexity.

研究の動機と目的

非線形で非パラメトリックな状態空間モデルにおける、潜在状態推定とシステム同定を統合的に扱う完全ベイジアン手法の開発。
パラメトリックモデルの限界を克服するため、未知の状態遷移ダイナミクスを柔軟に表現可能なガウス過程を用いる。
遷移関数を周辺化することで、直接的に状態とハイパーパrameterの結合スムージング分布をサンプリングする効率的な推論を可能にする。
スパースGP近似を用いることで計算コストを低減しつつ、完全な非パラメトリック表現力を維持する。
特に高次元または観測が不十分な状態空間においても、不確実性を伴う複雑な力学系の学習に耐性のあるフレームワークを提供する。

提案手法

状態遷移関数にガウス過程事前分布を設定することで、複雑なダイナミクスの非パラメトリックなモデリングを可能にする。
推論の過程で遷移関数を周辺化し、状態とハイパーパrameterの結合スムージング分布からの直接サンプリングを可能にする。
未知のダイナミクスに対しても、スムージング分布を効率的に探索できるように、特化したアンセストラリサンプリング付きパーティクルギブスサンプリング（PGAS）を採用する。
状態軌道がサンプリングされた後で、遷移関数の事後分布が解析的に得られ、ダイナミクスの正確な学習が可能になる。
計算複雑性を低減するため、インダクティングポイントを用いたスパースGP近似を採用するが、精度を損なわない。
予測分布をガウス分布の混合形で表現でき、予測の平均値と不確実性を両方とも捉えることができる。

実験結果

リサーチクエスチョン

RQ1非線形状態空間モデルにおいて、完全ベイジアンアプローチが潜在状態と非パラメトリックなダイナミクスを同時に推定可能か？
RQ2推論の過程で遷移関数を周辺化することで、完全な非パラメトリック表現力を維持できるか？
RQ3未知のダイナミクスを非パラメトリックにモデル化する状況において、PMCMCサンプラーがスムージング分布を効率的に探索できるか？
RQ4予測精度と不確実性評価の観点から、提案手法はパラメトリックモデルと比較して優れているか？
RQ5高次元状態空間において、スパースGP近似は計算コストを低減しつつも性能を維持できるか？

主な発見

提案されたGP-SSMは、状態遷移予測においてRMSEが1.7±0.2を達成し、固定パラメトリックモデル（7.1±0.0）や線形モデル（5.5±0.1）を著しく上回った。
スムージング分布は、t=10における2つの逆符号の状態が同じ観測値をもたらすような、多重モードの状態軌道を正確に捉えていた。
平均関数が不適切（モデルB）であった場合でも、GP-SSMは正確なスムージングサンプルを生成し、GP事前分布のモデル誤指定に対するロバストネスを示した。
40個のインダクティングポイントを用いたスパースGP-SSMは、予測でRMSEが1.8±0.2、スムージングで2.7±0.4を達成し、優れたスケーラビリティを示した。
訓練データから離れた領域では不確実性が高く、観測状態の近くでは不確実性が低くなる傾向を示し、信頼性のある不確実性評価がなされていることが確認された。
100件のノイズの強い観測値しか得られないカート・ポール系においても、モデルは正確な1ステップ先予測分布と、適切にキャリブレーションされた不確実性帯を生成した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。