Skip to main content
QUICK REVIEW

[论文解读] Nested particle filters for online parameter estimation in discrete-time state-space Markov models

Dan Crisan, Joaquı́n Mı́guez|arXiv (Cornell University)|Aug 8, 2013
Target Tracking and Data Fusion in Sensor Networks参考文献 33被引用 19
一句话总结

本文提出一种递归嵌套粒子滤波器,用于在离散时间状态空间马尔可夫模型中进行在线贝叶斯参数估计,通过两层粒子滤波器联合追踪状态和静态参数。该方法在后验分布下对积分的 $L_p$ 收敛速率为 $\frac{1}{\sqrt{N}} + \frac{1}{\sqrt{M}}$,且计算复杂度随时间保持恒定。

ABSTRACT

We address the problem of approximating the posterior probability distribution of the fixed parameters of a state-space dynamical system using a sequential Monte Carlo method. The proposed approach relies on a nested structure that employs two layers of particle filters to approximate the posterior probability measure of the static parameters and the dynamic state variables of the system of interest, in a vein similar to the recent "sequential Monte Carlo square" (SMC$^2$) algorithm. However, unlike the SMC$^2$ scheme, the proposed technique operates in a purely recursive manner. In particular, the computational complexity of the recursive steps of the method introduced herein is constant over time. We analyse the approximation of integrals of real bounded functions with respect to the posterior distribution of the system parameters computed via the proposed scheme. As a result, we prove, under regularity assumptions, that the approximation errors vanish asymptotically in $L_p$ ($p \ge 1$) with convergence rate proportional to $\frac{1}{\sqrt{N}} + \frac{1}{\sqrt{M}}$, where $N$ is the number of Monte Carlo samples in the parameter space and $N imes M$ is the number of samples in the state space. This result also holds for the approximation of the joint posterior distribution of the parameters and the state variables. We discuss the relationship between the SMC$^2$ algorithm and the new recursive method and present a simple example in order to illustrate some of the theoretical findings with computer simulations.

研究动机与目标

  • 解决在非线性、非高斯状态空间模型中对静态参数进行在线贝叶斯估计的挑战,其中解析解不可行。
  • 开发一种递归、顺序的蒙特卡洛方法,避免离线或批量参数估计带来的计算负担。
  • 确保算法在整个时间过程中保持恒定的计算复杂度,与以往的 SMC² 方法不同。
  • 在正则条件下,为参数和状态的后验近似提供理论保证。
  • 为有界函数关于参数和状态后验分布的积分建立误差界。

提出的方法

  • 采用具有两层的嵌套粒子滤波器架构:一层用于动态状态变量,另一层用于静态参数,形成层次化结构。
  • 使用顺序蒙特卡洛(SMC)方法,通过联合滤波方法递归更新参数和状态的后验分布。
  • 引入一种抖动核机制,以防止参数空间中的粒子退化,确保重采样过程的鲁棒性。
  • 应用一种递归更新方案,其中参数滤波器利用状态滤波器的输出进行更新,实现在线自适应。
  • 采用基于核的扰动策略,控制方差以保持参数粒子集的多样性。
  • 推导后验期望的 $L_p$ 近似误差的理论界,表明收敛速度与 $\frac{1}{\sqrt{N}} + \frac{1}{\sqrt{M}}$ 成正比,其中 $N$ 和 $M$ 分别为参数空间和状态空间中的粒子数。

实验结果

研究问题

  • RQ1能否设计一种递归、在线的粒子滤波方法,以联合估计非线性、非高斯状态空间模型中的静态参数和动态状态?
  • RQ2所提出的嵌套粒子滤波器是否在时间上保持恒定的计算复杂度,而不同于以往的 SMC² 方法?
  • RQ3在参数和状态的联合后验下,有界函数积分的后验近似理论收敛速率是多少?
  • RQ4近似误差界如何依赖于参数空间和状态空间中的粒子数量?
  • RQ5在标准正则性假设下,该方法是否能在 $L_p$ 范数下对 $p \geq 1$ 实现收敛?

主要发现

  • 所提出的嵌套粒子滤波器对有界函数的积分实现了 $L_p$ 收敛,收敛速率为 $\frac{1}{\sqrt{N}} + \frac{1}{\sqrt{M}}$,其中 $N$ 为参数粒子数,$M$ 为状态粒子数。
  • 在正则条件下,参数和状态的联合后验分布近似误差也以相同速率收敛。
  • 递归算法在整个时间过程中保持恒定的计算复杂度,这是相对于以往 SMC² 方法的一大优势,后者随时间增长而增加。
  • 理论分析证明,在紧致性和利普希茨正则性假设下,误差界在时间上是均匀的,且与时间步数无关。
  • 使用具有可控方差的抖动核机制可确保粒子多样性并防止退化,从而实现稳定长期估计。
  • 数值模拟验证了理论收敛速率,并展示了该方法在简单状态空间模型中的有效性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。