Skip to main content
QUICK REVIEW

[论文解读] Piecewise deterministic Markov process — recent results

Romain Azaïs, Jean-Baptiste Bardet|arXiv (Cornell University)|Jan 1, 2014
Gene Regulatory Network Analysis参考文献 53被引用 58
一句话总结

本文综述了最近在随机分段确定性马尔可夫过程(PDMPs)方面的进展,重点关注其长期行为、跳跃时间分布的统计估计以及数值模拟方法。提出了一种基于跳跃后位置和跳跃时间的嵌入马尔可夫链的非参数核估计器,用于估计跳跃时间的条件密度,并在正则性条件下建立了其一致性。

ABSTRACT

We give a short overview of recent results on a specific class of Markov process: the Piecewise Deterministic Markov Processes (PDMPs). We first recall the definition of these processes and give some general results. On more specific cases such as the TCP model or a model of switched vector fields, better results can be proved, especially as regards long time behaviour. We continue our review with an infinite dimensional example of neuronal activity. From the statistical point of view, these models provide specific challenges: we illustrate this point with the example of the estimation of the distribution of the inter-jumping times. We conclude with a short overview on numerical methods used for simulating PDMPs.

研究动机与目标

  • 提供PDMPs在理论与应用方面最新发展的全面概述。
  • 解决在一般状态空间中估计PDMP跳跃时间条件分布的统计挑战。
  • 基于观测到的嵌入马尔可夫链,开发一种非参数方法来估计跳跃速率和跳跃时间的生存函数。
  • 在正则性假设下,建立所提非参数估计器的理论一致性。
  • 综述用于模拟PDMPs及求解相关最优控制问题的数值方法。

提出的方法

  • 提出一种非参数核估计器,用于在给定跳跃后位置x和y以及时间t时的跳跃速率函数eλ(x, y, t)。
  • 引入状态空间的一个划分(Bk),并使用观测频率对条件生存概率H(A, Bk, t)进行经验估计。
  • 利用类似于生存分析中Aalen的乘法强度模型的连续时间鞅结构,来证明估计器的一致性。
  • 将最终估计器构造为加权和:∑k bln(A, Bk, t) · H̃n(A, Bk, t),其中bln估计跳跃速率,H̃n估计生存概率。
  • 采用从PDMP中通过在跳跃时刻及额外的泊松采样时刻观测得到的离散时间马尔可夫链{θn},以确保不可约性和常返性。
  • 依赖于PDMP的常返性与嵌入链{θn}的常返性之间的等价性,从而可利用Foster-Lyapunov准则来推断遍历性。

实验结果

研究问题

  • RQ1在非参数设定下,如何一致地估计PDMP中跳跃时间的条件密度?
  • RQ2在一般状态空间中,PDMP存在不变测度和遍历性的充分条件是什么?
  • RQ3如何调整数值方法以模拟PDMPs并计算期望或停止时间?
  • RQ4嵌入马尔可夫链{Θn}在表征PDMPs的长期行为中起什么作用?
  • RQ5能否在弱正则性假设下构造一个一致的跳跃速率非参数估计器?

主要发现

  • 所提出的跳跃时间条件密度的非参数估计器具有一致性:对任意ε, η > 0,存在N, A和划分(Bk),使得对所有n ≥ N,其上范数误差超过η的概率小于ε。
  • 该估计器在X的每个紧子集K上实现一致收敛,确保在状态空间的有界区域中具有稳定的近似性能。
  • 跳跃速率eλ的核估计器的一致性依赖于类似于生存分析中乘法强度模型的连续时间鞅结构。
  • 对生存概率Pν[Sn+1 > t, Zn+1 ∈ Bk | Zn ∈ A]的经验估计具有一致性,是最终估计器的关键组成部分。
  • PDMP的常返性与嵌入链{θn}的常返性之间的等价性,使得可以利用标准马尔可夫链工具来推断长期行为。
  • 基于嵌入链{Θn}的量化或核离散化方法的数值方法,对求解PDMP的最优停止和脉冲控制问题具有有效性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。