Skip to main content
QUICK REVIEW

[论文解读] The pilgrim's process

Walter Dempsey, Peter McCullagh|arXiv (Cornell University)|Dec 3, 2014
Bayesian Methods and Mixture Models参考文献 7被引用 1
一句话总结

本文提出了朝圣者过程(Pilgrim's Process),一种生成无限可交换、非负时间-事件序列的概率模型,其边缘分布为指数分布。该模型提供了联合密度和多变量生存函数的闭式表达式,与Kaplan-Meier估计建立联系,并揭示了与中国人餐厅过程(Chinese restaurant process)和印度煎饼餐过程(Indian buffet process)的关联,从而在生存分析与Ewens抽样公式之间建立了新颖的联系。

ABSTRACT

Pilgrim's monopoly is a probabilistic process giving rise to a non-negative sequence $T_1, T_2,\ldots$ that is infinitely exchangeable, a natural model for time-to-event data. The one-dimensional marginal distributions are exponential. The rules are simple, the process is easy to generate sequentially, and a simple expression is available for both the joint density and the multivariate survivor function. There is a close connection with the Kaplan-Meier estimator of the survival distribution. Embedded within the process is an infinitely exchangeable ordered partition processes connected to Markov branching processes in neutral evolutionary theory. Some aspects of the process, such as the distribution of the number of blocks, can be investigated analytically and confirmed by simulation. By ignoring the order, the embedded process can be considered as an infinitely exchangeable partition process, shown to be closely related to the Chinese restaurant process. Further connection to the Indian buffet process is also provided. Thus we establish a previously unknown link between the well-known Kaplan-Meier estimator and the important Ewens sampling formula.

研究动机与目标

  • 开发一种用于时间-事件数据的概率模型,该模型具有无限可交换性并产生指数边缘分布。
  • 提供一种简单、顺序的模拟方法,同时具备联合密度和生存函数的闭式表达式。
  • 建立生存分析与种群遗传学中可交换划分过程之间的联系。
  • 通过嵌入的随机过程,展示Kaplan-Meier估计器与Ewens抽样公式之间的关联。
  • 表明嵌入的划分过程等价于中国人餐厅过程,并与印度煎饼餐过程相关。

提出的方法

  • 该过程通过一种概率机制生成序列 $ T_1, T_2, \ldots $,确保其无限可交换性且一维边缘分布为指数分布。
  • 推导出该序列联合密度和多变量生存函数的闭式表达式。
  • 该过程嵌入了一个无限可交换的有序划分过程,与中性进化理论中的马氏分支过程相关联。
  • 通过忽略顺序,证明该划分过程等价于中国人餐厅过程。
  • 通过划分机制的结构,进一步建立与印度煎饼餐过程的联系。
  • 采用解析方法与基于模拟的方法,研究划分过程中块数的分布。

实验结果

研究问题

  • RQ1一种简单的概率过程如何能生成具有指数边缘分布的无限可交换时间-事件数据?
  • RQ2朝圣者过程与生存分析中的Kaplan-Meier估计器之间存在何种关系?
  • RQ3嵌入的划分过程与中国人餐厅过程等已知随机过程有何关联?
  • RQ4朝圣者过程如何与种群遗传学中的Ewens抽样公式相联系?
  • RQ5朝圣者过程与印度煎饼餐过程之间存在何种结构上的类比?

主要发现

  • 朝圣者过程生成了一组非负、无限可交换的随机变量,其边缘分布为指数分布。
  • 该过程的联合密度和多变量生存函数均存在闭式表达式。
  • 在忽略顺序的条件下,证明嵌入的划分过程等价于中国人餐厅过程。
  • 该过程建立了Kaplan-Meier估计器与Ewens抽样公式之间此前未知的联系。
  • 划分过程中块数的分布可通过解析方法分析,并经由模拟验证。
  • 该过程通过其划分机制,揭示了与印度煎饼餐过程的结构关联。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。