Skip to main content
QUICK REVIEW

[论文解读] Modeling Events with Cascades of Poisson Processes

Aleksandr Simma, Michael I. Jordan|arXiv (Cornell University)|Mar 15, 2012
Advanced Database Systems and Queries参考文献 3被引用 53
一句话总结

本文提出一种概率模型,将事件序列表示为泊松过程的级联,其中每个事件触发一个后续事件的新泊松过程。该模型通过分布式期望最大化(EM)算法实现高效推理,在建模社交媒体(Twitter)和协作编辑(Wikipedia)数据的时间动态方面表现出色。

ABSTRACT

We present a probabilistic model of events in continuous time in which each event triggers a Poisson process of successor events. The ensemble of observed events is thereby modeled as a superposition of Poisson processes. Efficient inference is feasible under this model with an EM algorithm. Moreover, the EM algorithm can be implemented as a distributed algorithm, permitting the model to be applied to very large datasets. We apply these techniques to the modeling of Twitter messages and the revision history of Wikipedia.

研究动机与目标

  • 建模每个事件均触发后续事件级联的复杂时间事件序列。
  • 开发一种概率框架,捕捉现实世界事件动态中的分支性和自激发特性。
  • 通过可扩展的EM算法实现在大规模数据集上的高效推理。
  • 支持分布式计算,以处理事件建模中的大数据工作负载。
  • 在真实世界事件序列(如Twitter消息和Wikipedia编辑)上评估该模型。

提出的方法

  • 序列中的每个事件均触发一个独立的泊松过程,其速率参数控制后续事件的强度。
  • 整体事件过程被建模为多个泊松过程的叠加,每个过程均源自一个父事件。
  • 使用EM算法进行参数估计,其中E步计算事件数的期望值,M步更新速率参数。
  • EM算法通过并行化方式实现分布式计算,以扩展至大规模数据集。
  • 该模型假设每个级联内的事件间隔时间无记忆,符合泊松过程的特性。
  • 基于泊松过程的叠加推导出似然函数,并通过迭代EM更新进行最大化。

实验结果

研究问题

  • RQ1如何利用概率框架对具有级联依赖关系的事件序列进行建模?
  • RQ2泊松过程的级联能否有效捕捉现实世界事件数据中的自激发和分支模式?
  • RQ3该模型在大规模事件序列上进行推理的效率如何?
  • RQ4该模型的EM算法能否实现分布式处理,以扩展至大数据应用?
  • RQ5该模型在真实世界的时间事件数据(如Twitter和Wikipedia)上的表现如何?

主要发现

  • 该模型成功捕捉了Twitter和Wikipedia数据中事件序列的自激发和分支特性。
  • 分布式EM算法实现了大规模数据集上的可扩展推理,使该模型在实际应用中具有可行性。
  • 在Twitter和Wikipedia事件序列的似然评估中,该模型优于基线方法。
  • 级联结构有效建模了随时间推移的活动传播,反映了现实世界的信息传播模式。
  • 泊松过程的叠加为复杂事件动态提供了灵活且可解析处理的表示方式。
  • 实证结果表明,该模型能够高精度地重构和预测事件发生时间。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。