Skip to main content
QUICK REVIEW

[論文レビュー] Modeling Events with Cascades of Poisson Processes

Aleksandr Simma, Michael I. Jordan|arXiv (Cornell University)|Mar 15, 2012
Advanced Database Systems and Queries参考文献 3被引用数 53
ひとこと要約

本論文では、各イベントが後続イベントのポアソン過程を引き起こす、イベント系列を段階的なポアソン過程の重ね合わせとして表現する確率的モデルを提案する。このモデルは分散型EMアルゴリズムを用いて効率的な推論を可能にし、TwitterのようなソーシャルメディアおよびWikipediaのような共同編集データの時系列的ダイナミクスのモデリングにおいて優れた性能を発揮する。

ABSTRACT

We present a probabilistic model of events in continuous time in which each event triggers a Poisson process of successor events. The ensemble of observed events is thereby modeled as a superposition of Poisson processes. Efficient inference is feasible under this model with an EM algorithm. Moreover, the EM algorithm can be implemented as a distributed algorithm, permitting the model to be applied to very large datasets. We apply these techniques to the modeling of Twitter messages and the revision history of Wikipedia.

研究の動機と目的

  • 各イベントが後続イベントの連鎖を引き起こすような、複雑な時系列的イベント系列をモデリングすること。
  • 現実世界のイベントダイナミクスの分岐的・自己駆動的性質を捉える確率的フレームワークを構築すること。
  • 拡張可能なEMアルゴリズムを用いて大規模データセット上の効率的推論を可能にすること。
  • 大規模データワークロードを処理するための分散計算をサポートすること。
  • TwitterのメッセージやWikipediaの編集履歴のような実世界のイベント系列に対してモデルを評価すること。

提案手法

  • イベント系列内の各イベントは、後続イベントの強度を制御するレートパラメータを持つ独立したポアソン過程を引き起こす。
  • 全体のイベント過程は、親イベントから出発する複数のポアソン過程の重ね合わせとしてモデル化される。
  • パラメータ推定にはEMアルゴリズムが用いられ、Eステップでは期待されるイベント数の計算、Mステップではレートパラメータの更新が行われる。
  • EMアルゴリズムは並列化され、大規模データセットにスケーリング可能な分散型で実装される。
  • 各段階におけるイベント間隔は記憶なしの性質を有し、ポアソン過程の性質と整合する。
  • 尤度関数はポアソン過程の重ね合わせに基づいて導出され、反復的EM更新により最大化される。

実験結果

リサーチクエスチョン

  • RQ1段階的な依存関係を持つイベント系列を、確率的フレームワークでどのようにモデリングできるか?
  • RQ2段階的なポアソン過程の組み合わせは、実世界のイベントデータにおける自己駆動的および分岐的パターンを効果的に捉えることができるか?
  • RQ3このモデルを用いた大規模イベント系列における推論はどの程度効率的に行えるか?
  • RQ4このモデルのためのEMアルゴリズムは、大規模データアプリケーションにスケーリング可能に分散化できるか?
  • RQ5このモデルはTwitter や Wikipedia のような実世界の時系列イベントデータにおいて、どの程度の性能を発揮するか?

主な発見

  • 本モデルは、Twitter および Wikipedia データにおけるイベント系列の自己駆動的および分岐的性質を効果的に捉えている。
  • 分散型EMアルゴリズムにより、大規模データセット上でのスケーラブルな推論が可能となり、実世界の応用に実用的である。
  • Twitter および Wikipedia のイベント系列において、尤度ベースの評価でベースライン手法を上回る性能を発揮している。
  • 段階的構造は、時間経過に伴う活動の伝搬を効果的にモデル化しており、現実世界の情報拡散パターンを反映している。
  • ポアソン過程の重ね合わせは、複雑なイベントダイナミクスを柔軟かつ解析的に取り扱える表現を提供する。
  • 実験的結果から、本モデルはイベント発生時刻の再構築および予測を高い正確性で行う能力を示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。