[论文解读] Discovering Latent Network Structure in Point Process Data
本文提出了一种全贝叶斯概率模型,将多变量霍克斯过程与可交换随机图先验相结合,从点过程数据中发现潜在网络结构。通过利用泊松叠加原理实现高效的数据增广,该方法支持并行MCMC推断,并在金融交易和帮派暴力数据中成功揭示了可解释的交互模式,其预测性能优于基线模型。
Networks play a central role in modern data analysis, enabling us to reason about systems by studying the relationships between their parts. Most often in network analysis, the edges are given. However, in many systems it is difficult or impossible to measure the network directly. Examples of latent networks include economic interactions linking financial instruments and patterns of reciprocity in gang violence. In these cases, we are limited to noisy observations of events associated with each node. To enable analysis of these implicit networks, we develop a probabilistic model that combines mutually-exciting point processes with random graph models. We show how the Poisson superposition principle enables an elegant auxiliary variable formulation and a fully-Bayesian, parallel inference algorithm. We evaluate this new model empirically on several datasets.
研究动机与目标
- 为解决在无法直接观测边或顶点的情况下推断潜在网络结构的挑战,依赖于噪声事件发射数据。
- 将点过程数据中节点之间的相互激发建模为潜在网络交互的证据。
- 开发一种可扩展的全贝叶斯推断框架,以考虑潜在网络结构中的不确定性。
- 在涉及金融交易和城市暴力的真实世界数据集上评估模型,展示其可解释性与预测能力。
- 通过引入结构化的随机图先验和非参数背景率,推广现有霍克斯过程模型。
提出的方法
- 该模型将多变量霍克斯过程与可交换随机图先验结合,以表示潜在网络结构。
- 利用泊松叠加原理引入辅助变量,分解事件来源,实现高效的数据增广。
- 通过并行马尔可夫链蒙特卡洛(MCMC)实现全贝叶斯推断方案,支持不确定性量化。
- 使用具有高斯过程先验的对数高斯随机场(LGCP)对背景率进行建模,以实现非参数灵活性。
- 该框架支持多种网络先验,包括埃拉德-雷尼图、随机块模型和与距离相关的图。
- 辅助变量的设定使得MCMC更新可在事件和过程之间高效并行化。
实验结果
研究问题
- RQ1我们能否从未直接观测到边和顶点的间接噪声事件数据中推断出潜在网络结构?
- RQ2如何将点过程数据中节点之间的相互激发建模为潜在网络交互的证据?
- RQ3何种网络先验和背景率模型最能捕捉真实世界事件序列的结构与动态?
- RQ4该模型在金融和犯罪数据上的预测性能与基线模型相比如何?
- RQ5在霍克斯过程中,何种条件能确保推断出的潜在网络结构的稳定性?
主要发现
- 在芝加哥凶杀案数据上,采用四簇埃拉德-雷尼图先验并引入交互项的模型取得了最高的预测对数似然,优于与距离相关的先验。
- 芝加哥数据中推断出的聚类对应于可解释的社会结构:'安全郊区'、'缓冲街区'和'帮派领地'。
- 蓝色聚类表现出强烈的自激发特征,与地盘争夺期间暴力事件爆发一致,并与1990–1991年历史报告中记录的帮派活动增加相符。
- 该模型捕捉到了凶杀率的显著季节性模式:夏季达到峰值,冬季下降,该模式通过结合二次和周期性核函数的LGCP被有效建模。
- 四簇埃拉德-雷尼模型表现出更优的预测性能,表明在该数据集中,长程或局部交互可能并非主导驱动因素。
- 该框架在合成数据集和真实世界数据集中均成功揭示了可解释且稳定的网络结构,展示了其鲁棒性与可扩展性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。