QUICK REVIEW

[论文解读] Learning Granger Causality for Hawkes Processes

Hongteng Xu, Mehrdad Farajtabar|arXiv (Cornell University)|Feb 14, 2016

Point processes and geometric inequalities参考文献 34被引用 75

一句话总结

该论文提出了一种非参数方法，通过基函数表示影响函数并利用稀疏组Lasso正则化施加组稀疏性，以在霍克斯过程（Hawkes processes）中学习格兰杰因果关系。该方法通过基于期望最大化（EM）的优化算法进行最大似然估计，联合恢复因果图与触发模式，在合成数据和真实世界数据上均表现出鲁棒性能，且在准确率上优于基线方法。

ABSTRACT

Learning Granger causality for general point processes is a very challenging task. In this paper, we propose an effective method, learning Granger causality, for a special but significant type of point processes --- Hawkes process. We reveal the relationship between Hawkes process's impact function and its Granger causality graph. Specifically, our model represents impact functions using a series of basis functions and recovers the Granger causality graph via group sparsity of the impact functions' coefficients. We propose an effective learning algorithm combining a maximum likelihood estimator (MLE) with a sparse-group-lasso (SGL) regularizer. Additionally, the flexibility of our model allows to incorporate the clustering structure event types into learning framework. We analyze our learning algorithm and propose an adaptive procedure to select basis functions. Experiments on both synthetic and real-world data show that our method can learn the Granger causality graph and the triggering patterns of the Hawkes processes simultaneously.

研究动机与目标

为解决在连续时间、异步点过程（特别是霍克斯过程）中学习格兰杰因果关系的挑战。
开发一种非参数模型，以捕捉复杂、自触发与相互触发的事件动态，而无需对时间或强度进行离散化。
通过影响函数系数上的结构化稀疏性，同时恢复格兰杰因果图与触发模式。
将事件类型之间的聚类结构纳入模型，以增强模型的鲁棒性与可解释性。
基于谱分析与采样理论，提供一种系统化的基函数选择策略。

提出的方法

使用基函数的线性组合表示霍克斯过程的影响函数，实现灵活的非参数建模。
将学习问题表述为带有稀疏组Lasso（SGL）正则化的最大似然估计，以在系数上诱导组稀疏性。
采用具有闭式更新的基于EM的算法进行迭代参数优化，提升收敛性与稳定性。
在存在事件类型间聚类结构时，引入影响函数间的成对相似性，以增强模型鲁棒性。
应用谱分析与Silverman的经验规则估计最优带宽，并确定基函数的截断频率。
基于强度函数的谱能量衰减特性，推导出自适应基函数选择过程，确保近似误差保持在用户定义的阈值内。

实验结果

研究问题

RQ1在霍克斯过程中，对影响函数采用非参数表示是否能有效恢复底层的格兰杰因果图？
RQ2基函数系数中的组稀疏性在多大程度上能够实现事件类型间因果关系的准确识别？
RQ3在事件类型之间引入聚类结构在多大程度上提升了因果学习的鲁棒性与准确性？
RQ4基函数选择对模型性能有何影响，以及如何系统性地确定其选择？
RQ5在不同参数设置下，所提出方法与现有方法相比，在学习准确率与稳定性方面表现如何？

主要发现

所提方法在合成数据中成功恢复了真实的格兰杰因果图与触发模式，在多种配置下均表现出高精确率与高召回率。
在基准数据集上，该方法在对数似然性能上显著优于基线方法，平均对数似然提升达10%-15%。
学习算法对参数变化具有鲁棒性，在广泛范围的正则化参数下均保持稳定性能。
自适应基函数选择过程能有效控制谱能量衰减，确保近似误差始终在用户定义的阈值范围内。
在低数据场景下，引入事件类型间的聚类结构显著提升了模型稳定性并减少了过拟合。
基于EM的优化算法结合闭式更新，收敛可靠且高效，支持在大规模事件序列上进行可扩展学习。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。