[论文解读] Learning Network of Multivariate Hawkes Processes: A Time Series Approach
本文提出一种基于时间序列的方法,通过利用二阶统计量估计激发矩阵的支撑集,来学习多变量线性霍克斯过程中的因果网络结构。该方法证明了激发矩阵的支撑集与有向信息图(DIG)等价,从而在无需独立同分布样本或对称过程假设的情况下实现高效的因果发现,并在包括股票市场和MemeTracker在内的合成数据集和真实世界数据集上进行了验证。
Learning the influence structure of multiple time series data is of great interest to many disciplines. This paper studies the problem of recovering the causal structure in network of multivariate linear Hawkes processes. In such processes, the occurrence of an event in one process affects the probability of occurrence of new events in some other processes. Thus, a natural notion of causality exists between such processes captured by the support of the excitation matrix. We show that the resulting causal influence network is equivalent to the Directed Information graph (DIG) of the processes, which encodes the causal factorization of the joint distribution of the processes. Furthermore, we present an algorithm for learning the support of excitation matrix (or equivalently the DIG). The performance of the algorithm is evaluated on synthesized multivariate Hawkes networks as well as a stock market and MemeTracker real-world dataset.
研究动机与目标
- 开发一种无需独立同分布样本即可学习多变量线性霍克斯过程中因果影响网络的方法。
- 建立激发矩阵支撑集与有向信息图(DIG)之间的正式等价关系,从而通过矩阵估计实现因果推断。
- 将现有方法扩展至对称霍克斯过程之外,避免对强度相等性和拉普拉斯变换结构的严格假设。
- 提供一种基于二阶统计量谱特性的分析性、鲁棒且计算高效的激发矩阵估计算法。
提出的方法
- 该方法利用平稳多变量霍克斯过程的二阶统计量来估计激发矩阵,避免对独立同分布样本的依赖。
- 利用自相关密度的拉普拉斯变换,并在指数衰减核下推导出激发矩阵的精确解析解。
- 通过识别谱密度中的极点,利用特定拉普拉斯频率处的方程组恢复衰减参数和激发系数。
- 通过求解在核函数极点处的自相关函数拉普拉斯变换所得方程组,重建激发矩阵。
- 通过与数值求解器及现有估计器在合成数据集和真实世界数据集上的性能对比,对方法进行了验证。
实验结果
研究问题
- RQ1在多变量线性霍克斯过程中,激发矩阵的支撑集是否与有向信息图(DIG)等价?
- RQ2能否仅通过二阶统计量在无需独立同分布样本的情况下高效估计激发矩阵?
- RQ3所提出的方法是否可推广至对称霍克斯过程之外,后者假设强度相等且拉普拉斯变换可分解?
- RQ4在准确性和计算成本方面,该分析方法与数值求解器相比表现如何?
主要发现
- 激发矩阵的支撑集在数学上等价于有向信息图(DIG),为避免高维密度估计提供了有向信息的替代指标。
- 所提出的激发矩阵估计分析方法在鲁棒性上优于先前工作[3]中提出的数值方法,且计算成本更低。
- 该方法在已知真实连接性的合成多变量霍克斯过程中成功恢复了因果网络结构。
- 该算法在真实世界数据上表现优异,包括股票市场和MemeTracker数据集,能够准确推断因果影响模式。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。