QUICK REVIEW

[论文解读] Interpretable Models for Granger Causality Using Self-explaining Neural Networks

Ričards Marcinkevičs, Julia E. Vogt|arXiv (Cornell University)|Jan 19, 2021

Bayesian Modeling and Causal Inference参考文献 43被引用 28

一句话总结

引入 GVAR，一种可解释的自回归框架，将自解释神经网络扩展到时间序列以实现非线性 Granger 因果关系，具备符号和时变效应，以及基于稳定性的小阈值推断。它在合成数据上对比基线在 GC 检测方面具有竞争力，在符号检测方面表现优于基线。

ABSTRACT

Exploratory analysis of time series data can yield a better understanding of complex dynamical systems. Granger causality is a practical framework for analysing interactions in sequential data, applied in a wide range of domains. In this paper, we propose a novel framework for inferring multivariate Granger causality under nonlinear dynamics based on an extension of self-explaining neural networks. This framework is more interpretable than other neural-network-based techniques for inferring Granger causality, since in addition to relational inference, it also allows detecting signs of Granger-causal effects and inspecting their variability over time. In comprehensive experiments on simulated data, we show that our framework performs on par with several powerful baseline methods at inferring Granger causality and that it achieves better performance at inferring interaction signs. The results suggest that our framework is a viable and more interpretable alternative to sparse-input neural networks for inferring Granger causality.

研究动机与目标

动机：在多变量时间序列中需要可解释的非线性 Granger 因果分析。
提出一种用于时间序列的自解释神经网络扩展（GVAR），能够产生可解释的、时变的 Granger 效应。
提供稀疏性和时域平滑惩罚，以减少虚假关联并实现符号检测。
开发基于稳定性的时序反转阈值化方案，用以推断二值 GC 图。
在合成数据上证明其对比最先进的非线性 GC 方法具有竞争性能，并评估效应符号。

提出的方法

将自解释神经网络扩展到自回归时间序列，形成阶数为 K 的广义向量自回归（GVAR），其中 \n x_t = sum_{k=1}^K Ψ_{θ_k}(x_{t-k}) x_{t-k}，其中 Ψ_{θ_k} 是一个产生 lag k 的 p×p 系数矩阵的 MLP。
通过惩罚损失来训练 GVAR：均方误差加稀疏惩罚 R(Ψ_t) 以及鼓励 Ψ_{t+1} 接近 Ψ_t 的时间平滑惩罚。
采用弹性网风格的稀疏性：R(Ψ_t) = α||Ψ_t||_1 + (1-α)||Ψ_t||_2^2，α=0.5。
将时变系数聚合为一个汇总邻接矩阵 S，其中 S_{i,j} = max_k median_t |(Ψ_{θ_k}(x_t))_{i,j}|，以量化 Granger 因果强度。
应用基于稳定性的时序反转 GC 推断：在原始数据和时间反转数据上进行训练，利用分位数对 S 进行阈值化，并选择在原始数据与反转数据之间达到最佳平衡准确性的阈值。

实验结果

研究问题

RQ1是否可以在多变量时间序列中利用可解释的神经框架推断非线性 Granger 因果关系？
RQ2是否能够在这样的模型中检测 Granger 因果效应的符号并检查其时变？
RQ3使用时间反转的基于稳定性的阈值化过程是否提升了 GC 关系的可识别性？
RQ4在结构恢复和符号检测方面，提出的 GVAR 与最先进的非线性 GC 方法在合成基准上的比较如何？
RQ5该框架是否能够揭示时变且可解释的交互关系，同时不牺牲预测性能？

主要发现

GVAR 在跨基准的 GC 结构恢复中实现了具有竞争力的准确率和平衡准确率，常常表现最好或接近最佳。
GVAR 在检测正向与负向 GC 符号方面表现出色，在 Lotka–Volterra 模拟中在符号推断方面超越基线。
基于稳定性的阈值化结合时间反转可产生鲁棒的 GC 图并有助于抑制虚假连接。
GVAR 在 Lorenz 96 数据上显示出强劲的 AUROC 和 AUPRC 指标，BA 分数具有竞争力且符号可解释性良好。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。