[论文解读] Causal Inference by Identification of Vector Autoregressive Processes with Hidden Components
本文提出了一种新颖的时间序列因果推断方法,通过识别带隐藏分量的向量自回归(VAR)过程的结构参数。研究表明,在非高斯噪声或观测变量对隐藏变量无影响的条件下,因果矩阵B和混淆因子效应C可仅从观测数据中识别,从而实现比标准Granger方法更可靠的因果发现。
A widely applied approach to causal inference from a non-experimental time series $X$, often referred to as "(linear) Granger causal analysis", is to regress present on past and interpret the regression matrix $\hat{B}$ causally. However, if there is an unmeasured time series $Z$ that influences $X$, then this approach can lead to wrong causal conclusions, i.e., distinct from those one would draw if one had additional information such as $Z$. In this paper we take a different approach: We assume that $X$ together with some hidden $Z$ forms a first order vector autoregressive (VAR) process with transition matrix $A$, and argue why it is more valid to interpret $A$ causally instead of $\hat{B}$. Then we examine under which conditions the most important parts of $A$ are identifiable or almost identifiable from only $X$. Essentially, sufficient conditions are (1) non-Gaussian, independent noise or (2) no influence from $X$ to $Z$. We present two estimation algorithms that are tailored towards conditions (1) and (2), respectively, and evaluate them on synthetic and real-world data. We discuss how to check the model using $X$.
研究动机与目标
- 为解决标准Granger因果关系的局限性,即当未测量的混淆因子(Z)影响观测变量(X)时该方法失效。
- 建立仅从观测X中识别带隐藏分量的VAR模型因果结构的条件。
- 开发适用于非高斯噪声及X对Z无影响情形的估计算法,实现实际因果推断。
- 提供一种仅使用观测时间序列X来检验模型有效性的框架。
提出的方法
- 将观测X与隐藏Z的联合动态建模为具有独立同分布噪声的一阶VAR过程,假设转移矩阵A具有因果解释。
- 利用噪声的非高斯性与独立性,识别B与C至缩放与排列的不确定性,借助独立性与非高斯性实现结构识别。
- 在算法1中采用高斯混合似然模型,基于非高斯噪声假设,从有限样本中估计B与C。
- 在算法2中采用类似Yule-Walker的方程组,当X不影响Z时,将B估计至有限多个可能性。
- 使用卡尔曼滤波与平滑计算隐藏状态的后验分布,支持变分EM进行参数估计。
- 在EM框架中,基于后验期望与变分下界,推导参数(π, μ, σ², B, C, D, E)的更新规则。
实验结果
研究问题
- RQ1在何种条件下,可仅从观测时间序列X中识别带隐藏分量的VAR模型中的因果矩阵B?
- RQ2当噪声为非高斯且独立时,能否识别混淆因子效应C?
- RQ3当X对Z无直接影响时,即使在高斯噪声下,因果结构如何恢复?
- RQ4在多大程度上可仅使用观测时间序列X来验证模型假设?
- RQ5与标准Granger因果关系相比,所提出的算法在合成与真实世界时间序列数据上的表现如何?
主要发现
- 定理1表明,在满足通用性假设下,若噪声为非高斯且独立,则B可从X中唯一识别。
- 定理2表明,在相同非高斯噪声条件下,C中至少有两个非零元素的列可至缩放与排列的不确定性下被识别。
- 定理3证明,若X不影响Z,则无论噪声分布如何,B均可从X的协方差结构中识别至有限多个可能性。
- 命题1与2确认,所需通用性假设仅排除参数空间中的勒贝格零测集,因此在实践中具有有效性。
- 算法1通过最大化高斯混合噪声的似然模型,成功估计B与C,在非高斯性下表现有效。
- 算法2通过求解类似Yule-Walker方程的方程组,在X对Z无影响条件下,将B恢复至有限多个解。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。