Skip to main content
QUICK REVIEW

[論文レビュー] Causal Inference by Identification of Vector Autoregressive Processes with Hidden Components

Philipp Geiger, Kun Zhang|arXiv (Cornell University)|Nov 14, 2014
Bayesian Modeling and Causal Inference参考文献 18被引用数 44
ひとこと要約

本稿では、隠れ変数を有するベクトル自己回帰(VAR)過程の構造的パラメータを同定することにより、時系列における新しい因果推論手法を提案する。非ガウス型ノイズ、または観測変数から隠れ変数への影響がない条件下で、因果行列Bと交絡要因効果Cが観測データのみから同定可能であることが示され、標準的なグレインジャー因果法に比べてより信頼性の高い因果同定が可能になる。

ABSTRACT

A widely applied approach to causal inference from a non-experimental time series $X$, often referred to as "(linear) Granger causal analysis", is to regress present on past and interpret the regression matrix $\hat{B}$ causally. However, if there is an unmeasured time series $Z$ that influences $X$, then this approach can lead to wrong causal conclusions, i.e., distinct from those one would draw if one had additional information such as $Z$. In this paper we take a different approach: We assume that $X$ together with some hidden $Z$ forms a first order vector autoregressive (VAR) process with transition matrix $A$, and argue why it is more valid to interpret $A$ causally instead of $\hat{B}$. Then we examine under which conditions the most important parts of $A$ are identifiable or almost identifiable from only $X$. Essentially, sufficient conditions are (1) non-Gaussian, independent noise or (2) no influence from $X$ to $Z$. We present two estimation algorithms that are tailored towards conditions (1) and (2), respectively, and evaluate them on synthetic and real-world data. We discuss how to check the model using $X$.

研究の動機と目的

  • 未測定の交絡要因(Z)が観測変数(X)に影響を与える場合に標準的グレインジャー因果法が失敗することを補足すること。
  • 観測されたXのみから、隠れ変数を有するVARモデルの因果構造が同定可能である条件を確立すること。
  • 非ガウス型ノイズおよびXからZへの影響の不在に特化した推定アルゴリズムを開発し、実用的な因果推論を可能にすること。
  • 観測された時系列Xのみを用いてモデルの妥当性を検証するフレームワークを提供すること。

提案手法

  • 観測変数Xと隠れ変数Zの連携動的挙動を、独立同分布のノイズを伴う一階のVAR過程としてモデル化し、遷移行列Aに因果的解釈を仮定する。
  • 独立かつ非ガウス型ノイズを用いて、BとCをスケーリングおよび置換の不定性を除き同定し、独立性と非ガウス性を活用して構造的同定を実現する。
  • アルゴリズム1では、非ガウス型ノイズの仮定のもとで有限標本からBとCを推定するために、混合正規分布の尤度モデルを適用する。
  • アルゴリズム2では、XがZに影響を与えない場合に、Yule-Walkerに類似した連立一次方程式系を用いてBを有限個の可能性にまで同定する。
  • カルマンフィルタリングおよびスムージングを用いて、隠れ状態の事後分布を計算し、変分EMによるパrameter推定を可能にする。
  • EMフレームワークにおいて、パラメータ(π, μ, σ², B, C, D, E)の更新式を、事後期待値と変分下界を用いて導出する。

実験結果

リサーチクエスチョン

  • RQ1隠れ変数を有するVARモデルにおける因果行列Bが、観測時系列Xのみから同定可能となる条件は何か?
  • RQ2ノイズが非ガウス型でかつ独立である場合、交絡要因効果Cは同定可能か?
  • RQ3XがZに直接影響を与えない場合でさえ、ガウス型ノイズのもとで因果構造は回復可能か?
  • RQ4観測時系列Xのみを用いて、モデルの仮定をどの程度まで検証可能か?
  • RQ5提案されたアルゴリズムは、合成時系列および実世界の時系列データにおいて、標準的グレインジャー因果法に比べてどの程度の性能を示すか?

主な発見

  • 定理1では、一般性仮定のもとで、ノイズが非ガウス型でかつ独立であれば、XからBが一意に同定可能であることが示された。
  • 定理2では、同じ非ガウス型ノイズ条件のもとで、Cの列のうち少なくとも2つの非ゼロ成分を持つものは、スケーリングおよび置換の不定性を除き同定可能であることが示された。
  • 定理3では、XがZに影響を与えない場合、ノイズ分布に依存せず、Xの共分散構造からBが有限個の可能性にまで同定可能であることが証明された。
  • 命題1および命題2は、必要な一般性仮定が、パrameter空間におけるルベーグ零集合を除き、実用的に有効であることを確認した。
  • アルゴリズム1は、混合正規分布ノイズの尤度モデルを最大化することで、非ガウス性のもとでBとCを効果的に推定できた。
  • アルゴリズム2は、XからZへの影響がない条件のもとで、Yule-Walker方程式に類似した連立一次方程式系を解くことで、Bを有限個の解にまで回復できた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。