[論文レビュー] Score-based Integrated Gradient for Root Cause Explanations of Outliers
SIREN は、因果構造の条件付きスコア関数を推定することで外れ値の根本原因を属性づけする、スコアベースの統合勾配フレームワークを導入し、高次元非線形モデルにおける不確実性を考慮した、スケーラブルな説明を実現します。
Identifying the root causes of outliers is a fundamental problem in causal inference and anomaly detection. Traditional approaches based on heuristics or counterfactual reasoning often struggle under uncertainty and high-dimensional dependencies. We introduce SIREN, a novel and scalable method that attributes the root causes of outliers by estimating the score functions of the data likelihood. Attribution is computed via integrated gradients that accumulate score contributions along paths from the outlier toward the normal data distribution. Our method satisfies three of the four classic Shapley value axioms - dummy, efficiency, and linearity - as well as an asymmetry axiom derived from the underlying causal structure. Unlike prior work, SIREN operates directly on the score function, enabling tractable and uncertainty-aware root cause attribution in nonlinear, high-dimensional, and heteroscedastic causal models. Extensive experiments on synthetic random graphs and real-world cloud service and supply chain datasets show that SIREN outperforms state-of-the-art baselines in both attribution accuracy and computational efficiency.
研究の動機と目的
- 高次元・不確実なシステムにおける外れ値の頑健な根本原因分析を動機付ける。
- 非線形加法ノイズ因果モデルとヘテロスケダスノイズで機能するスケーラブルな属性付けフレームワークを開発する。
- 統合勾配と因果属性付けのShapley値概念との理論的根拠ある連関を提供する。
- 訓練データにアクセスせず、密度ではなくスコア関数で動作する推論を可能にする。
提案手法
- 葉ノードの負の対数密度を用いたスコアベースの外れ値指標を定義する。
- 潜在ノイズ変数に対する対数密度の勾配を予測するスコア関数推定量を導入する。
- Functional Causal Models (FCMs) 内でスコア関数を平均成分とノイズ条件付け成分に分解する。
- 条件付きスコアマッチングを適用して因果軌道に沿った局所スコア関数を効率的に推定する。
- 逆時間拡散(SDE)軌道を用いて勾配経路をサンプルし、拡散ベースの統合勾配をアトリビューションに用いる。
- 各ノードの平均関数 f_i をフィットして因果機構をモデル化し、ノイズの影響の伝播解析を可能にする。
実験結果
リサーチクエスチョン
- RQ1スコア関数と拡散ベースの勾配を用いて、因果グラフ内の潜在ノイズ源へ外れ値を属性づけることはできるか。
- RQ2提案されたスコアベース統合勾配フレームワークは、ヘテロスケダスかつ非線形の因果モデル下で、効率的で参照なしの根本原因説明を提供できるか。
- RQ3この設定でスコアベースの属性付けとShapley値公理を結ぶ理論的保証は何か。
- RQ4SIREN は属性付けの質と計算効率の点で、ベースライン手法と比較してどうであるか。
主な発見
- スコアベースの属性付けは、効率性、線形性、ダミー性、および因果構造に結びつく非対称性公理を満たす。
- SIREN はスコア関数と拡散軌道の操作により、訓練データを必要とせず属性付けを可能にする。
- 実験により、合成グラフと実世界データセットのベースラインと比較して属性付けの精度と計算効率が向上することを示す。
- 本フレームワークは任意の微分可能なノイズ分布とヘテロスケダス性を持つ非線形加法ノイズモデルを適用可能とする。
- この手法は統合勾配と尾部確率差を結びつけ、外れ値の寄与の原理的解釈を提供する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。