Skip to main content
QUICK REVIEW

[論文レビュー] Interpretability-by-Design with Accurate Locally Additive Models and Conditional Feature Effects

Vasilis Gkolemis, Loukas Kavouras|arXiv (Cornell University)|Feb 18, 2026
Explainable Artificial Intelligence (XAI)被引用数 0
ひとこと要約

CALMsはGAMの解釈可能性とGA2Mの精度のバランスを、相互作用を捉える領域特異的な一変量特徴効果を学習することで実現します。

ABSTRACT

Generalized additive models (GAMs) offer interpretability through independent univariate feature effects but underfit when interactions are present in data. GA$^2$Ms add selected pairwise interactions which improves accuracy, but sacrifices interpretability and limits model auditing. We propose \emph{Conditionally Additive Local Models} (CALMs), a new model class, that balances the interpretability of GAMs with the accuracy of GA$^2$Ms. CALMs allow multiple univariate shape functions per feature, each active in different regions of the input space. These regions are defined independently for each feature as simple logical conditions (thresholds) on the features it interacts with. As a result, effects remain locally additive while varying across subregions to capture interactions. We further propose a principled distillation-based training pipeline that identifies homogeneous regions with limited interactions and fits interpretable shape functions via region-aware backfitting. Experiments on diverse classification and regression tasks show that CALMs consistently outperform GAMs and achieve accuracy comparable with GA$^2$Ms. Overall, CALMs offer a compelling trade-off between predictive accuracy and interpretability.

研究の動機と目的

  • 高リスクな意思決定のための設計可能な解釈可能なモデルを動機づける。
  • 相互作用が存在する際のGAMの過適合を解決し、GA2Mの解釈可能性の喪失を解消する。
  • 解釈可能性と精度を融合する条件付き加法的局所モデル(CALMs)を提案する。
  • 近似的に加法的な領域を特定し、領域特異的な形状関数を学習する蒸留ベースの訓練パイプラインを開発する。

提案手法

  • CALMを、領域条件付活性化を用いた一変量形状関数の和として定義する: g(E[Y|X=x]) = beta0 + sum_i f_i^{(r_i(x_-i))}(x_i).
  • 入力空間を特徴ごとに二分木(最大深さ d_max)で分割し、x_iがほぼ加法的に作用する領域を作る。
  • 相互作用を最小化するように領域分割を導く異質性指標を用いる。
  • 各領域内で領域依存バックフィッティングにより領域特異的な一変量形状関数 f_i^{(r)} を適合させる。
  • 蒸留ベースの訓練を三段階で行う:(1) 黒箱リファレンスモデルを訓練、(2) 特徴特異的な分割を学習、(3) 領域特異的な形状関数を推定する。
Figure 1 : CALMs use conditional feature effects : every feature effect is expressed by a collection of 1D functions, each associated with a different region of the input space. In the example, the effect of $x_{1}$ conditions on $x_{3}$ , the effect of $x_{2}$ on $x_{1}$ , while $x_{d}$ does not in
Figure 1 : CALMs use conditional feature effects : every feature effect is expressed by a collection of 1D functions, each associated with a different region of the input space. In the example, the effect of $x_{1}$ conditions on $x_{3}$ , the effect of $x_{2}$ on $x_{1}$ , while $x_{d}$ does not in

実験結果

リサーチクエスチョン

  • RQ1CALMsはGAMのような解釈可能性を保ちつつGA2Mレベルの精度を達成できるか。
  • RQ2相互作用を捉えつつ、複雑さを爆発させずに近似的に加法的な領域を信頼性高く識別できるか。
  • RQ3CALMがGAMとGA2Mに比べてどのような解釈可能性の保証を提供するか。
  • RQ4提案された蒸留ベースの訓練パイプラインは、多様なデータセットで効率的かつスケーラブルか。

主な発見

  • CALMsはさまざまなタスクにおいてGAMを超える予測精度を一貫して示す。
  • CALMsは多くのデータセットでGA2Mと同等の精度を達成する。
  • 領域条件付きの一変量効果を用いた解釈可能性が設計上提供され、監査が容易。
  • 訓練パイプラインは相互作用を持つ特徴と領域閾値を最小の調整で効率的に識別する。
  • 25の公開タブularデータセット(分類および回帰)で、精度と解釈可能性の提案されたトレードオフを支持する実験結果。
Figure 2 : CALM plot for $x_{1}$ . Each curve shows the contribution of $x_{1}$ to $y$ (P1) in a different region of the input space ( $x_{3}\lessgtr 0$ ). Vertical lines indicate interaction-induced discontinuities, e.g., at $x_{1}\approx-0.4$ there exist a positive hidden jump of $[0,0.37]$ due to
Figure 2 : CALM plot for $x_{1}$ . Each curve shows the contribution of $x_{1}$ to $y$ (P1) in a different region of the input space ( $x_{3}\lessgtr 0$ ). Vertical lines indicate interaction-induced discontinuities, e.g., at $x_{1}\approx-0.4$ there exist a positive hidden jump of $[0,0.37]$ due to

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。