QUICK REVIEW

[論文レビュー] Beyond Sparsity: Tree Regularization of Deep Models for Interpretability

Mike Wu, Michael C. Hughes|arXiv (Cornell University)|Nov 16, 2017

Explainable Artificial Intelligence (XAI)被引用数 102

ひとこと要約

本論文は、予測が高精度でありながらコンパクトな決定木で近似可能な深層モデルを訓練するための木正則化を提案し、時系列データと実世界のタスク全般で性能を犠牲にすることなく人間によるシミュレーション性を向上させる。

ABSTRACT

The lack of interpretability remains a key barrier to the adoption of deep models in many applications. In this work, we explicitly regularize deep models so human users might step through the process behind their predictions in little time. Specifically, we train deep time-series models so their class-probability predictions have high accuracy while being closely modeled by decision trees with few nodes. Using intuitive toy examples as well as medical tasks for treating sepsis and HIV, we demonstrate that this new tree regularization yields models that are easier for humans to simulate than simpler L1 or L2 penalties without sacrificing predictive power.

研究の動機と目的

深層モデルの解釈性の一形態として、human-simulability を動機づけ定義する。
小さな決定木でよく近似できる決定境界を促すように木正則化を提案する。
時系列データと実世界のドメインにおいて、低い複雑さで高い精度を達成する木正則化モデルを実証する。
臨床医や専門家の監査を可能にする、深層モデルの予測を模倣する解釈可能な木の代理表現を提供する。

提案手法

ネットワークの閾値化された予測を再現する決定木の平均パス長を、模擬性の複雑さの指標（Omega(W)）として定義する。
参照データセット上で深層モデルの予測を模倣する2値決定木を訓練し、複雑さを測るために平均パス長を計算する。
勾配ベースの最適化のため、非微分可能な Omega(W) を近似する小さな MLP を用いた微分可能な代理モデル hat_Omega(W) を開発する。
標準の損失に加えて hat_Omega(W) を組み込んだ代理木正則化項を含む損失で深層モデルを訓練する。
任意で、木正則化されたGRUが interpretable HMM を残差させて性能を向上させつつ解釈性を維持するGRU-HMM ハイブリッドを構築する。
合成データ、敗血症、HIV、TIMIT のタスクを横断して MLP と GRU ベースの時系列でアプローチを実証し、代理木が深層モデルの決定をどれだけ忠実に反映するかを示す適合度分析を行う。

実験結果

リサーチクエスチョン

RQ1予測精度を損なうことなく、小さな決定木で容易にシミュレートできる決定境界を持つ深層モデルを訓練できるか。
RQ2木正則化は、時系列データおよび実世界領域で L1/L2 ペナルティより低い木の複雑性でより高い精度を生み出すか。
RQ3人間が解釈しやすい木の代理表現は、木正則化された深層モデルの予測を忠実に反映するか（適合度）？
RQ4GRU-HMM のようなハイブリッドモデルは、木正則化された深層部品を活用して解釈性を保ちながら性能を向上させられるか？
RQ5得られた木 proxy は臨床の専門家にとって臨床的または監査上意味があるものか。

主な発見

Dataset	Fidelity
signal-and-noise HMM	0.88
SEPSIS (In-Hospital Mortality)	0.81
SEPSIS (90-Day Mortality)	0.88
SEPSIS (Mech. Vent.)	0.90
SEPSIS (Median Vaso.)	0.92
SEPSIS (Max Vaso.)	0.93
HIV (CD4 + below 200)	0.84
HIV (Therapy Success)	0.88
HIV (Mortality)	0.93
HIV (Poor Adherence)	0.90
HIV (AIDS Onset)	0.93
TIMIT	0.85

木正則化されたモデルは、タスク全体で小さな平均パス長のときに L1/L2 正則化された相手よりも高い AUC を達成する。
シグナルとノイズの HMM タスクでは、木正則化されたGRUはパス長約10でAUCが約0.9に達する一方、L1/L2 は同等のAUCに対してより長いパス長を要する。
敗血症では、木正則化を適用したGRUモデルがパス長2–10でAUCを0.05–0.1向上させる。
TIMIT および HIV タスクでは、中程度のパス長でAUC増分0.05–0.15を達成する一方、単体の木やL1/L2 は低複雑性で苦戦する。
決定木プロキシは、タスクを横断して適合度スコア0.81–0.93の範囲で深層モデルの予測を忠実に反映する。
決定木プロキシは解釈可能で（パス長 ≤ 25）、臨床的推論や信頼性向上に役立つ。
GRU-HMM ハイブリッドは、木正則化GRUを備えた場合、同等の複雑性に対してGRU単独よりも低いパス長でより高い精度を達成する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。