QUICK REVIEW

[論文レビュー] Explainable AI for Time Series via Virtual Inspection Layers

Johanna Vielhaben, Sebastian Lapuschkin|arXiv (Cornell University)|Mar 11, 2023

Stock Market Forecasting Methods被引用数 4

ひとこと要約

本稿では、DFT-LRPを紹介する。これは、時間領域から周波数領域への関連スコアの伝播を可能にする仮想的検査レイヤーであり、時間系列モデルにおける局所的説明可能AI手法（例：LRP）を周波数領域に拡張する。離散フーリエ変換（DFT）を可逆変換として適用することにより、再訓練を伴わず、解釈可能な周波数ベースの説明を明らかにし、音声やECGデータにおいて、たとえば低周波数のノイズのようなまがい物の相関関係に依存するモデル戦略を特定する。

ABSTRACT

The field of eXplainable Artificial Intelligence (XAI) has witnessed significant advancements in recent years. However, the majority of progress has been concentrated in the domains of computer vision and natural language processing. For time series data, where the input itself is often not interpretable, dedicated XAI research is scarce. In this work, we put forward a virtual inspection layer for transforming the time series to an interpretable representation and allows to propagate relevance attributions to this representation via local XAI methods. In this way, we extend the applicability of XAI methods to domains (e.g. speech) where the input is only interpretable after a transformation. In this work, we focus on the Fourier Transform which, is prominently applied in the preprocessing of time series, with Layer-wise Relevance Propagation (LRP) and refer to our method as DFT-LRP. We demonstrate the usefulness of DFT-LRP in various time series classification settings like audio and medical data. We showcase how DFT-LRP reveals differences in the classification strategies of models trained in different domains (e.g., time vs. frequency domain) or helps to discover how models act on spurious correlations in the data.

研究の動機と目的

時間系列モデルにおける解釈可能な説明の欠如に取り組む。これは、人間にとって本質的に意味を持たない原始的な時間点に起因する。
時間系列に、LRPのような局所的XAI手法を拡張する。これにより、周波数領域のような解釈可能な表現における関連スコアの伝播を可能にする。
モデルの行動、たとえばデータ内のまがい物の相関関係に依存する「クレーブ・ハンス戦略」を検出し、診断する。
再訓練なしに、時間領域と周波数領域の異なる入力表現におけるモデル意思決定戦略を比較するフレームワークを提供する。
時間系列特徴が解釈しにくい分野（例：音声や電子的健康記録）におけるモデル解釈を可能にする。

提案手法

入力データを解釈可能な表現（例：DFTによるもの）に写像する、および元のドメインに戻す2つの線形かつ可逆な変換から成る仮想的検査レイヤーを導入する。
変換された表現に対してレイヤーごとの関連スコア伝播（LRP）を適用し、周波数領域または時間周波数領域における関連スコアの解釈を可能にする。
DFTおよび短時間フーリエ変換（STFT）を介した関連スコア伝播の閉形式表現を導出することで、近似を用いず正確な計算を可能にする。
バックプロパゲーションに基づくLRPを用い、モデル出力から仮想的検査レイヤーを経由して解釈可能なドメインへの関連スコアを伝播させる。
音声およびECG分野の時間系列分類器に本手法を適用し、時間、周波数、時間周波数表現間での説明を比較する。
説明の質を評価するために、ピクセルフリッピング評価を拡張し、時間、周波数、時間周波数形式間での説明を比較する。

実験結果

リサーチクエスチョン

RQ1時間系列に、入力を周波数領域のような解釈可能な表現に変換することで、LRPのような局所的XAI手法を効果的に拡張できるか？
RQ2時間領域と周波数領域で学習したモデルの意思決定戦略はどのように異なるのか？DFT-LRPはこれらの違いを明らかにできるか？
RQ3DFT-LRPは、低周波数ノイズのようなまがい物の相関関係に依存する「クレーブ・ハンス」行動を検出し、露呈できるか？
RQ4周波数領域における説明は、時間領域の説明に比べて、時間系列分類においてどれほど意味のあるインサイトを提供するか？
RQ5DFT-LRPを用いて、再訓練なしに異なる入力表現におけるモデル戦略を比較できるか？

主な発見

DFT-LRPは、ピンクノイズを追加した音声データで学習したモデルが、話された数字の基本周波数ではなく、50 Hz未満の周波数に注目していることを明確にした。
時間領域モデルは、ノイズの入ったゼロのサンプルの98％をゼロと分類しており、これは時間領域の説明では検出できないが、周波数領域の説明によって明らかになるクレーブ・ハンス行動を示している。
ECG分類において、DFT-LRPは、全クラスのテストサンプルの44.3％で信号の平均（k=0）に注目しており、正常心拍（クラス0）では50.1％に達しており、臨床的に関連のある特徴ではなく、まがい物の相関関係に依存していることを示している。
音声分類においては、時間領域モデルは基本周波数と高調波に依存しているが、周波数領域モデルは基本周波数のみに注目しており、異なる意思決定戦略が明らかになった。
拡張されたピクセルフリッピング評価を用いて、時間、周波数、時間周波数ドメイン間での説明を直接比較可能であり、周波数ドメインでの説明が解釈性を向上させていることが示された。
DFT-LRPは、時間領域での説明だけでは、ノイズ依存性のような重要なモデル行動が見えないことが明らかになったが、周波数ドメインへの変換によってのみその行動が可視化される。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。