QUICK REVIEW
[論文レビュー] IS-CAM: Integrated Score-CAM for axiomatic-based explanations
Rakshit Naidu, Ankita Ghosh|arXiv (Cornell University)|Oct 6, 2020
Explainable Artificial Intelligence (XAI)参考文献 12被引用数 31
ひとこと要約
IS-CAM は Score-CAM のパイプラインに公理的アトリビューションの概念を組み込むことで、モデル間でより鋭く、より忠実なアトリビューションマップを生成し、ILSVRC 2012 の検証画像で評価されました。
ABSTRACT
Convolutional Neural Networks have been known as black-box models as humans cannot interpret their inner functionalities. With an attempt to make CNNs more interpretable and trustworthy, we propose IS-CAM (Integrated Score-CAM), where we introduce the integration operation within the Score-CAM pipeline to achieve visually sharper attribution maps quantitatively. Our method is evaluated on 2000 randomly selected images from the ILSVRC 2012 Validation dataset, which proves the versatility of IS-CAM to account for different models and methods.
研究の動機と目的
- センシティブな用途におけるCNNの説明可能なAIを動機づける。
- より鋭い局在化を持つ勾配不要のアトリビューション手法を開発する。
- Score-CAM フレームワーク内に公理的アトリビューションの概念を統合する。
- ImageNet の検証データセットで忠実性と局在化を定量的に評価する。
- 複数のCNNアーキテクチャにまたがる汎用性を示す。
提案手法
- 入力マスクの複数区間にわたる平均スコアを計算する統合操作を Score-CAM パイプライン内に導入する。
- 区間数 N を [0,1] の区間数として定義し、正規化マスクを区間ごとに平均化して統合勾配マップを計算する(M0=0)。
- 対象領域に焦点を当てるため、正規化関数 s(A) = (A - min(A)) / (max(A) - min(A)) を使用する。
- 平均統合スコアとアップサンプリング済み活性化マップの線形結合としてサリエンシーマップを生成し、Score-CAM と同様に ReLU を適用する。
- 入力マスク上の統合を通じて公理的アトリビューション原則に基づき、より鋭いアトリビューションマップを得る。
- ImageNet の検証画像で Grad-CAM、Grad-CAM++、Smooth Grad-CAM++、Score-CAM、SS-CAM と比較する。
実験結果
リサーチクエスチョン
- RQ1Score-CAM に公理的アトリビューション手法を組み込むと、より鋭く、より忠実なアトリビューションマップが得られるか?
- RQ2ImageNetデータ上で複数のアーキテクチャにおける忠実性と局在化の性能はIS-CAMでどうなるか?
- RQ3統合区間パラメータ N は定性的な視覚表現や定量指標に有意な影響を与えるか?
- RQ4境界ボックス局在タスクにおいて、IS-CAM は既存の CAM ベースの手法とどう比較されるか?
主な発見
| CAM 技術 | 挿入率 % | 削除率 % |
|---|---|---|
| Grad-CAM | 45.25 | 11.25 |
| Grad-CAM++ | 44.94 | 11.41 |
| SS-CAM++ | 42.68 | 13.43 |
| Score-CAM | 48.22 | 9.92 |
| SS-CAM | 45.92 | 11.46 |
| IS-CAM | 48.13 | 9.92 |
- IS-CAM は競合的な視覚的アトリビューション品質を達成し、いくつかのCAMベースの基準よりも定量的な忠実性を改善する。
- VGG-16 を用いた 2000 枚の ImageNet 画像での Average Drop と Increase in Confidence 評価において、IS-CAM は Score-CAM と SS-CAM に対して強力な性能を示す。
- IS-CAM は挿入/削除分析の AUC スコアで基準 CAM 手法と比べて有利なスコアを達成する。
- 局在評価(エネルギーベースのポインティングゲーム)は、VGG-16、ResNet-18、SqueezeNet の変種全般で IS-CAM が高い割合を示し、リストされた手法の中で VGG-16 が最大値を取った。
- 全体として、IS-CAM は複数のアーキテクチャにおいて忠実なサリエンシーと局在化のバランスを取る。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。