Skip to main content
QUICK REVIEW

[論文レビュー] Label-Free Concept Bottleneck Models

Tuomas Oikarinen, Subhro Das|arXiv (Cornell University)|Apr 12, 2023
Explainable Artificial Intelligence (XAI)被引用数 17
ひとこと要約

この論文はラベルなしCBMを提案し、ラベル付き概念を持たずに解釈可能な概念ボトルネックモデルへ任意のニューラルネットワークを変換しつつ高精度を維持し、ImageNet規模にも拡張可能で、事後解釈性と編集を実現します。

ABSTRACT

Concept bottleneck models (CBM) are a popular way of creating more interpretable neural networks by having hidden layer neurons correspond to human-understandable concepts. However, existing CBMs and their variants have two crucial limitations: first, they need to collect labeled data for each of the predefined concepts, which is time consuming and labor intensive; second, the accuracy of a CBM is often significantly lower than that of a standard neural network, especially on more complex datasets. This poor performance creates a barrier for adopting CBMs in practical real world applications. Motivated by these challenges, we propose Label-free CBM which is a novel framework to transform any neural network into an interpretable CBM without labeled concept data, while retaining a high accuracy. Our Label-free CBM has many advantages, it is: scalable - we present the first CBM scaled to ImageNet, efficient - creating a CBM takes only a few hours even for very large datasets, and automated - training it for a new dataset requires minimal human effort. Our code is available at https://github.com/Trustworthy-ML-Lab/Label-free-CBM. Finally, in Appendix B we conduct a large scale user evaluation of the interpretability of our method.

研究の動機と目的

  • 解釈可能な概念ボトルネックモデルを、ラベル付き概念データを必要とせず自動的に作成する。
  • 大規模データセット(ImageNetを含む)への拡張性と効率的な学習を可能にする。
  • 元のバックボーンネットワークの精度を維持またはほぼ一致させる。
  • 意思決定のグローバルおよびローカルな解釈性を提供し、モデル編集の可能性を示す。

提案手法

  • ラベル付き概念なしで任意のニューラルネットワークバックボーンをConcept Bottleneck Model (CBM)へ変換する。
  • Step 1: 初期概念セットをGPT-3と複数のフィルタ基準を用いて生成・フィルタする。
  • Step 2-3: 活性化とターゲット概念間の類似性を最大化するように投影Wcを最適化してConcept Bottleneck Layer (CBL)を学習し、cos cubed類似度を用いる。
  • Step 4: elastic net正則化を用いてスパースな最終層WFを学習し予測を生成する。
  • 学習は自動化・スケーラブル・効率的になるように設計され、最終モデルは解釈性のためのスパース性を示す。
  • 本法は大規模データセットをサポートし、CIFAR-10/100、CUB200、Places365、ImageNetで評価される。

実験結果

リサーチクエスチョン

  • RQ1ラベル注釈なしの完全自動化プロセスは、概念注釈を用いずに解釈可能な概念ボトルネックを生み出せるか。
  • RQ2ラベルなしCBMは元のバックボーンと同程度の精度をImageNet規模データを含めて維持できるか。
  • RQ3最終決定規則と per-instanceの説明は、従来のCBMと比べてどれくらい解釈可能か。
  • RQ4最終層をスパース化して解釈性を高めつつ性能を損なわないか。
  • RQ5最終層の重みを手動で編集してミスを修正し全体の精度を向上させる可能性はあるか。

主な発見

データセットモデルスパースな最終層CIFAR-10CIFAR-100CUB-200Places365ImageNet
CIFAR-10標準No88.80%*2 datasets provided in table show multiple entries; the label-free CBM row is presented separately below.
CIFAR-10標準(スパース)はい82.96%
CIFAR-10P-CBMはい70.50%*
CIFAR-10P-CBM (CLIP)はい84.50%*
CIFAR-10ラベルなし CBM (Ours)はい86.40%±0.06%???71.95%±0.05%
CIFAR-100標準No70.10%*
CIFAR-100標準(スパース)はい58.34%
CIFAR-100P-CBMはい43.20%*
CIFAR-100P-CBM (CLIP)はい56.00%*
CIFAR-100ラベルなし CBM (Ours)はい65.13%±0.12%???
CUB-200標準No76.70%74.31%±0.29%
CUB-200標準(スパース)はい75.96%
CUB-200P-CBMはい59.60%*
CUB-200P-CBM (CLIP)はいN/A
CUB-200ラベルなし CBM (Ours)はい74.31%±0.29%???
Places365標準No48.56%43.68%±0.10%
Places365標準(スパース)はい38.46%
Places365P-CBMはいN/A
Places365P-CBM (CLIP)はいN/A
Places365ラベルなし CBM (Ours)はい43.68%±0.10%???
ImageNet標準No76.13%71.95%±0.05%
ImageNet標準(スパース)はい74.35%
ImageNetP-CBMはいN/A
ImageNetP-CBM (CLIP)はいN/A
ImageNetラベルなし CBM (Ours)はい71.95%±0.05%???
  • ラベルなしCBMは5つのデータセットで競争力のある精度を達成し、ImageNetでトップ1精度72%のモデルとスパースな最終層を実現。
  • 本手法は評価データセットでポストホックCBMを上回り、解釈不能な残差項なしの完全な解釈性を維持。
  • 最終層の重みを可視化することで解釈可能な意思決定規則を明らかにでき、グローバルなパターンは直感的な概念と一致する(例:柑橘類がオレンジとレモンに結びつく)。
  • 個々の予測は概念からの単純な線形寄与で説明でき、特徴寄与を直感的に視覚化可能。
  • 最終層の重みを手動で編集することで、全体のネットワークへの影響を最小限に抑えつつデータ subsetで精度向上が得られ、実用的なデバッグ可能性を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。