QUICK REVIEW

[論文レビュー] Rethinking Concept Bottleneck Models: From Pitfalls to Solutions

Merve Tapli, Quentin Bouniot|arXiv (Cornell University)|Mar 5, 2026

Explainable Artificial Intelligence (XAI)被引用数 0

ひとこと要約

CBM-Suiteはエントロピーベースの概念関連度指標を提示し、非線形概念エンコーダを導入し、教師付き蒸留で精度ギャップを埋めるとともに、CBMの解釈性と性能を向上させる広範なバックボーン–VLM評価を実施します。

ABSTRACT

Concept Bottleneck Models (CBMs) ground predictions in human-understandable concepts but face fundamental limitations: the absence of a metric to pre-evaluate concept relevance, the "linearity problem" causing recent CBMs to bypass the concept bottleneck entirely, an accuracy gap compared to opaque models, and finally the lack of systematic study on the impact of different visual backbones and VLMs. We introduce CBM-Suite, a methodological framework to systematically addresses these challenges. First, we propose an entropy-based metric to quantify the intrinsic suitability of a concept set for a given dataset. Second, we resolve the linearity problem by inserting a non-linear layer between concept activations and the classifier, which ensures that model accuracy faithfully reflects concept relevance. Third, we narrow the accuracy gap by leveraging a distillation loss guided by a linear teacher probe. Finally, we provide comprehensive analyses on how different vision encoders, vision-language models, and concept sets interact to influence accuracy and interpretability in CBMs. Extensive evaluations show that CBM-Suite yields more accurate models and provides insights for improving concept-based interpretability.

研究の動機と目的

CBM＝Concept Bottleneck Modelsが解釈性と精度で苦労する理由を評価する。
意味のある概念を選択するための事前学習概念関連度指標を開発する。
非線性と概念依存性を強制するためのアーキテクチャ的変更を導入する。
蒸留ベースの訓練 regimeで精度ギャップを埋める。
CBMの性能へ影響するさまざまな視覚エンコーダと視覚言語モデルを体系的に研究する。

提案手法

訓練前に概念集合の関連性を評価するためにVLMの画像/テキスト埋め込みから計算されるエントロピーに基づくGoodness of Conceptsを定義する。
概念ボトルネックの利用を保証するため、2つの線形層の間にReLUを挿入して非線形概念エンコーダを実装する。
線形バックボーンのプローブ（教師）からCBM分類器への知識蒸留損失を適用して精度ギャップを縮小する。
最終分類器に対して弾性ネット正則化を用いて解釈可能でスパースな概念使用を促進する。
エンコーダの選択が精度と解釈性に与える影響を分析するため、さまざまな視覚バックボーンとVLMを評価する。

実験結果

リサーチクエスチョン

RQ1CBM訓練前にデータセットに対する与えられた概念集合の内在的関連性をどう定量化できるか。
RQ2概念エンコーダに非線性を追加することで概念ボトルネックの回避を防げるか。
RQ3 opaque教師モデルからの知識蒸留は解釈性を維持しつつCBMの精度ギャップを縮小できるか。
RQ4異なる視覚エンコーダと視覚言語モデルはCBMの精度と解釈性にどのように影響し合うか。

主な発見

タスク非依存およびタスク特有のエントロピーに基づくGoodness of Concepts指標は、関連する概念集合を無関連または乱数的なものから信頼性高く区別する。
純粋に線形のCBMは、関連性の薄い概念があっても高い精度を達成し、概念漏洩と解釈性の低さを示す。
非線形の概念エンコーダは予測が概念に依存することを保証するために必要で、関連性の薄い概念を用いると性能が低下する。
教師モデルからの知識蒸留はCBMの精度を significantly に改善し、不透明なベースラインとの差を縮める。
より強力な視覚バックボーンと特定のVLM（例：Perc. Enc. with SigLIP や CLIP系）で、データセットを横断してCBMの性能が向上する。
CBM-Suiteは複数のデータセット（CUB200、CIFAR100、Places365）で競争力のあるまたは優位な結果を達成し、バックボーン–VLMの組み合わせの重要性を強調する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。