Skip to main content
QUICK REVIEW

[논문 리뷰] Score-CAM: Score-Weighted Visual Explanations for Convolutional Neural Networks

Haofan Wang, Zifan Wang|arXiv (Cornell University)|2019. 10. 03.
Explainable Artificial Intelligence (XAI)참고 문헌 38인용 수 93
한 줄 요약

Score-CAM은 gradient-free, 점수 기반 활성화 맵 가중치를 통해 후처리 시각적 설명을 제공하며, 인식 및 로컬라이제이션 작업에서 기존 CAM/Grad-CAM 변형들보다 더 우수한 성능을 보입니다.

ABSTRACT

Recently, increasing attention has been drawn to the internal mechanisms of convolutional neural networks, and the reason why the network makes specific decisions. In this paper, we develop a novel post-hoc visual explanation method called Score-CAM based on class activation mapping. Unlike previous class activation mapping based approaches, Score-CAM gets rid of the dependence on gradients by obtaining the weight of each activation map through its forward passing score on target class, the final result is obtained by a linear combination of weights and activation maps. We demonstrate that Score-CAM achieves better visual performance and fairness for interpreting the decision making process. Our approach outperforms previous methods on both recognition and localization tasks, it also passes the sanity check. We also indicate its application as debugging tools. Official code has been released.

연구 동기 및 목표

  • CNN 결정에 대한 더 나은 시각적 설명을 그라디언트 의존 없이 동기화합니다.
  • 활성화 맵당 Increase of Confidence (CIC) 기반의 gradient-free 가중치 메커니즘을 제안합니다.
  • Score-CAM이 신뢰성 검사를 통과하고 디버깅 도구를 가능하게 하면서 더 높은 충실도와 로컬라이제이션을 달성함을 보여줍니다.

제안 방법

  • 활성화 맵의 중요성을 정량화하기 위해 Increase of Confidence를 정의합니다.
  • 업샘플링되고 정규화된 활성화 맵으로 입력을 마스킹하고 클래스 점수 변화를 측정하여 각 활성화 맵에 대해 CIC를 계산합니다.
  • 소프트맥스 정규화된 CIC 점수로 활성화 맵에 가중치를 부여하고, 최종 맵을 활성화 맵의 ReLU 가중 선형 결합으로 구성합니다.
  • 최종 설명에서 클래스 구분성을 향상시키기 위해 소프트맥스 이후 점수를 가중치로 사용합니다.
  • 임의의 합성곱 계층에 걸쳐 Score-CAM을 구현하기 위한 실용적 알고리즘(Algorithm 1)을 제공합니다.
  • 객체 영역 탐지 및 로컬라이제이션에서 Score-CAM을 Grad-CAM, Grad-CAM++, 및 기타 기준선과 비교합니다.

실험 결과

연구 질문

  • RQ1Gradient-free, 점수 기반의 활성화 맵 가중치가 기울기 기반 CAM 변형보다 더 충실하고 구별력 있는 시각적 설명을 제공합니까?
  • RQ2Grad-CAM/Grad-CAM++와 비교했을 때 Score-CAM은 인식 정확도, 로컬라이제이션, 안정성 검사에서 어떤 성능을 보입니까?
  • RQ3Score-CAM이 모델 오작동 및 데이터 세트 편향을 디버깅하는 데 유용한 도구가 될 수 있습니까?

주요 결과

MethodAverage Drop (%)Average Increase (%)
Mask63.55.29
RISE47.014.0
GradCAM47.819.6
GradCAM++45.518.9
ScoreCAM31.530.6
  • Score-CAM은 여러 기준선보다 더 매끄럽고 노이즈가 적은 주의도(saliency maps)를 생성합니다.
  • 인식 작업에서 Score-CAM은 경쟁 방법들보다 더 높은 Average Increase와 더 낮은 Average Drop를 달성합니다(예: 보고된 표에서 ScoreCAM의 Average Drop 31.5%와 Average Increase 30.6%대비 다른 방법은 63.5%/31.5%).
  • Score-CAM은 로컬라이제이션을 개선하여 일부 이미지에서 주의도 에너지의 >60%가 대상 객체 경계 상자 내부에 떨어집니다.
  • Score-CAM은 주의도에 대한 신뢰성 검사를 통과합니다(모델 매개변수에 민감함; 무작위화 테스트를 통과).
  • Score-CAM은 삭제/삽입 평가에서 더 강한 신뢰성을 보여줍니다(삽입 AUC가 더 크고 삭제 AUC가 더 작음, Grad-CAM/Grad-CAM++에 비해).
  • Score-CAM은 예측 클래스와 대상 클래스 간의 주의도 맵을 비교해 모델 오작동 및 데이터 셋 편향을 밝히는 디버깅에 도움을 줄 수 있습니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.