Skip to main content
QUICK REVIEW

[논문 리뷰] Explaining Image Classifiers by Counterfactual Generation

Chun‐Hao Chang, Elliot Creager|arXiv (Cornell University)|2018. 07. 20.
Generative Adversarial Networks and Image Synthesis인용 수 89
한 줄 요약

FIDO는 마스크된 영역을 채우기 위해 강력한 조건부 생성 모델을 사용하여 그럴듯한 대사실 입력값을 주변화함으로써 이미지 분류기를 설명하고, 간결하고 분포에 일관된 주목도 맵을 생성합니다.

ABSTRACT

When an image classifier makes a prediction, which parts of the image are relevant and why? We can rephrase this question to ask: which parts of the image, if they were not seen by the classifier, would most change its decision? Producing an answer requires marginalizing over images that could have been seen but weren't. We can sample plausible image in-fills by conditioning a generative model on the rest of the image. We then optimize to find the image regions that most change the classifier's decision after in-fill. Our approach contrasts with ad-hoc in-filling approaches, such as blurring or injecting noise, which generate inputs far from the data distribution, and ignore informative relationships between different parts of the image. Our method produces more compact and relevant saliency maps, with fewer artifacts compared to previous methods.

연구 동기 및 목표

  • 해당 이미지의 어떤 영역이 보이지 않더라도 제거되면 결정에 가장 큰 영향을 줄 것인지를 묻고 해석 가능한 설명을 제공하려는 동기 부여
  • 데이터 분포를 조건화하는 생성 모델을 통해 휴리스틱 인필링(예: 흐리게 처리)에서 벗어나기
  • 관찰되지 않은 픽셀을 주변화하는 확장 가능한 모델-무관 프레임워크를 개발
  • 이미지의 맥락적 관계를 존중하는 압축적이고 왜곡이 없는 설명을 촉진

제안 방법

  • 마스크된 이미지 영역을 조건부 생성 모델을 사용해 plausible한 채움으로 샘플링하며 주목도를 정의합니다.
  • 마스크를 Bernoulli 드롭아웃 분포로 표현하고 SDR/SSR 목표 하에서 분류기 신뢰도를 최소화/최대화하도록 매개변수를 최적화합니다.
  • Concrete/Gumbel-softmax 재매개화를 사용하여 이진 마스크에 대한 그래디언트 기반 최적화를 가능하게 합니다.
  • 마스크 해제 영역을 강력한 생성 모델(CA-GAN 등)의 샘플로 채워, 마스크 없는 맥락에 조건화합니다.
  • SDR과 SSR 목표를 비교하고, 인필링에서 데이터 학습과의 일관성을 높이고 아티팩트를 줄이기 위해 SSR을 선택합니다.
  • 효율적 최적화를 위한 구현 세부사항(BBMP 대 FIDO) 및 실용 알고리즘을 제공합니다

실험 결과

연구 질문

  • RQ1제거 또는 대체가 분류기 출력을 가장 크게 바꾸면서도 데이터 분포 내에 남아 있도록 이미지 영역을 어떻게 식별할 수 있을까?
  • RQ2강력한 조건부 생성 모델을 이용한 인필링이 휴리스틱 인필링보다 주목도 맵의 품질과 그럴듯함을 개선하는가?
  • RQ3현실적 인필링 하에서 어떤 목표(SDR 또는 SSR)가 더 충실하고 결점이 적은 설명을 제공하는가?
  • RQ4다른 인필링 방법과 분류기 아키텍처가 주목도 품질과 계산 효율성에 어떤 영향을 미치는가?
  • RQ5이 접근법이 ImageNet으로 확장되어 약하게 지도 학습된 로컬라이제이션 성능에서도 경쟁력을 제공할 수 있는가?

주요 결과

  • FIDO는 휴리스틱 인필링이나 기존 방법보다 더 압축적이고 결점이 적은 주목도 맵을 산출합니다.
  • 생성적 인필링(CA-GAN 등)은 평가된 이미지에서 표적 확률이 더 높고 아티팩트가 더 적습니다.
  • 강력한 생성 인필링으로 SSR을 사용할 때 SDR보다 설명이 더 일관적이며, SDR은 아티팩트를 유발할 수 있습니다.
  • FIDO-CA 주목도 맵은 분류기 신뢰도를 보존하는 맥락 픽셀에 집중하며 데이터 매니폴드를 존중하는 경향이 있습니다.
  • ImageNet에 대한 정량적 평가에서 베이스라인 및 이전 주목도 방법에 비해 로컬라이제이션 지표가 개선되었습니다.
  • 단절적 마스크 모델링(Bernoulli 드롭아웃)과 표현력 있는 인필링이 최적 설명에 필수적이라는 절차적 분석이 나타났습니다

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.