Skip to main content
QUICK REVIEW

[논문 리뷰] One Explanation Does Not Fit All: A Toolkit and Taxonomy of AI Explainability Techniques

Vijay Arya, Rachel Bellamy|arXiv (Cornell University)|2019. 09. 06.
Explainable Artificial Intelligence (XAI)참고 문헌 46인용 수 263
한 줄 요약

논문은 AI Explainability 360 (AIX360)을 제시하는데, 이는 여덟 가지 설명 가능성 방법과 두 가지 평가 지표를 갖춘 오픈소스 도구 키트이며, 다양한 이해관계자와의 설명을 매칭하기 위한 실용적 분류학을 포함한다.

ABSTRACT

As artificial intelligence and machine learning algorithms make further inroads into society, calls are increasing from multiple stakeholders for these algorithms to explain their outputs. At the same time, these stakeholders, whether they be affected citizens, government regulators, domain experts, or system developers, present different requirements for explanations. Toward addressing these needs, we introduce AI Explainability 360 (http://aix360.mybluemix.net/), an open-source software toolkit featuring eight diverse and state-of-the-art explainability methods and two evaluation metrics. Equally important, we provide a taxonomy to help entities requiring explanations to navigate the space of explanation methods, not only those in the toolkit but also in the broader literature on explainability. For data scientists and other users of the toolkit, we have implemented an extensible software architecture that organizes methods according to their place in the AI modeling pipeline. We also discuss enhancements to bring research innovations closer to consumers of explanations, ranging from simplified, more accessible versions of algorithms, to tutorials and an interactive web demo to introduce AI explainability to different audiences and application domains. Together, our toolkit and taxonomy can help identify gaps where more explainability methods are needed and provide a platform to incorporate them as they are developed.

연구 동기 및 목표

  • 다양한 소비자 페르소나를 고려한 AI 설명 가능성 방법 공간에 대한 포괄적 분류체계를 제공한다.
  • 데이터, 모델, 예측 단계 전반에 걸쳐 여러 설명 가능성 방법을 구현하는 확장 가능한 오픈소스 도구 키트(AIX360)를 개발한다.
  • 데이터 사이언티스트와 비기술 이해관계자의 실용적 사용성을 개선하기 위해 기존 설명 가능성 방법을 향상시킨다.
  • 설명 가능성 개념의 접근성을 분야 간에 확장하기 위해 교육 자료, 튜토리얼, 시연을 제공한다.

제안 방법

  • 무엇을 설명하는지, 어떻게 설명하는지, 어느 수준(local/global)에서 설명하는지로 설명 가능성 방법을 조직하기 위한 분류체계를 도입한다.
  • 분류체인 leaves를 AIX360 내의 특정 설명 알고리즘에 매핑하는 확장 가능한 소프트웨어 아키텍처를 설명한다.
  • 여덟 가지 설명 알고리즘(BRCG, GLRM, ProtoDash, ProfWeight, TED, CEM, CEM-MAF, DIP-VAE)과 두 가지 지표(Faithfulness, Monotonicity)를 구현한다.
  • scikit-learn을 닮은 API 설계를 제공하여 알고리즘 개발자가 확장하고 데이터, 모델, 예측 설명 도구 간의 재사용을 가능하게 한다.
  • 메서드를 보다 쉽게 활용할 수 있도록 개선 사항(BRCG-light, TED 데이터 합성)들을 제시하고 비전문가를 위한 대화형 웹 데모를 구축한다.

실험 결과

연구 질문

  • RQ1간단한 분류체계가 다양한 응용 사례와 이해관계자에게 적합한 설명 가능성 방법을 선택하는 데 어떻게 도움을 줄 수 있는가?
  • RQ2AI 모델링 파이프라인 전반에 걸친 다양한 설명 가능 기술을 통합하는 확장 가능한 소프트웨어 아키텍처는 무엇인가?
  • RQ3기존의 설명 가능성 방법을 실용적 배치 및 비기술자 대상의 접근성을 위해 어떻게 향상시킬 수 있는가?
  • RQ4교육 자료와 시연이 대출이나 보건의료와 같은 실제 도메인에서 설명 가능성의 채택을 넓힐 수 있는가?

주요 결과

  • 제안된 분류체계는 데이터/모델/예측 필요성과 local/global, 정적/대화형을 고려한 의사결정 트리처럼 방법 선택을 안내한다.
  • AIX360은 여덟 가지 설명 가능성 방법과 두 가지 평가 지표를 제공하고 이를 확장 가능한 Python 아키텍처 내의 분류체계에 매핑한다.
  • 논문은 실용적 향상(예: BRCG-light, TED 데이터 합성)을 통해 실제 상황에서의 채택과 사용성을 개선함을 시연한다.
  • 도구 키트는 교육 자료, 튜토리얼, 그리고 비전문가를 대상으로 한 대화형 웹 데모를 포함하여 도메인 간 설명 가능성의 접근성을 높인다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.