Skip to main content
QUICK REVIEW

[논문 리뷰] Learning outside the Black-Box: The pursuit of interpretable models

Jonathan Crabbé, Yao Zhang|arXiv (Cornell University)|2020. 01. 01.
Model Reduction and Neural Networks인용 수 5
한 줄 요약

이 논문은 메이저 G-함수를 릿지 함수로 사용하여 블랙박스 기계학습 모델의 연속적이고 글로벌 해석을 생성하는 새로운 알고리즘을 제안한다. 이 함수들이 미분 가능하므로 기울기 기반 최적화가 가능해지며, 이로 인해 특성 중요도와 상호작용을 드러내는 매우 정확하고 간결한 해석을 달성한다. 이는 이전의 최첨단 기법들보다 해석 가능성 측면에서 크게 발전시킨다.

ABSTRACT

Machine Learning has proved its ability to produce accurate models but the deployment of these models outside the machine learning community has been hindered by the difficulties of interpreting these models. This paper proposes an algorithm that produces a continuous global interpretation of any given continuous black-box function. Our algorithm employs a variation of projection pursuit in which the ridge functions are chosen to be Meijer G-functions, rather than the usual polynomial splines. Because Meijer G-functions are differentiable in their parameters, we can tune the parameters of the representation by gradient descent; as a consequence, our algorithm is efficient. Using five familiar data sets from the UCI repository and two familiar machine learning algorithms, we demonstrate that our algorithm produces global interpretations that are both highly accurate and parsimonious (involve a small number of terms). Our interpretations permit easy understanding of the relative importance of features and feature interactions. Our interpretation algorithm represents a leap forward from the previous state of the art.

연구 동기 및 목표

  • 복잡하고 연속적인 블랙박스 기계학습 모델을 글로벌하고 인간이 이해할 수 있는 방식으로 해석하는 데 도전한다.
  • 다항 스퍼린 같은 비미분 가능 성분에 의존하는 전통적 방법의 한계를 극복한다.
  • 기울기 강하 최적화를 가능하게 하는 효율적이고 미분 가능한 표현을 개발하여 모델의 해석 가능성 향상.
  • 특성 중요도와 상호작용을 드러내는 희소하지만 매우 정확한 해석을 생성한다.
  • 연속적이고 글로벌하며 미분 가능한 모델 설명을 가능하게 함으로써 해석 가능한 기계학습 분야의 최첨단 수준을 향해 발전시킨다.

제안 방법

  • 표준 다항 스퍼린 대신 메이저 G-함수를 릿지 함수로 사용하는 프로젝션 퍼스위트 프레임워크를 사용한다.
  • 메이저 G-함수는 매개변수에 대해 미분 가능하므로 기울기 기반 최적화가 가능하다는 이유로 선택된다.
  • 블랙박스 함수와 해석 가능한 근사치 간의 차이를 최소화하기 위해 메이저 G-함수의 매개변수를 기울기 강하를 통해 조정한다.
  • 소수의 항을 사용하여 블랙박스 함수의 글로벌이고 연속적인 근사를 구성함으로써 간결성을 확보한다.
  • 학습된 매개변수를 통해 특성 기여도와 상호작용에 대한 해석 가능한 통찰을 제공한다.
  • 두 가지 표준 기계학습 알고리즘을 사용하여 다섯 개인 UCI 데이터셋에서 평가함으로써 확장성과 정확도를 입증한다.

실험 결과

연구 질문

  • RQ1메이저 G-함수를 사용하여 기울기 기반 최적화가 가능한 비차별적이고 연속적인 블랙박스 함수 표현을 구성할 수 있는가?
  • RQ2이러한 표현은 복잡한 블랙박스 모델을 얼마나 정확하게 근사하면서도 간결성을 유지할 수 있는가?
  • RQ3이 방법은 의미 있는 특성 중요도와 상호작용 효과를 어느 정도 드러내는가?
  • RQ4기존 최첨단 기법들과 비교할 때 해석 가능성과 정확성 측면에서 어떤가?
  • RQ5실제 데이터셋에 대해 효과적으로 확장 가능할 수 있는가? 동시에 해석 가능성과 성능를 유지하는가?

주요 결과

  • 알고리즘은 매우 정확하고 간결한 글로벌 해석을 생성하며, 높은 정밀도를 달성하기 위해 소수의 항만 필요로 한다.
  • 기울기 기반 최적화가 가능한 기울기 가능 메이저 G-함수의 사용으로 인해 비기울기 가능 대안 대비 계산 효율성이 크게 향상된다.
  • 특성 중요도와 상호작용을 성공적으로 드러내어 이전 방법들에 비해 명확한 해석 가능성 이점을 제공한다.
  • 다섯 개인 UCI 데이터셋에서의 실증적 평가를 통해 최첨단 수준의 해석 가능성과 정확성에서 뛰어난 성능을 입증한다.
  • 다양한 실생활 데이터셋과 기계학습 모델에 적용했을 때 알고리즘이 강인하고 확장 가능함을 보였다.
  • 결과로 도출된 해석은 연속적이고 글로벌하여 입력 공간 전반에서 블랙박스 함수의 포괄적인 시각을 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.