QUICK REVIEW

[논문 리뷰] An Interpretable Model with Globally Consistent Explanations for Credit Risk

Chaofan Chen, Kangcheng Lin|arXiv (Cornell University)|2018. 11. 30.

Explainable Artificial Intelligence (XAI)참고 문헌 14인용 수 65

한 줄 요약

이 논문은 전역적으로 해석 가능한 두 계층 가산 리스크 모델을 신용 부도 예측에 제시하며, 단조성 제약, 부분 척도 해석 가능성, SetCoverExplanation을 통한 일관된 규칙 기반 요약 및 대화형 시각화 도구를 포함한다.

ABSTRACT

We propose a possible solution to a public challenge posed by the Fair Isaac Corporation (FICO), which is to provide an explainable model for credit risk assessment. Rather than present a black box model and explain it afterwards, we provide a globally interpretable model that is as accurate as other neural networks. Our "two-layer additive risk model" is decomposable into subscales, where each node in the second layer represents a meaningful subscale, and all of the nonlinearities are transparent. We provide three types of explanations that are simpler than, but consistent with, the global model. One of these explanation methods involves solving a minimum set cover problem to find high-support globally-consistent explanations. We present a new online visualization tool to allow users to explore the global model and its explanations.

연구 동기 및 목표

정확도를 희생하지 않으면서 블랙박스 신용 위험 모델에 대한 전역적으로 해석 가능한 대안을 제공한다.
해석 가능성과 시각화를 가능하게 하도록 특징을 의미 있는 부분 척도로 분해한다.
신용 위험에 대한 도메인 지식을 반영하기 위해 특징에 단조성 제약을 보장한다.
전역 모델과 일치하는 일관된 규칙 기반 설명과 케이스 기반 시각화를 개발한다.
모델, 설명 및 부분 척도 기여를 탐색할 수 있는 대화형 도구를 제공한다.

제안 방법

특성을 부분 척도로 묶고 단조로운 구간-상수 함수로 변환하는 두 계층 가산 위험 모델(ARM)을 제안한다.
단계 함수 계수에 대해 비음수 제약을 적용하여 단조로운 관계를 보장한다.
시그모이드 변환으로 부분 척도 점수를 계산한 다음 선형으로 결합하고 최종 시그모이드를 통과시켜 디폴트 확률을 얻는다.
부분 척도를 독립적으로 정규화와 함께 학습하거나 전역 목표와 함께 공동으로 학습하여 희소성과 단조성을 보존한다.
세 가지 설명 유형을 제공한다: (i) 부분 척도 기여를 통한 변수 중요도, (ii) SetCoverExplanation으로 전역적으로 일관된 결합 규칙 생성, (iii) 유사한 과거 사례를 찾아 케이스 기반 설명.
전체 모델, 부분 척도 기여 및 설명을 표시하는 온라인 시각화 도구를 개발한다.

실험 결과

연구 질문

RQ1전역적으로 해석 가능한 모델이 투명성을 유지하면서 신용 위험에 대해 신경망의 정확도와 대등한 성능을 낼 수 있는가?
RQ2특징 부분 척도가 위험 요인에 대해 의미 있고 희소하며 단조롭게 설계될 수 있는가?
RQ3설명은 순도 손실 없이 집합 커버 기반 규칙을 사용하여 전역적으로 일관되게 만들 수 있는가?
RQ4사용자가 부분 척도 기여와 설명을 탐색하는 데 인터랙티브 시각화가 얼마나 효과적인가?
RQ5신용 위험 데이터에 대한 SetCoverExplanation에서 규칙 희소성와 커버리지 간의 균형은 어떤가?

주요 결과

두 계층 가산 리스크 모델은 해석 가능성을 유지하면서 다른 머신 러닝 방법과 비슷한 정확도를 달성한다.
특성은 23개의 원래 특성에서 10개의 부분 척도로 분할되며 각 부분 척도는 의미 있는 해석을 가진 부분 척도 리스크 점수를 생성한다.
단조성 제약은 비음수 계수를 갖는 편향된 한쪽 구간 스텝 함수를 사용하여 강제된 특성에 대해 단조로운 관계를 보장한다.
SetCoverExplanation은 모델 동작을 요약하고 예측에서 광범위한 패턴을 설명할 수 있는 전역적으로 일관되고 높은 서포트를 갖는 규칙을 생성한다.
대화형 시각화 도구는 전체 계산, 부분 척도 기여 및 케이스 기반 설명을 시연하여 신뢰성과 이해를 돕는다.
이 접근 방식은 불투명한 블랙박스 모델에 의존하지 않으면서 해석 가능한 글로벌 설명과 로컬 케이스 기반 통찰을 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.