[논문 리뷰] Algorithm-Agnostic Explainability for Unsupervised Clustering
논문은 두 가지 글로벌/로컬, 알고리즘-무관 explainability 방법(G2PC와 L2PC)을 도입하여 여러 알고리즘에 걸친 비지도 클러스터링을 설명하며 합성 데이터와 고차원 fMRI 연결성 데이터에서 시연한다.
Supervised machine learning explainability has developed rapidly in recent years. However, clustering explainability has lagged behind. Here, we demonstrate the first adaptation of model-agnostic explainability methods to explain unsupervised clustering. We present two novel "algorithm-agnostic" explainability methods - global permutation percent change (G2PC) and local perturbation percent change (L2PC) - that identify feature importance globally to a clustering algorithm and locally to the clustering of individual samples. The methods are (1) easy to implement and (2) broadly applicable across clustering algorithms, which could make them highly impactful. We demonstrate the utility of the methods for explaining five popular clustering methods on low-dimensional synthetic datasets and on high-dimensional functional network connectivity data extracted from a resting-state functional magnetic resonance imaging dataset of 151 individuals with schizophrenia and 160 controls. Our results are consistent with existing literature while also shedding new light on how changes in brain connectivity may lead to schizophrenia symptoms. We further compare the explanations from our methods to an interpretable classifier and find them to be highly similar. Our proposed methods robustly explain multiple clustering algorithms and could facilitate new insights into many applications. We hope this study will greatly accelerate the development of the field of clustering explainability.
연구 동기 및 목표
- 클러스터링 설명가능성을 모델-무관 설명가능성을 비지도 학습 클러스터링에 적용하여 향상한다.
- 다양한 클러스터링 알고리즘에 걸쳐 글로벌하고 로컬 해석 가능한 피처 중요도를 제공한다.
- 저차원 합성 데이터와 fMRI의 고차원 뇌 연결 데이터에서 유용성을 시연한다.
제안 방법
- 글로벌 permutation percent change (G2PC)를 개발하여 클러스터링 알고리즘 전체에서 피처 중요도를 정량화한다.
- 지역 perturbation percent change (L2PC)를 개발하여 개별 샘플에 대한 피처 중요도를 정량화한다.
- 여러 클러스터링 알고리즘에 걸쳐 적용 가능성을 보여준다(알고리즘-무관).
- 합성 데이터 세트와 고차원 휴지상태 fMRI 연결성 데이터에서 설명을 검증한다.
- 설명을 해석 가능한 분류기와 비교하여 유사성을 평가한다.
실험 결과
연구 질문
- RQ1모델-무관 설명가능성 기술을 비지도 클러스터링 설명으로 적용할 수 있는가?
- RQ2G2PC와 L2PC가 서로 다른 클러스터링 알고리즘에서 전반적으로 그리고 샘플별로 안정적이고 의미 있는 피처 중요도를 제공하는가?
- RQ3설명이 해석 가능한 분류기의 해석 및 기존 뇌 연결성 문헌과 일치하는가?
주요 결과
- G2PC와 L2PC는 여러 클러스터링 방법에 대해 전반적으로 그리고 로컬하게 피처 중요도를 성공적으로 식별한다.
- 이 방법들은 구현이 쉽고 클러스터링 알고리즘 전반에 널리 적용 가능하다.
- 조현병 및 대조군의 fMRI 연결 데이터에 대한 설명은 기존 문헌과 일치하며 뇌 연결성 변화에 대한 새로운 통찰을 제공한다.
- 제안된 방법의 설명은 해석 가능한 분류기와 높은 유사성을 보인다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.