[논문 리뷰] Algorithmic recourse under imperfect causal knowledge: a probabilistic approach
요약: 이 논문은 불완전한 인과 지식하에서 알고리즘적 재현성을 계산하기 위한 두 가지 확률적 방법을 제안한다: (i) 개인 맞춤 재현성을 위한 가우시안 프로세스 기반 counterfactuals, (ii) CVAE를 사용한 조건부 평균 처리 효과를 통한 하위집단 기반 재현성 및 Intervention 선택을 위한 그래디언트 기반 최적화.
Recent work has discussed the limitations of counterfactual explanations to recommend actions for algorithmic recourse, and argued for the need of taking causal relationships between features into consideration. Unfortunately, in practice, the true underlying structural causal model is generally unknown. In this work, we first show that it is impossible to guarantee recourse without access to the true structural equations. To address this limitation, we propose two probabilistic approaches to select optimal actions that achieve recourse with high probability given limited causal knowledge (e.g., only the causal graph). The first captures uncertainty over structural equations under additive Gaussian noise, and uses Bayesian model averaging to estimate the counterfactual distribution. The second removes any assumptions on the structural equations by instead computing the average effect of recourse actions on individuals similar to the person who seeks recourse, leading to a novel subpopulation-based interventional notion of recourse. We then derive a gradient-based procedure for selecting optimal recourse actions, and empirically show that the proposed approaches lead to more reliable recommendations under imperfect causal knowledge than non-probabilistic baselines.
연구 동기 및 목표
- 불완전한 인과 지식을 고려한 인과 의식적 알고리즘 재현성의 필요성을 제시한다.
- 보장( guarantees )가 사실상 올바른 구조방정식을 알고 있는 경우에 의존한다는 점을 보이며 이는 일반적으로 실행 불가능하다.
- 제한된 인과 지식 하에서 높은 확률로 최적의 재현성 행동을 선택하기 위한 두 가지 확률적 접근법을 개발한다.
- 불확실성 하에서 재현성 달성에 비용 효율적인 행동을 찾기 위한 경사 기반 최적화 방법을 제시한다.
- 확률적 방법이 신뢰성 및 비용 면에서 비확률적 기준선보다 우수하다는 것을 실증적으로 입증한다.
제안 방법
- 구조 방정식의 불확실성을 가우시안 프로세스 기반 구조적 인과 모델(gp-scm)로 모델링하고 덧셈 가우시안 노이즈를 사용하여 counterfactuals의 분포를 얻는다.
- 개입의 선조(descendants)에 대한 counterfactual 분포를 조상 샘플링과 GP 노이즈 포스트eriors를 사용하여 계산한다.
- 하한 신뢰 bound를 임계값으로 사용하는 기대 분류자 결과의 제약조건 하에서 행동 비용을 최소화하는 확률적 재현성 최적화 목적을 형식화한다.
- 사후 변분 오토인코더(CVAE)를 이용한 조건부 변분 오토인코더(CVAE)로 간 Interventional distributions를 추정하는 조건부 평균 처리 효과(CATE)를 이용한 하위집단 기반 재현성을 도입한다.
- 개입 분포 P(X_d(I) | do(X_I=theta), X_nd(I)=x_nd) 를 인과적 충분성하에서 관찰적으로 확인 가능하다고 식정하고 이를 CVAEs로 모델링한다.
- 그래디언트 기반 라그랑지 접근법으로 최적화 문제를 풀되 기댓값의 몬테카를로 추정치를 미분하여 해결한다.
실험 결과
연구 질문
- RQ1참된 구조방정식이 알려져 있지 않을 때 재현성 보장을 달성할 수 있는가?
- RQ2확률적 모델을 사용하여 불완전한 인과 지식 하에서 신뢰 가능한 재현성 행동을 어떻게 계산할 수 있는가?
- RQ3gp-scm 기반 counterfactual과 하위집단 기반 개입 접근법이 비확률적 기준선보다 낮은 비용 및 더 높은 타당성의 재현성을 제공하는가?
- RQ4구조 방정식 형태가 잘못 명시될 때 하위집단 기반 재현성(CATE 기반)이 더 바람직한가?
주요 결과
- 확률적 재현성 방법이 불완전한 인과 지식 하에서 비확률적 기준선에 비해 더 높은 타당성과 관리된 비용을 제공한다.
- GP 기반 재현성(gp-scm)은 강건한 타당성을 달성하며(일부 설정에서 100%), 측정 가능한 lcb 값을 제공하고 특정 시나리오에서 비용이 더 높다.
- CATE를 이용한 하위집단 기반 재현성(cvae)은 다양한 SCM 계통에서 강력한 성능을 보이며 종종 오라클 성능에 근접하거나 이를 달성한다.
- 세 변수로 이루어진 합성 SCM(선형, 비선형 ANM, 비가법적)에서 확률적 방법은 신뢰성 및 비용 측면에서 점 기반 기준선보다 우수하다.
- 그래디언트 기반 최적화는 모델 기반 기대값을 미분하여 고품질의 재현성 행동을 효율적으로 찾아낸다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.