[논문 리뷰] Fairness in Criminal Justice Risk Assessments: The State of the Art
이 논문은 형사법적 위험 평가에서의 공정성에 대해 형식적이고 다학제적인 분석을 제공하며, 상호 갈등이 자주 발생하고 정확성과도 충돌하는 여섯 가지의 공정성 정의를 규명한다. 수학적으로 공정성, 정확성, 기본률 격차 간의 상충관계가 피할 수 없음을 입증하며, 이상적인 공정성 주장보다는 투명하고 가치 기반의 상충관계 결정을 주장한다.
Objectives: Discussions of fairness in criminal justice risk assessments typically lack conceptual precision. Rhetoric too often substitutes for careful analysis. In this paper, we seek to clarify the tradeoffs between different kinds of fairness and between fairness and accuracy. Methods: We draw on the existing literatures in criminology, computer science and statistics to provide an integrated examination of fairness and accuracy in criminal justice risk assessments. We also provide an empirical illustration using data from arraignments. Results: We show that there are at least six kinds of fairness, some of which are incompatible with one another and with accuracy. Conclusions: Except in trivial cases, it is impossible to maximize accuracy and fairness at the same time, and impossible simultaneously to satisfy all kinds of fairness. In practice, a major complication is different base rates across different legally protected groups. There is a need to consider challenging tradeoffs.
연구 동기 및 목표
- 형사법적 위험 평가에서의 공정성에 대한 개념적 혼란을 명확히 하며, 특히 알고리즘 기반 의사결정의 맥락에서 이를 다루는 것.
- 정책 및 대중 논의에서 종종 혼동되는 여러 상이한 공정성 정의를 식별하고 형식화하는 것.
- 공정성, 정확성, 기본률 격차가 실무에서 상호 비교 불가능하다는 것을 수학적으로 입증하며, 상충관계가 필요하다는 점을 보여주는 것.
- 보호 그룹 소속이 예측 변수에서 제외된 경우에도, 예측 변수 내에서 보호 그룹과 관련된 역사적 불평등의 상관관계로 인해 공정성 위반이 발생할 수 있음을 보여주는 것.
- 위험 평가 시스템에서 투명성을 확보하고, 이해관계자들이 서로 충돌하는 공정성 및 정확성 목표를 명시적으로 고려할 수 있도록 조정 가능한 퍼라미터를 제공하는 것.
제안 방법
- 저자들은 보호 그룹 간의 진짜 양성률, 위양성률, 양성예측도와 같은 핵심 공정성 지표를 정의하고 비교하기 위해 2x2 혼란도표 프레임워크를 사용한다.
- 실제 구속 기소 데이터를 대상으로 통계 및 머신러닝 기법(예: 랜덤 포레스트 및 인라인 처리 공정성 알고리즘)을 적용하여 공정성-정확성 상충관계를 실증적으로 입증한다.
- 특정 보호 그룹(예: Black 및 White 범죄자)에 대해 별도의 모델 피팅을 수행하여 조건부 사용 정확도 동일성의 정도를 평가하며, 인종에 따라 예측 변수 중요도의 구조적 차이를 드러낸다.
- 저자들은 민족적 평등, 동일 기회, 예측 평등성과 같은 공정성 정의를 분석하며, 일반 조건 하에서 이들의 수학적 불가침성을 보여준다.
- 컴퓨터 과학 및 통계학의 공식 증명(예: Kleinberg et al., 2016; Chouldechova, 2016)을 활용하여, 어떤 알고리즘도 동시에 모든 공정성 기준을 충족시킬 수 없음을 수립한다.
- 논문은 상충관계가 조정 가능한 퍼라미터를 통해 명시적으로 드러나야 하며, 최종 결정은 과학적 것이 아니라 정치적 결정임을 강조한다.
실험 결과
연구 질문
- RQ1여러 공정성 정의가 하나의 위험 평가 모델에서 동시에 존재할 수 있는가, 아니면 본질적으로 상호 배타적인가?
- RQ2보호 그룹 간 기본률 격차(예: 젊은 Black 남성 대 비연령대의 White 여성)가 공정성 지표와 모델 성능에 어떤 영향을 미치는가?
- RQ3인종이나 성별과 같은 보호 속성을 예측 변수로 포함하지 않더라도 알고리즘 공정성은 어느 정도 달성될 수 있는가?
- RQ4실제 형사법적 데이터에서 공정성, 정확성, 예측 평등성 간의 정량적 상충관계는 어떠한가?
- RQ5다른 인구 집단에 대해 별도의 모델 피팅을 수행할 경우 공정성 결과에 어떤 영향을 미치며, 이는 공정성과 투명성에 어떤 함의를 갖는가?
주요 결과
- 위험 평가에서 최소한 여섯 가지의 상이한 공정성 정의가 존재하며, 일반 조건 하에서는 상호 배타적이다.
- 정확성과 공정성을 동시에 최대화하는 것은 형식적 정리에 의해 증명된 바와 같이, 비잔만한 경우를 제외하고는 수학적으로 불가능하다.
- 인종과 성별이 예측 변수에서 제외된 경우에도, 보호 속성과 합리적인 예측 변수 간의 상관관계(예: 이전 범죄 기록)로 인해 공정성 위반이 발생한다.
- 다른 인종 집단에 대해 별도로 모델을 학습할 경우, 위양성률과 위음성률이 크게 다를 수 있으며, 이는 동일 기회와 같은 공정성 지표를 약화시킨다.
- Wisconsin 주 상고법원이 2017년 COMPAS를 형량 결정 요소로 인정한 판결은 이러한 공정성-정확성 상충관계의 실제 정책적 중요성을 보여준다.
- 모든 공정성 문제를 기술적으로 해결할 수는 없으며, 어떤 상충관계를 수용할지를 선택하는 것은 궁극적으로 과학적 결정이 아니라 정치적·가치 기반의 결정이다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.