QUICK REVIEW

[논문 리뷰] Demographics and discussion influence views on algorithmic fairness

Emma Pierson|arXiv (Cornell University)|2017. 12. 25.

Ethics and Social Impacts of AI참고 문헌 8인용 수 25

한 줄 요약

이 연구는 세 개의 인구집단에 대한 설문 조사와 컴퓨터 과학 수강생들의 종단적 데이터를 통해 인구통계학적 특성과 토론이 알고리즘 정의에 대한 견해에 어떻게 영향을 미치는지 조사한다. 연구 결과, 성별이 정의의 공정성에 대한 믿음에 유의미하게 예측하는 것으로 나타났으며, 특히 과목 추천 알고리즘에서 성별을 사용하는 데 있어 그러한 영향이 두드러졌다. 또한 토론은 일부 견해를 변화시켰지만, 성별 기반의 견해 격차를 줄이거나 공감대를 형성하지는 못했다.

ABSTRACT

The field of algorithmic fairness has highlighted ethical questions which may not have purely technical answers. For example, different algorithmic fairness constraints are often impossible to satisfy simultaneously, and choosing between them requires value judgments about which people may disagree. Achieving consensus on algorithmic fairness will be difficult unless we understand why people disagree in the first place. Here we use a series of surveys to investigate how two factors affect disagreement: demographics and discussion. First, we study whether disagreement on algorithmic fairness questions is caused partially by differences in demographic backgrounds. This is a question of interest because computer science is demographically non-representative. If beliefs about algorithmic fairness correlate with demographics, and algorithm designers are demographically non-representative, decisions made about algorithmic fairness may not reflect the will of the population as a whole. We show, using surveys of three separate populations, that there are gender differences in beliefs about algorithmic fairness. For example, women are less likely to favor including gender as a feature in an algorithm which recommends courses to students if doing so would make female students less likely to be recommended science courses. Second, we investigate whether people's views on algorithmic fairness can be changed by discussion and show, using longitudinal surveys of students in two computer science classes, that they can.

연구 동기 및 목표

인구통계학적 요인, 특히 성별이 알고리즘 정의에 대한 믿음에 영향을 미치는지 조사하는 것.
구조화된 토론이 알고리즘 의사결정의 정의에 대한 개인의 견해를 변화시킬 수 있는지 검토하는 것.
교육적 개입 이후에도 정의 인식의 인구통계학적 격차가 지속되는지 평가하는 것.
토론이 증가함에 따라 정의적 트레이드오프에 대한 공감대가 증가하는지 평가하는 것.
가치 기반의 갈등을 이해함으로써 더 대표성 있고 윤리적으로 조율된 알고리즘 시스템 설계를 뒷받침하는 것.

제안 방법

다양한 인구집단을 대상으로 세 차례의 별도 설문 조사를 실시함: 소셜미디어 모집, 구글 소비자 설문조사, 학부 컴퓨터 과학 수강생.
알고리즘 정의에 관한 윤리적 딜레마를 제시하는 표준화된 설문 질문을 사용함: 예를 들어 과목 추천 알고리즘에서 성별을 사용하거나, 범죄 위험 예측에서 인종을 사용하는 것.
알고리즘 정의에 관한 1시간 강의와 토론을 실시하기 전과 후에 컴퓨터 과학 수업 두 개에서 종단적 데이터를 수집함.
설문 샘플 전반에서 성별을 포함한 주요 인구통계학적 차이를 탐지하기 위해 통계 분석을 적용함.
강의 전후 설문 응답을 비교하여 알고리즘 사용, 투명성, 기능 포함에 대한 지지도의 변화를 측정함.
결과의 타당성과 일반화 가능성을 확보하기 위해 여러 샘플에서 결과를 재현함.

실험 결과

연구 질문

RQ1인구통계학적 요인, 특히 성별이 알고리즘 정의에 대한 믿음의 차이를 유의미하게 예측하는가?
RQ2구조화된 토론이 알고리즘 의사결정의 정의에 대한 개인의 견해를 얼마나 변화시킬 수 있는가?
RQ3이 주제에 대한 교육적 토론에 노출된 후에도 성별 기반의 정의 인식 격차가 지속되는가?
RQ4토론은 정의 트레이드오프에 대한 공감대를 증가시키는가, 아니면 견해의 이질성이 여전히 유지되는가?
RQ5정의 믿음의 인구통계학적 격차는 알고리즘 설계 팀의 대표성에 어떤 영향을 미치는가?

주요 결과

성별이 과목 추천 알고리즘에서 성별을 사용할 경우 여성 학생이 과학 과목에 추천될 가능성이 감소할 수 있다는 점을 고려할 때, 여성은 남성보다 성별을 기능으로 사용하는 것에 대해 더 적게 지지한다.
1시간 강의와 토론 이후, 컴퓨터 과학 수강생의 90퍼센트 이상이 알고리즘 정의에 대한 자신의 견해를 변화시켰지만, 변화의 크기는 일반적으로 미미했다.
토론에도 불구하고 정의 인식에 대한 성별 격차는 일관되게 좁아지거나 사라지지 않았으며, 이는 가치 판단의 지속적인 차이를 시사한다.
COMPAS 정의 질문에 대한 응답의 산포가 토론 후 증가하여 공감대 형성 대신 견해의 분열이 증가했음을 나타낸다.
토론 후 학생들은 알고리즘 투명성에 더 지지하고 범죄 사법 분야에서 알고리즘 사용에 더 개방적인 태도를 보였지만, 정의의 정의에 대한 견해는 변화에 저항성이 있었다.
세 개의 서로 다른 인구집단에서 정의 믿음의 인구통계학적 차이가 통계적으로 유의미하게 나타났으며, 배경 요소가 알고리즘에 대한 윤리적 판단을 형성하는 데 영향을 미친다는 것을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.