QUICK REVIEW

[논문 리뷰] Gender Bias in Coreference Resolution: Evaluation and Debiasing Methods

Jieyu Zhao, Tianlu Wang|arXiv (Cornell University)|2018. 04. 18.

Topic Modeling참고 문헌 20인용 수 95

한 줄 요약

규칙 기반, 특징 기반, 신경망 시스템 전반에 걸친 코어퍼런스에서의 성별 편향을 측정하기 위해 WinoBias를 도입한다; 편향이 존재하며 데이터 증강과 편향 제거 임베딩으로 성능에 미치는 영향은 최소화하면서 이를 완화할 수 있음을 보인다.

ABSTRACT

We introduce a new benchmark, WinoBias, for coreference resolution focused on gender bias. Our corpus contains Winograd-schema style sentences with entities corresponding to people referred by their occupation (e.g. the nurse, the doctor, the carpenter). We demonstrate that a rule-based, a feature-rich, and a neural coreference system all link gendered pronouns to pro-stereotypical entities with higher accuracy than anti-stereotypical entities, by an average difference of 21.1 in F1 score. Finally, we demonstrate a data-augmentation approach that, in combination with existing word-embedding debiasing techniques, removes the bias demonstrated by these systems in WinoBias without significantly affecting their performance on existing coreference benchmark datasets. Our dataset and code are available at http://winobias.org.

연구 동기 및 목표

코어퍼런스에서의 성별 편향 연구와 그것이 사회에 미치는 잠재적 영향을 동기 부여한다.
직업 기반 대명사를 사용하여 편향된 고정관념을 지지하는/반대하는 연결을 탐색하기 위한 표적 벤치마크(WinoBias)를 만든다.
시스템 간 프로-고정관념적 조건화와 반고정관념적 조건화를 비교하여 편향을 정량화한다.
성별 교환 데이터 증강과 편향 제거 단어 임베딩을 포함한 편향 제거 전략을 제안하고 평가하여 코어퍼런스 정확도를 유지하면서 편향을 감소시킨다.

제안 방법

40개 직업과 성별 대명사를 중심으로 한 Winograd-형 템플릿 두 유형으로 WinoBias를 구성한다.
OntoNotes와 WinoBias에서 세 가지 대표적인 코어퍼런스 시스템(규칙 기반, 특징 기반, 엔드-투-엔드 신경망)을 평가한다.
성별 표현 및 직업 언급을 포함한 OntoNotes 학습 데이터를 검토하여 편향의 원인을 분석한다.
학습 데이터의 성별 상관 관계를 균형 있게 만들기 위한 성별 교환 데이터 증강을 제안한다.
고정 자원(편향 제거 임베딩, 성별 목록)에 대한 편향 제거 기법을 적용하고 증강과 결합하여 편향을 줄인다.
편향 제거가 WinoBias에서 프로-고정관념적 대 반고정관념적 격차를 줄이고 OntoNotes에서의 성능 손실을 최소화함을 보인다.

실험 결과

연구 질문

RQ1WinoBias에서 프로-고정관념적 직업과 반고정관념적 직업에 대한 성능 차이로 측정되듯 코어퍼런스 시스템이 성별 편향을 보이나요?
RQ2성별 교환을 통한 데이터 증강과 임베딩/편향 제거가 표준 벤치마크에서의 코어퍼런스 정확도를 크게 해치지 않으면서 이러한 편향을 줄일 수 있나요?
RQ3코어퍼런스 작업에 일반적으로 사용되는 학습 데이터(OntoNotes)의 주요 편향 원천은 무엇인가요?
RQ4편향 제거 방법이 서로 다른 모델 아키텍처(규칙 기반, 특징 기반, 신경망)와 어떻게 상호 작용하여 성별 편향을 완화하나요?

주요 결과

세 가지 대표 시스템 모두 WinoBias에서 프로-고정관념적 조건과 반고정관념적 조건 간에 측정 가능한 차이를 보인다.
데이터 증강 방법(성별 교환)과 편향 제거 임베딩 및 자원 편향 제거를 결합하면 WinoBias의 편향 신호를 줄이거나 제거하면서 OntoNotes에서의 경쟁력 있는 성능을 유지한다.
OntoNotes에서 여성 엔터티가 과소대표되며, 성별 교환은 이 편향에 대응하는 균형 잡힌 보조 데이터를 생성할 수 있다.
시스템은 충분히 강한 대체 신호가 제공되면 편향을 무시할 수 있으며, 신호가 강할 때 편향이 불가피하지 않음을 시사한다.
제안된 데이터 증강 및 임베딩 편향 제거 접근법은 주요 벤치마크 데이터 세트에서 거의 손실이 없거나 미미한 손실을 가져오며, 코어퍼런스의 편향 제거에 실용적 응용 가능성을 시사한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.