[論文レビュー] Examining Gender and Race Bias in Two Hundred Sentiment Analysis Systems
本稿では、感情分析システムにおける性別および人種のバイアスを検出することを目的とした、8,640文の英語文から構成されるベンチマークデータセット「Equity Evaluation Corpus (EEC)」を紹介する。EECを用いて、SemEval-2018タスク1の219のシステムを評価した結果、75%以上のシステムが統計的に有意なバイアスを示しており、特定の性別または人種を含む文に対して一貫して高い感情強度が割り当てられており、そのバイアスの大きさは最大で34%に達した。
Automatic machine learning systems can inadvertently accentuate and perpetuate inappropriate human biases. Past work on examining inappropriate biases has largely focused on just individual systems. Further, there is no benchmark dataset for examining inappropriate biases in systems. Here for the first time, we present the Equity Evaluation Corpus (EEC), which consists of 8,640 English sentences carefully chosen to tease out biases towards certain races and genders. We use the dataset to examine 219 automatic sentiment analysis systems that took part in a recent shared task, SemEval-2018 Task 1 'Affect in Tweets'. We find that several of the systems show statistically significant bias; that is, they consistently provide slightly higher sentiment intensity predictions for one race or one gender. We make the EEC freely available.
研究の動機と目的
- 自動感情分析システムにおける性別および人種バイアスを特定・測定すること。
- NLPシステムにおける公平性を評価するための標準化されたベンチマークデータセットの開発。
- テキストに言及される個人の性別または人種に基づいて、感情強度予測が系統的に変化するかどうかを検討すること。
- 怒り、恐怖、価値感などの感情次元が、このようなバイアスにどの程度影響を受けるかを評価すること。
- 開発者や研究者が感情分析システムの公平性を監査および改善できるように、公開可能なリソースを提供すること。
提案手法
- Equity Evaluation Corpus (EEC) は、性別または人種を示す単語を除き、他の点で同一の8,640文のペアを慎重に構築することで作成された。
- EECは、2018年SemEvalタスク1の補助的テストセットとして使用され、ツイートの感情および感情強度を評価した。
- システムは、性別または人種のみが異なる文のペアに対する予測された感情強度スコアの比較によって評価された。
- 統計的有意性の検定を実施し、複数の文ペアにわたり、特定の性別または人種に有利な一貫したスコア差を検出した。
- 単語のバイナリ特徴量(unigrams)のみで学習したベースラインSVMシステムを評価し、トレーニングデータ由来のバイアスを隔離した。
- 怒り、恐怖、悲しみ、価値感強度などの異なる感情次元におけるバイアスの比較分析を実施した。
実験結果
リサーチクエスチョン
- RQ1文の唯一の差が言及される人物の性別である場合、感情分析システムは感情強度予測において統計的に有意なバイアスを示すか?
- RQ2文の唯一の差が人種(特にヨーロッパ系アメリカ人とアフリカ系アメリカ人の名前)である場合、システムは同様のバイアスを示すか?
- RQ3怒り、恐怖、悲しみ、価値感などの異なる感情強度次元において、バイアスの大きさと方向性はどのように変化するか?
- RQ4事前学習済み単語埋め込みや外部の辞書を利用しないシステムにおいて、バイアスはどの程度存在するか。これはデータレベルのバイアスを示唆する。
- RQ5同じシステムが、予測する感情次元によって異なるバイアスパターンを示すことがあるか?
主な発見
- 評価された219の感情分析システムの75%以上が、性別または人種に基づく感情強度予測において統計的に有意なバイアスを示した。
- 平均的なバイアスの大きさは、0から1のスコア範囲の0.03未満(3%未満)であったが、一部のシステムでは最大0.34(34%)のバイアスが観察された。
- 人種に基づくバイアスが性別に基づくバイアスよりも顕著であり、システムはヨーロピアンアメリカンの名前を含む文に対して一貫して高い感情強度を割り当てていた。
- 単語のバイナリ特徴量のみで学習したシンプルなベースラインSVMシステムですら、わずかではあるが有意なバイアスを示しており、バイアスがトレーニングデータに由来していることを示している。
- バイアスの方向性は感情次元によって異なり、たとえば男性を言及する文は怒りや恐怖のスコアが高くなる傾向があり、一部のケースでは女性を言及する文が価値感(valence)のスコアで高い評価を受けていた。
- EECで顕著なバイアスを示さないシステムは、通常のSemEval-2018テストセットでは成績が悪くなる傾向にあり、公平性と精度の間には妥当なトレードオフの可能性があると考えられる。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。