QUICK REVIEW

[論文レビュー] Towards Fairer Datasets: Filtering and Balancing the Distribution of the People Subtree in the ImageNet Hierarchy

Kaiyu Yang, Klint Qinami|arXiv (Cornell University)|Dec 16, 2019

Misinformation and Its Impacts参考文献 73被引用数 24

ひとこと要約

この論文は、ImageNetの人物サブツリーにおけるバイアスの3つの根本的要因を特定し、それに対処する。すなわち、動かないWordNetの概念、視覚的でないシネット、および人種的・性的・年齢的グループごとの画像表現の不均衡である。著者らは、攻撃的でない・視覚化可能なシネットをフィルタリングし、クラウドソーシングによる視覚化可能性と人種的属性のアノテーションを通じて残りの分布をバランスさせる。これにより、下流のビジョンモデル向けに、より公平で代表的なImageNetのサブセットが作成された。

ABSTRACT

Computer vision technology is being used by many but remains representative of only a few. People have reported misbehavior of computer vision models, including offensive prediction results and lower performance for underrepresented groups. Current computer vision models are typically developed using datasets consisting of manually annotated images or videos; the data and label distributions in these datasets are critical to the models' behavior. In this paper, we examine ImageNet, a large-scale ontology of images that has spurred the development of many modern computer vision methods. We consider three key factors within the "person" subtree of ImageNet that may lead to problematic behavior in downstream computer vision technology: (1) the stagnant concept vocabulary of WordNet, (2) the attempt at exhaustive illustration of all categories with images, and (3) the inequality of representation in the images within concepts. We seek to illuminate the root causes of these concerns and take the first steps to mitigate them constructively.

研究の動機と目的

実世界の応用において不平等なモデル行動を引き起こす可能性のある、ImageNetの人物サブツリーにおけるシステム的バイアスを調査すること。
バイアスの3つの根本的要因を分析すること：動かないWordNetの概念語彙、視覚的でないシネット、および保護属性（人種、性別、年齢）ごとの画像表現の不均衡。
建設的でデータドリブンなアプローチを提案し、人物サブツリーをフィルタリング・バランスさせる。これにより、公平性と代表性を向上させること。
今後の研究に役立てるために、公開可能でキュレーション済みのImageNetサブセット（人種的・視覚化可能性アノテーションを改善済み）を提供すること。

提案手法

クラウドソーシングのノイズを避けるために、シンプルなインターフェースを用いた社内アノテーションにより、1,593のシネットを攻撃的と分類し、1,239を安全と分類した。
視覚化可能性スコアを推定するために動的レーティングアルゴリズムを採用：直前のレーティングの平均 ± 標準偏差の範囲内に3回連続で新しいレーティングが収まるまでレーティングを収集する。
ゴールドスタンダードの質問（視覚化可能：5つ、非視覚化可能：1つ）に対して、ルート・マンスリー二乗誤差（RMSE）が2.0以上である作業者を除外することで品質管理を実施した。
1つのシネットごとに複数の作業者レーティングを平均化して安定した視覚化可能性スコアを算出し、曖昧な概念に対してはアルゴリズムがより多くのレーティングを収集することで、曖昧さに適応した。
視覚化可能性アノテーションとは別に、人種、性別、年齢のアノテーションを専用インターフェースを用いたクラウドソーシングで収集し、表現の不均衡を評価した。
攻撃的でない・視覚化不可能なシネットをフィルタリングし、多様性と代表性の高い画像分布を優先することで、残りのデータセットをバランスさせた。

実験結果

リサーチクエスチョン

RQ1動かないWordNetの概念と視覚的でないシネットは、ImageNetの人物サブツリーにおけるバイアスにどのように寄与しているか？
RQ2人種、性別、年齢などの保護属性ごとに、人物サブツリーにおける画像表現はどの程度不均衡であるか？
RQ3体系的でフィルタリングとバランス調整のプロセスは、大規模ビジョンデータセットにおける公平性と代表性を向上させることができるか？
RQ4視覚化可能性と攻撃性アノテーションの品質とデータセットサブセットの利用可能性に、どのような影響を与えるか？
RQ5動的で適応的なレーティング収集は、視覚化可能性のような主観的アノテーションの信頼性をどのように向上させるか？

主な発見

著者らは、人物サブツリーにおいて1,593の攻撃的シネットと1,239の安全で視覚化可能なシネットを同定し、より公平なデータセットの基礎を築いた。
視覚化可能性の平均レーティング数は1つのシネットあたり8.8であり、72%のシネットが10レーティング以内で収束したため、動的アルゴリズムの収束が効率的であることが示された。
品質管理メカニズムにより、高誤差作業者（RMSE ≥ 2.0）が効果的に除外され、視覚化可能性アノテーションの信頼性が向上した。
最終的なデータセットには、キュレーション済みでバランスの取れたImageNetの人物サブツリーのサブセットが含まれており、人種的・視覚化可能性アノテーションが改善されている。
本研究では、大規模データセットにおけるバイアスが、データの不均衡だけでなく、オントロジー自体の概念的・語彙的制限にも起因することを示した。
提案手法により、体系的かつスケーラブルなデータセットキュレーションのアプローチが可能となり、他のビジョンデータセットに対しても公平性と代表性の向上に応用可能であることが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。