[論文レビュー] Fair Diffusion: Instructing Text-to-Image Generation Models on Fairness
本論文は Fair Diffusion を紹介する。展開時段階の手法で、テキストから画像へのモデルをテキスト指示によって公平性へ導き、追加データのフィルタリングや再訓練なしで、任意に調整可能な公平性概念を実現できる。
Generative AI models have recently achieved astonishing results in quality and are consequently employed in a fast-growing number of applications. However, since they are highly data-driven, relying on billion-sized datasets randomly scraped from the internet, they also suffer from degenerated and biased human behavior, as we demonstrate. In fact, they may even reinforce such biases. To not only uncover but also combat these undesired effects, we present a novel strategy, called Fair Diffusion, to attenuate biases after the deployment of generative text-to-image models. Specifically, we demonstrate shifting a bias, based on human instructions, in any direction yielding arbitrarily new proportions for, e.g., identity groups. As our empirical evaluation demonstrates, this introduced control enables instructing generative image models on fairness, with no data filtering and additional training required.
研究の動機と目的
- Stable Diffusion、LAION-5B、CLIPにおける性別と職業に関連するバイアスの特定と監査。
- データフィルタリングや再訓練を行わずに拡散モデルのバイアスを緩和する展開時戦略を提案する。
- ユーザーが指示する公平性が、生成画像において異なる公平性概念を実現できることを示す。
- デプロイ後に公平性を制御できることを示しつつ、制限と倫理的影響を明らかにする。
提案手法
- Fair Diffusion の提案。画像生成中の classifier-free guidance に公平指針項を追加する、指示ベースの公平性メカニズム。
- テキストインターフェース(ルックアップテーブルと編集式を介して)を用いて、バイアス概念を対象の指針ベクトルに対応付ける。
- classifier-free guidance を公平指針項 gamma で拡張し、出力を操作するためにそれを s_e でスケールする。
- 各属性の指針の方向を、指定された確率分布 P からランダムにサンプリングして、望ましい公平性比率を達成する。
- 生成された出力の属性比率を分類器で測定して、ユーザー定義の公平性目標との整合性を確認することで公平性を評価する。
- 編集機構として Semantic Guidance (Sega) を用いた適用性を実証し、複数の職業と性別属性を分析する。

実験結果
リサーチクエスチョン
- RQ1展開時のテキスト指示は、再訓練やデータフィルタリングなしで、拡散モデルの出力を定義された公平性概念へ向けて誘導できるか。
- RQ2LAION-5B、CLIP、および Stable Diffusion の出力に存在する性別-職業バイアスに対する Fair Diffusion の影響は何か。
- RQ3職業や人口統計にわたって、Fair Diffusion は異なる公平性概念(例:結果の公平性)を実現する柔軟性がどれくらいあるか。
主な発見
- LAION-5B と CLIP は、性別-職業バイアスおよび交差的バイアスを示し、それが下流の拡散モデルに影響を与える。
- Stable Diffusion の出力は、いくつかの職業において LAION-5B と相対的に同一または拡大された性別バイアスを示しており、バイアスが構成要素全体に存在することを示している。
- Fair Diffusion は、検討された職業に対して、入力プロンプトやデータを変更せずに、統計的平等という公正な境界へ生成出力をシフトし、バイアスを緩和できる。
- Fair Diffusion の効果は、ベースラインの SD 出力でバイアスが拡大・反映・緩和される職業間で堅牢である。
- Fairness achieved by Fair Diffusion aligns with Def. 1 (statistical parity) on model outcomes, though some variance remains due to non-binary gender considerations and data/encoding limitations.

より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。