[論文レビュー] Blind Justice: Fairness with Encrypted Sensitive Attributes
本論文は、機械学習における公平性を保証しつつ、機密属性(例:人種、性別)を露呈させない安全なマルチパーティ計算(MPC)ベースのフレームワークを提案する。暗号化された機密特徴量を用い、固定小数点演算を用いたラグランジュ緩和法を適用することで、プライバシーを保持したまま公平性の証明、公平なモデルの学習、出力の検証を可能にし、ユーザー、モデラー、監査機関のすべてに対して暗号的プライバシーを確保する。
Recent work has explored how to train machine learning models which do not discriminate against any subgroup of the population as determined by sensitive attributes such as gender or race. To avoid disparate treatment, sensitive attributes should not be considered. On the other hand, in order to avoid disparate impact, sensitive attributes must be examined, e.g., in order to learn a fair model, or to check if a given model is fair. We introduce methods from secure multi-party computation which allow us to avoid both. By encrypting sensitive attributes, we show how an outcome-based fair model may be learned, checked, or have its outputs verified and held to account, without users revealing their sensitive attributes.
研究の動機と目的
- 機械学習における公平性の強制と、ユーザーの機密属性(例:人種、性別)の漏洩を防ぐことの間にある緊張を解消する。
- GDPRの制限など、法的・倫理的・プライバシー上の障壁を乗り越え、機密データを露呈させずに公平性のチェックを可能にする。
- 機密属性やモデルパラメータを露呈させることなく、監査可能な公平性の証明、モデルの学習、出力の検証を可能にする。
- 監査機関が、生の機密データやモデラーのアルゴリズムにアクセスせずに公平性の適合性を検証できるようにする。
- 暗号的オーバーヘッドを伴いながらも、実世界のデータセットで精度と効率を維持する実用的なMPCベースのシステムを開発する。
提案手法
- 機密属性を暗号化した状態で計算可能にするために、安全なマルチパーティ計算(MPC)を用い、参加者(監査機関を含む)が平文の値にアクセスできないようにする。
- 公平性の概念(例:p%-ルール、等しい機会)に必要な線形制約をサポートするためにMPCプロトコルを拡張し、最適化にラグランジュ緩和法を適用する。
- 事前計算された乗算トリプルを用いて固定小数点演算を実装し、MPCにおける計算オーバーヘッドを低減し、オーバーフロー/アンダーフローを防ぐ。
- 非線形関数(例:ロジスティック関数)に対しては、区分的線形近似を適用することで、精度とMPC制約への適合性を維持する。
- 勾配更新ごとに公平性制約が満たされているかをチェックすることで、訓練ループに公平性証明を統合する。
- ユーザーが検証可能なモデルを用いてモデル出力を挑戦できるようにし、デプロイされたモデルが訓練済みの公平なモデルと一致することを保証する。
実験結果
リサーチクエスチョン
- RQ1機械学習における公平性を、モデラーおよび監査機関を含め、誰に対しても機密属性を露呈させずに強制・検証することは可能か?
- RQ2MPCをどのように拡張すれば、p%-ルールや等しい機会などの公平性制約をサポートできるか?
- RQ3実世界のデータセットにおける公平なモデル学習および証明にMPCを用いる際の計算コストと精度のトレードオフはどのようになるか?
- RQ4複数の機密属性を含む状況でも、暗号化された機密属性を用いて、公平かつ正確なモデルを学習できるか?
- RQ5モデルや機密データを露呈させずに、デプロイされたモデルが事前に証明された公平なモデルと一致していることを検証するのは可能か?
主な発見
- 固定小数点演算と区分的線形近似を用いたラグランジュ乗数法は、6つのデータセットでベースラインのSLSQP法と比較して、精度の低下が4%未満に抑えられ、高い公平性の強制を達成した。
- 公平性証明とモデル検証は計算的に効率的であり、MPC環境下でも1回のチェックあたり1秒未塔であった。
- ラップトップで学習を実行した場合、非MPC学習に比べて数個のオーダー長くなるが、乗算トリプルの事前計算により実用的であった。
- 特に合成データおよびBankデータセットにおいて、公平性制約を強化するにつれて、機密グループ間(例:z=0 対 z=1)の結果レートがバランスされた。
- Bankデータセットでは、勾配法の投影が信頼性に欠けたが、ラグランジュ法は全データセットで一貫した性能を示し、最も頑健であった。
- COMPASデータセットでは、複数の機密属性が存在したため公平性制約が早期に活性化したが、依然として最小限の精度損失でバランスの取れた結果を達成した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。