Skip to main content
QUICK REVIEW

[論文レビュー] Guarantees for Spectral Clustering with Fairness Constraints

Matthäus Kleindeßner, Samira Samadi|arXiv (Cornell University)|Jan 24, 2019
Human Mobility and Location-Based Analysis被引用数 43
ひとこと要約

本論文は Chierichetti et al.’s fairness notion をスペクトラルクラスタリング(非正規化および正規化)に統合し、アルゴリズムを提供し、確率ブロックモデルの変種に対する回復保証を証明し、さらに実データでのエビデンスを提示します。

ABSTRACT

Given the widespread popularity of spectral clustering (SC) for partitioning graph data, we study a version of constrained SC in which we try to incorporate the fairness notion proposed by Chierichetti et al. (2017). According to this notion, a clustering is fair if every demographic group is approximately proportionally represented in each cluster. To this end, we develop variants of both normalized and unnormalized constrained SC and show that they help find fairer clusterings on both synthetic and real data. We also provide a rigorous theoretical analysis of our algorithms on a natural variant of the stochastic block model, where $h$ groups have strong inter-group connectivity, but also exhibit a "natural" clustering structure which is fair. We prove that our algorithms can recover this fair clustering with high probability.

研究の動機と目的

  • データの元のデモグラフィックグループ割合を各クラスに反映させるよう、スペクトラルクラスタリングに公平性制約を組み込む。
  • 非正規化スペクトラルクラスタリングと公平性制約付き正規化スペクトラルクラスタリングの両方のアルゴリズムを提供する。
  • 確率ブロックモデルの変種において公正なクラスタリングを回復する理論的保証を示す。
  • 合成データと実データに対して提案する公平SC法を標準SCと比較して評価する。

提案手法

  • クラスタリングエンコードマトリクス H に対する線形公平性制約を加える形でスペクトラルクラスタリングを拡張する。
  • 公平性を F^T H = 0 として定式化し、H^T H = I_k への緩和を行い、射影ラプラシアンの固有分解を通じて解く。
  • 公平性制約付き非正規化SCのアルゴリズム2と、公平性制約付き正規化SCのアルゴリズム3(およびそれらをノルム空間射影によって実装する方法の議論)を提供する。
  • 公正な真のクラスタリングをモデル化するための確率ブロックモデルの変種を用い、回復保証を分析する。
  • 得られた埋め込みの行に対して k-means を適用してクラスタリングを回復する。

実験結果

リサーチクエスチョン

  • RQ1デモグラフィックグループ表現に基づく公平性制約を、クラスタリング品質を過度に犠牲にすることなくスペクトラルクラスタリングに組み込むことは可能か。
  • RQ2公平なスペクトラルクラスタリングの変種は、強いグループ間接続と公正な構造の両方を体現する確率ブロックモデルで、公正な真のクラスタリングを回復するか。
  • RQ3非正規化と正規化の公平スペクトラルクラスタリングの計算的・理論的トレードオフは何か。
  • RQ4実データ上で公平SC法は標準SCと比較してどのように機能するか。

主な発見

  • 公平性制約は埋め込みマトリクス H に対する線形制約を通じて SC に組み込むことができる。
  • 公正な定式化は、射影ラプラシアン上の固有値問題へと緩和され、その後埋め込みの行に対して k-means を適用することになる。
  • 著者らは、真のクラスタリングが公正である確率ブロックモデルの変種の下で、公正なクラスタリングに対する回復保証を証明する。
  • 実験では、公正SC法は標準SCよりも公正なクラスタリングを達成しつつ、目的値はしばしば標準SCに近い。
  • アルゴリズム3(公平性付き正規化SC)は、通常アルゴリズム2(公平性付き非正規化SC)よりも、誤差ゼロに必要な n が小さく、実証的にもロバスト性が高いという点で優位である。
  • 実ネットワークでは、公平性制約はバランスギャップを低減し、RatioCut/NCut 値を維持する傾向がある。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。