QUICK REVIEW

[論文レビュー] Fighting Fire with Fire: Using Antidote Data to Improve Polarization and Fairness of Recommender Systems

Bashir Rastegarpanah, Krishna P. Gummadi|arXiv (Cornell University)|Dec 2, 2018

Recommender Systems and Techniques参考文献 34被引用数 26

ひとこと要約

本稿では、アルゴリズムや既存データを変更せずに、行列分解に基づくレコメンデーションシステムにおける極端化と公平性の欠如を軽減する、新しいデータ拡張手法—「アンチドートデータ」を提案する。偏ったまたは極端化されたレコメンデーションを是正するように、合成されたユーザーレーティングを戦略的に追加することで、わずか1%の追加データで公平性および極端化の指標において最大50%の向上が達成され、システムの精度は維持される。

ABSTRACT

The increasing role of recommender systems in many aspects of society makes it essential to consider how such systems may impact social good. Various modifications to recommendation algorithms have been proposed to improve their performance for specific socially relevant measures. However, previous proposals are often not easily adapted to different measures, and they generally require the ability to modify either existing system inputs, the system's algorithm, or the system's outputs. As an alternative, in this paper we introduce the idea of improving the social desirability of recommender system outputs by adding more data to the input, an approach we view as providing `antidote' data to the system. We formalize the antidote data problem, and develop optimization-based solutions. We take as our model system the matrix factorization approach to recommendation, and we propose a set of measures to capture the polarization or fairness of recommendations. We then show how to generate antidote data for each measure, pointing out a number of computational efficiencies, and discuss the impact on overall system accuracy. Our experiments show that a modest budget for antidote data can lead to significant improvements in the polarization or fairness of recommendations.

研究の動機と目的

レコメンデーションシステムに起因する社会的被害、特に極端化やユーザに対する不平等な取り扱いに関する懸念を軽減すること。
既存のシステムアルゴリズムや入力データを変更せずに、公平性を向上させ、極端化を低減する手法を開発すること。
偏ったレコメンデーションパターンに是正効果を持つ合成「アンチドートデータ」を生成するためのフレームワークを形式化すること。
社会的望ましさの向上と全体的なシステム精度のトレードオフを評価すること。
少量の適切に選択された合成データが、公平性の向上と極端化の低減に顕著な効果をもたらすことを示すこと。

提案手法

本手法は、行列分解に基づくレコメンデーションシステムにおける極端化や不平等を是正するために、入力学習データに合成されたユーザーレーティング（「アンチドートデータ」として）を追加する。
公平性と極端化を微分可能な目的関数として定式化し、最適なアンチドートレーティングの生成を導く勾配を導出する。
個人の公平性には、ユーザーごとの損失差を用い、グループの公平性にはグループレベルの損失差を用い、極端化にはユーザー間のレーティング分散を用いる。
最適化技術を用いて、アンチドートレーティングに関して目的関数の勾配を計算し、標的的なデータインジェクションを可能にする。
2つのヒューリスティックアルゴリズムを提案：1つは勾配の符号に基づくもの、もう1つはグローバルな勾配に基づく方向性を用いて、アンチドートレーティングを最小値または最大値に設定するもの。
行列演算を活用することで、再トレーニングを再び行う必要なく、計算効率が高くスケーラブルなアプローチを実現している。

実験結果

リサーチクエスチョン

RQ1訓練済みのレコメンデーションシステムの入力に合成データを追加することで、アルゴリズムを変更せずに極端化を低減し、公平性を向上させることができるか？
RQ2行列分解モデルにおける極端化と不平等を最適に低減するように、アンチドートデータをどのように生成できるか？
RQ3社会的指標の向上と全体的なレコメンデーション精度の維持の間には、どのようなトレードオフがあるか？
RQ4公平性および極端化の指標に顕著な改善をもたらすために、どの程度の合成データが必要か？
RQ5同じフレームワークを、複数の公平性および極端化指標を同時に適用可能か？

主な発見

テストされたデータセット全体で平均して、わずか1%の追加ユーザー（アンチドートデータ）を追加しただけで、極端化指標が50%削減された。
本手法は、個人およびグループの公平性の両面で顕著な改善を達成し、感受性の高いユーザーグループにおける不平等な取り扱いの削減が明確に測定された。
アンチドートデータのアプローチは高いシステム精度を維持しており、多数の合成レーティングをインジェクションしても、最小限の精度低下にとどまった。
勾配に基づくヒューリスティックアルゴリズムは、最適なアンチドートレーティングを効果的に同定し、ベースラインのランダムまたは均一なデータインジェクション戦略を上回った。
閉形式解と行列演算を活用することで、フルリトレーニングを伴わずに、アンチドートデータの高速生成が実現された。
本フレームワークは一般化可能であり、任意の微分可能な公平性または極端化指標に適用可能であり、多様な社会的影響の目標に適応可能である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。