QUICK REVIEW

[論文レビュー] Managing Popularity Bias in Recommender Systems with Personalized Re-ranking

Himan Abdollahpouri, Robin Burke|arXiv (Cornell University)|Jan 22, 2019

Recommender Systems and Techniques参考文献 22被引用数 83

ひとこと要約

本論文は xQuAD 型の多様化を個別化された再ランキングフレームワークに適用し、任意の推薦システムの出力後にロングテールアイテムを推進することで人気バイアスを低減する。Binary と Smooth の2つの変種を、正則化ベースラインと比較する。

ABSTRACT

Many recommender systems suffer from popularity bias: popular items are recommended frequently while less popular, niche products, are recommended rarely or not at all. However, recommending the ignored products in the `long tail' is critical for businesses as they are less likely to be discovered. In this paper, we introduce a personalized diversification re-ranking approach to increase the representation of less popular items in recommendations while maintaining acceptable recommendation accuracy. Our approach is a post-processing step that can be applied to the output of any recommender system. We show that our approach is capable of managing popularity bias more effectively, compared with an existing method based on regularization. We also examine both new and existing metrics to measure the coverage of long-tail items in the recommendation.

研究の動機と目的

人気バイアスの問題と推奨システムにおけるロングテールアイテム表現の重要性を動機づける。
既存の推薦リストを調整してロングテールのカバレッジを向上させつつ精度を保つポスト処理再ランキング手法を提案する。
個人のロングテールアイテムへの関心に応じてロングテール促進を重み付けすることによりパーソナライズを実現する。
データセット間で正則化ベースラインと再ランキング手法を比較し、ロングテールのカバレッジとランキング品質を評価する。

提案手法

xQuAD の結果多様化フレームワークを、推奨出力の人気バイアスを制御するために適用する。
基礎予測関連性と短頭/長尾カテゴリ（Gamma と Gamma′）間の個別化された多様化項を組み合わせた再ランキングスコアを定式化する。
多様化項を推定する2つの変種を導入する：Binary xQuAD（カテゴリカバレッジ指標）と Smooth xQuAD（比率ベースのカバレッジ）。
方程式4を用いて、基礎推奨結果から P(v|u) を、短頭対長尾に対するユーザー嗜好 P(d|u) を推定し、正確性と多様性のバランスを取る。
初期のランキングリスト R から最終的な希望長さのリスト S を生成するために、バイアス-精度のトレードオフを制御するラムダを設定し、再ランキングを反復的に適用する。
ロングテールのカバレッジ指標（APLT、ACLT）と精度指標（NDCG）、露出のための ARP を用いて評価する。
使用するデータセットは MovieLens 1M と Epinions で、アイテムを評価分布に基づいて短頭と長尾に分割する（上位約80% 対下位約20%）。

実験結果

リサーチクエスチョン

RQ1個人化された再ランキングは推薦精度を維持しつつ人気バイアスを低減できるか？
RQ2Binary xQuAD および Smooth xQuAD の変種は、長尾カバレッジとランク品質の点で正則化された長尾多様化ベースラインと比較してどうか？
RQ3データセットの疎さ（MovieLens vs. Epinions）が長尾促進と多様性-精度のトレードオフに与える影響は？
RQ4ARP のみで長尾促進を評価するのが適切か、それとも APLT や ACLT などの追加指標と併用すべきか？
RQ5推奨システムのマルチステークホルダー設定に本手法を拡張できるか？

主な発見

再ランキング手法は正則化ベースラインと比較して長尾露出を改善し、Smooth xQuAD はしばしばより強い長尾カバレッジを提供する。
Binary xQuAD はリストを最小限に調整する傾向があり、Smooth xQuAD は長尾アイテムの増加とランキング品質の維持のバランスをとる。
LT-Reg は評価された指標（APLT および ACLT）全般で長尾アイテムの促進において効果が低い。
両データセットとも、ARP のみでは長尾の多様性を完全には捉えられず、効果を評価するには APLT および ACLT と併用すべきである。
本手法は再ランキングにより DCG の損失を限定的に抑えつつ長尾表現を改善できることを示しており、ダイバーシティ-精度のトレードオフが好ましいことを示す。
結果は Epinions（より疎）データセットが MovieLens より長尾多様化に対して挑戦を示し、Binary と Smooth の変種で相対的な性能が異なることを示唆している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。