Skip to main content
QUICK REVIEW

[论文解读] The Unfairness of Popularity Bias in Recommendation

Himan Abdollahpouri, Masoud Mansoury|arXiv (Cornell University)|Jul 31, 2019
Recommender Systems and Techniques参考文献 19被引用 111
一句话总结

本文从用户角度考察流行度偏见,按对流行项的兴趣定义用户群体,并表明许多算法过度依赖流行项,尤其损害小众用户。

ABSTRACT

Recommender systems are known to suffer from the popularity bias problem: popular (i.e. frequently rated) items get a lot of exposure while less popular ones are under-represented in the recommendations. Research in this area has been mainly focusing on finding ways to tackle this issue by increasing the number of recommended long-tail items or otherwise the overall catalog coverage. In this paper, however, we look at this problem from the users' perspective: we want to see how popularity bias causes the recommendations to deviate from what the user expects to get from the recommender system. We define three different groups of users according to their interest in popular items (Niche, Diverse and Blockbuster-focused) and show the impact of popularity bias on the users in each group. Our experimental results on a movie dataset show that in many recommendation algorithms the recommendations the users get are extremely concentrated on popular items even if a user is interested in long-tail and non-popular items showing an extreme bias disparity.

研究动机与目标

  • 评估数据和算法中的流行度偏见如何导致推荐与用户期望的偏离。
  • 识别对流行项兴趣不同的用户群体。
  • 评估各种推荐算法对这些群体传播流行度偏见的方式。
  • 突出哪些算法能更好地保持流行项与非流行项的预期比例。

提出的方法

  • 使用 MovieLens 1M 数据集,通过评分中流行项的比例来分析用户画像。
  • 基于流行项比例定义三类用户群体:小众(N)、多样化(D)和以大片为主(B)。
  • 在相近准确率的前提下比较多种算法(User KNN、Item KNN、SVD++、Biased Matrix Factorization,以及 Most Popular 和 Random)。
  • 衡量推荐中的流行项比例与用户画像中的比例之比。
  • 引入 GAP(Group Average Popularity)和 ΔGAP 作为度量项流行度曝光变化的指标。

实验结果

研究问题

  • RQ1RQ1:不同个体或用户群体对流行项的兴趣有多大?
  • RQ2RQ2:算法的流行度偏见如何影响对流行项兴趣程度不同的用户?

主要发现

  • 在测试的算法中,流行度偏见普遍存在,导致的推荐比用户画像所示更偏向流行项。
  • 小众用户在推荐中对流行项的期望比实际比例之间存在最大差异。
  • SVD++ 相对于某些其他算法在与用户期望的流行度比例对齐方面表现更好。
  • Most Popular 和 Item KNN 会在项流行度与推荐之间引发更强的相关性,从而放大偏见。
  • Group Average Popularity(GAP)和 ΔGAP 指标显示在所有算法中,小众用户的偏见尤为显著。
  • 总体而言,对流行项兴趣较低的用户在所研究的推荐算法中受到的服务不足的比例更高。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。