Skip to main content
QUICK REVIEW

[论文解读] NISER: Normalized Item and Session Representations to Handle Popularity Bias

Priyanka Gupta, D. Garg|arXiv (Cornell University)|Sep 10, 2019
Speech Recognition and Synthesis参考文献 13被引用 28
一句话总结

本文提出 NISER,一种会话推荐模型,通过将物品和会话图嵌入归一化至单位超球面,缓解图神经网络(GNN)系统中的流行度偏差。通过优化余弦相似度而非内积,NISER 显著提升了长尾及新引入物品的推荐性能,在三个基准数据集上取得最先进结果,同时降低了对热门物品的偏好。

ABSTRACT

The goal of session-based recommendation (SR) models is to utilize the information from past actions (e.g. item/product clicks) in a session to recommend items that a user is likely to click next. Recently it has been shown that the sequence of item interactions in a session can be modeled as graph-structured data to better account for complex item transitions. Graph neural networks (GNNs) can learn useful representations for such session-graphs, and have been shown to improve over sequential models such as recurrent neural networks [14]. However, we note that these GNN-based recommendation models suffer from popularity bias: the models are biased towards recommending popular items, and fail to recommend relevant long-tail items (less popular or less frequent items). Therefore, these models perform poorly for the less popular new items arriving daily in a practical online setting. We demonstrate that this issue is, in part, related to the magnitude or norm of the learned item and session-graph representations (embedding vectors). We propose a training procedure that mitigates this issue by using normalized representations. The models using normalized item and session-graph representations perform significantly better: i. for the less popular long-tail items in the offline setting, and ii. for the less popular newly introduced items in the online setting. Furthermore, our approach significantly improves upon existing state-of-the-art on three benchmark datasets.

研究动机与目标

  • 解决 GNN 基于的会话推荐模型中的流行度偏差问题,即由于物品频率分布倾斜,导致热门物品被过度代表。
  • 探究对物品和会话图嵌入的 L2 范数进行归一化是否能减少偏差并提升长尾和新引入物品的性能。
  • 开发一种训练过程,使表示在训练和推理阶段均被约束在单位超球面上,以增强公平性和泛化能力。
  • 证明归一化表示在离线和在线推荐设置中的有效性,尤其针对低频和新物品。
  • 通过改进现有 GNN 基于模型(如 SR-GNN)实现会话推荐的新最先进水平。

提出的方法

  • 提出 NISER 模型,将物品和会话图嵌入的 L2 范数归一化为单位长度,强制表示位于单位超球面上。
  • 在训练目标中用余弦相似度替代标准内积损失,以减少嵌入范数差异带来的偏差。
  • 将位置嵌入整合进 GNN 架构中,以在保持基于图的消息传递的同时保留序列顺序信息。
  • 对物品嵌入应用 Dropout 以提升泛化能力并减少过拟合,尤其在新物品数据量较少的情况下。
  • 使用对比学习目标进行模型训练,鼓励会话图表示与下一次点击物品的表示对齐。
  • 采用两阶段训练流程:首先在归一化 L2 约束下预训练嵌入,然后使用包含位置嵌入和 Dropout 组件的完整损失函数进行微调。

实验结果

研究问题

  • RQ1对物品和会话图嵌入的 L2 范数进行归一化,是否能减少 GNN 基于会话推荐模型中的流行度偏差?
  • RQ2归一化表示能否提升在线设置下不受欢迎和新引入物品的推荐性能?
  • RQ3归一化、位置嵌入和 Dropout 的组合如何影响模型的整体性能和鲁棒性?
  • RQ4NISER 在离线和在线评估设置下,相较于现有最先进模型,其性能提升程度如何?
  • RQ5在多分类设置中,嵌入归一化是否能有效缓解由 Softmax 损失引入的径向偏差?

主要发现

  • 对于目标为极低频物品(ϕ* = 0.01)的会话,NISER+ 在 Recall@20 和 MRR@20 上分别实现 13% 至 28% 的相对提升,当 ϕ* = 0.001 时,提升最高分别达 26% 和 34%。
  • 对于新引入的长尾物品,NISER+ 在发布当天的表现优于 GNN+,表明其在训练数据有限的情况下仍能有效推荐新物品。
  • NISER+ 在各天均保持一致性能,即使随时间推移流行度偏差加剧,而 GNN+ 显著下降,尤其在 YC 数据集上表现更差。
  • 消融实验表明,嵌入的 L2 归一化是最关键的组件,其贡献超过位置嵌入或 Dropout,且在所有数据集上均表现突出。
  • NISER+ 在三个基准数据集(DN、RR、YC)上达到新的最先进性能,无论在 Recall@20 还是 MRR@20 上均优于 GNN+,且在所有设置下表现更优。
  • 模型显著降低了 ARP(按流行度划分的平均召回率),表明对流行度偏差的缓解效果明显,尤其对低频物品。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。