QUICK REVIEW

[论文解读] Session-based Recommendations with Recurrent Neural Networks

Balázs Hidasi, Alexandros Karatzoglou|arXiv (Cornell University)|Nov 21, 2015

Recommender Systems and Techniques参考文献 15被引用 557

一句话总结

本文提出一种基于GRU的循环神经网络，用于会话级推荐，通过建模用户行为序列，提升传统物品-物品方法的推荐准确率。通过使用排名损失函数和会话并行小批量训练，该模型在真实世界数据集上的MRR@20指标相比最佳基线最高提升31.49%。

ABSTRACT

We apply recurrent neural networks (RNN) on a new domain, namely recommender systems. Real-life recommender systems often face the problem of having to base recommendations only on short session-based data (e.g. a small sportsware website) instead of long user histories (as in the case of Netflix). In this situation the frequently praised matrix factorization approaches are not accurate. This problem is usually overcome in practice by resorting to item-to-item recommendations, i.e. recommending similar items. We argue that by modeling the whole session, more accurate recommendations can be provided. We therefore propose an RNN-based approach for session-based recommendations. Our approach also considers practical aspects of the task and introduces several modifications to classic RNNs such as a ranking loss function that make it more viable for this specific problem. Experimental results on two data-sets show marked improvements over widely used approaches.

研究动机与目标

解决在电子商务和媒体网站中常见但缺乏长期用户画像时的会话级推荐挑战。
克服矩阵分解和物品-物品相似度方法忽略序列行为和历史点击的局限性。
开发一种针对稀疏、短时会话设计的深度学习方法，兼顾高可扩展性与实际部署需求。
通过使用RNN建模用户交互的完整序列，并采用定制化训练目标，提升推荐准确率。

提出的方法

将门控循环单元（GRUs）适配于会话级推荐任务中，以建模用户交互的序列行为。
引入会话并行小批量训练机制，高效处理长序列的短时用户会话。
采用基于小批量的输出采样策略，降低在大规模物品集合下的训练计算成本。
使用基于排名的损失函数（TOP1、BPR或交叉熵）以优化Top-N推荐性能。
对物品采用1-of-N编码，并在输出层使用tanh激活函数，以稳定训练过程并提升排序质量。
在两个真实世界数据集（RSC15和VIDEO）上，使用召回率@20和均 reciprocical rank（MRR）@20评估模型性能。

实验结果

研究问题

RQ1当缺乏用户画像时，循环神经网络能否有效建模会话级用户行为？
RQ2基于RNN的方法与传统物品-物品相似度基线在会话级推荐中的表现相比如何？
RQ3哪种损失函数（基于排名 vs. 交叉熵）在会话级推荐中表现更优且更稳定？
RQ4网络深度、GRU单元数及激活函数等架构选择如何影响模型性能？
RQ5输入表示方式（1-of-N vs. 嵌入向量）和序列建模策略对推荐准确率有何影响？

主要发现

基于GRU的模型采用TOP1排名损失，在RSC15数据集上的MRR@20相比最佳基线（物品-KNN）提升了31.49%。
在VIDEO数据集上，TOP1损失模型在Recall@20上提升20.27%，在MRR@20上提升15.08%。
将GRU单元数从100增加到1000时，配对损失（TOP1和BPR）的性能有所提升，但交叉熵损失在1000单位时出现数值不稳定性。
增加深层网络或在GRU后添加额外全连接层并未提升性能，表明单层GRU已足够满足会话建模需求。
1-of-N编码优于学习得到的物品嵌入向量，且建模完整点击序列的效果优于仅使用最后一次点击。
模型在GPU上数小时内即可高效训练完成，使动态推荐系统中频繁重训练成为可能。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。