[论文解读] Improved Recurrent Neural Networks for Session-based Recommendations
本论文通过引入序列预处理和嵌入丢弃的数据增强方法,解决用户行为的时间偏移问题,并提出一种直接预测项目嵌入的新模型,从而改进基于循环神经网络(RNN)的会话推荐。该方法在召回率@20和MRR@20上分别实现了12.8%和14.8%的相对提升,同时减少了推理时间和模型大小,有利于实时部署。
Recurrent neural networks (RNNs) were recently proposed for the session-based recommendation task. The models showed promising improvements over traditional recommendation approaches. In this work, we further study RNN-based models for session-based recommendations. We propose the application of two techniques to improve model performance, namely, data augmentation, and a method to account for shifts in the input data distribution. We also empirically study the use of generalised distillation, and a novel alternative model that directly predicts item embeddings. Experiments on the RecSys Challenge 2015 dataset demonstrate relative improvements of 12.8% and 14.8% over previously reported results on the Recall@20 and Mean Reciprocal Rank@20 metrics respectively.
研究动机与目标
- 提升基于RNN的会话推荐模型性能,超越现有基线方法。
- 通过在更近期的训练数据子集中微调模型,应对用户行为随时间带来的数据分布偏移。
- 通过直接预测项目嵌入而非使用分类层,减少推理时间和内存占用,以支持实时部署。
- 评估利用特权信息进行蒸馏在小数据集上的有效性。
- 研究嵌入丢弃和序列预处理等数据增强技术对模型泛化能力的影响。
提出的方法
- 通过序列预处理和嵌入丢弃对训练数据进行增强,以减少过拟合。
- 在更近期的数据子集上重新训练模型,以应对用户行为的时间偏移。
- 使用来自在后续序列上训练的教师模型生成的软标签进行知识蒸馏,以提升学生模型性能。
- 提出一种新型RNN架构,直接预测项目嵌入,随后通过余弦相似度层进行打分。
- 使用GRU层(隐藏单元数为100或1000)进行模型训练,并采用基于排序的损失函数。
- 使用Keras和Theano进行实现,并在RecSys Challenge 2015数据集上进行模型评估。
实验结果
研究问题
- RQ1通过序列预处理和嵌入丢弃进行数据增强,能否提升基于RNN的会话推荐性能?
- RQ2在存在用户行为时间偏移的情况下,基于近期数据子集的再训练如何影响模型性能?
- RQ3利用未来序列的特权信息进行知识蒸馏,能否带来性能增益,尤其是在小数据集上?
- RQ4与使用Softmax输出层相比,直接预测项目嵌入是否能减少推理时间与模型大小而不损失准确性?
- RQ5在所提出的基于嵌入的RNN模型中,预测准确率与推理效率之间存在何种权衡?
主要发现
- 所提出的增强策略使召回率@20相对提升了12.8%,MRR@20相对提升了14.8%,优于以往基于RNN的结果。
- 在更近期数据子集上重新训练可提升性能,表明用户行为随时间发生变化,必须加以建模。
- 利用特权信息的知识蒸馏在小数据集上带来了适度的性能增益,验证了其在低数据场景下的有效性。
- 直接预测项目嵌入的模型(M4)相比基于分类的模型,批量预测时间减少了约60%,模型大小减少了60%以上。
- 将GRU隐藏单元数从100增加到1000并未显著提升性能,表明在达到一定容量后收益递减。
- M4模型在召回率@20上达到0.6676,MRR@20为0.2847,优于基线RNN模型,但相比M1和M2表现较差,表明在使用更优嵌入后仍有改进空间。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。