QUICK REVIEW

[论文解读] Meta-Prod2Vec - Product Embeddings Using Side-Information for Recommendation

Flavian Vasile, Elena Smirnova|arXiv (Cornell University)|Jul 25, 2016

Music and Audio Processing参考文献 30被引用 118

一句话总结

Meta-Prod2Vec 通过将项目元数据作为训练端信息来学习更好的项目嵌入用于推荐，尤其在冷启动情形下提升性能。

ABSTRACT

We propose Meta-Prod2vec, a novel method to compute item similarities for recommendation that leverages existing item metadata. Such scenarios are frequently encountered in applications such as content recommendation, ad targeting and web search. Our method leverages past user interactions with items and their attributes to compute low-dimensional embeddings of items. Specifically, the item metadata is in- jected into the model as side information to regularize the item embeddings. We show that the new item representa- tions lead to better performance on recommendation tasks on an open music dataset.

研究动机与目标

通过利用项目元数据在不增加在线内存需求的情况下提升推荐性能。
扩展 Prod2Vec 以包含侧信息以获得更好的项目表示。
评估元数据对下一事件预测的影响，特别是在冷启动场景中。
展示 Meta-Prod2Vec 与 Prod2Vec 与 CF 基线在公开数据集上的对比表现。

提出的方法

在神经模型的输入与输出空间中注入元数据，以 Prod2Vec 为基础进行扩展。
引入四个与元数据的交互项：L_I|M、L_J|M、L_M|I、L_M|M，配以各自的正则化权重。
使用一个共享的嵌入空间和一个将 Prod2Vec 损失与侧信息损失结合的训练目标：L_MP2V = L_J|I + λ*(L_M|I + L_J|M + L_M|M + L_I|M)。
采用与 Word2Vec 相似的负采样的可扩展训练机制来近似 softmax。
由于元数据仅在训练阶段使用，因此在线内存占用保持不变。

实验结果

研究问题

RQ1当存在元数据时，Meta-Prod2Vec 是否在下一项预测上优于 Prod2Vec？
RQ2每种侧信息类型对性能提升的贡献有多大？
RQ3在冷启动场景下，Meta-Prod2Vec 相较基线有何影响？
RQ4将 Meta-Prod2Vec 与 CF 方法结合是否能进一步提升推荐效果？

主要发现

Meta-Prod2Vec 在 30Music 数据集的 HR@10、NDCG@10、HR@20、NDCG@20 上均超过独立的 Prod2Vec。
在冷启动流量下，Standalone Meta-Prod2Vec 超越所有基线，组合模型（Meta-Prod2Vec、CoCounts）在低计数对上提供最佳结果。
每种类型的侧信息（I|M、M|I、J|M、M|M）均有贡献，表 3 显示单独类型相对于完整 Meta-Prod2Vec 的提升最高可达 50%。
在对查询-下一项对的零共现情形下，Meta-Prod2Vec 取得显著增益，表明在冷启动场景下具有更好的泛化能力。
该模型保持与现有基于嵌入的系统相同的在线内存占用，因为元数据仅在训练阶段使用。
当与 Mix 模型中的 CoCounts 结合时，Meta-Prod2Vec 在所有测试配置中表现最强。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。