[论文解读] Augmenting the User-Item Graph with Textual Similarity Models
本文提出了一种无监督的数据增强技术,通过将预训练文本相似度模型应用于产品描述和评论,注入语义关系来增强用户-物品图。该方法在多种模型和几何空间中显著提升了推荐性能,尤其是在冷启动场景下,通过提高图的密度并实现更优的双曲空间表示,取得了当前最优结果。
This paper introduces a simple and effective form of data augmentation for recommender systems. A paraphrase similarity model is applied to widely available textual data, such as reviews and product descriptions, yielding new semantic relations that are added to the user-item graph. This increases the density of the graph without needing further labeled data. The data augmentation is evaluated on a variety of recommendation algorithms, using Euclidean, hyperbolic, and complex spaces, and over three categories of Amazon product reviews with differing characteristics. Results show that the data augmentation technique provides significant improvements to all types of models, with the most pronounced gains for knowledge graph-based recommenders, particularly in cold-start settings, leading to state-of-the-art performance.
研究动机与目标
- 通过将来自文本数据的语义关系注入稀疏的用户-物品交互图,解决推荐系统中的冷启动问题。
- 探究是否通过预训练语言模型显式注入语义关系,可在不增加计算成本的前提下提升模型泛化能力。
- 评估该增强方法在多种推荐模型和几何空间(欧几里得空间、双曲空间、复数空间)中的有效性。
- 分析增强后图的结构特性是否更有利于采用双曲几何进行表示以提升性能。
- 确定用于关系挖掘的文本输入(如产品描述与评论)中,哪一类最有效。
提出的方法
- 将预训练的释义相似度模型(如 SBERT)应用于物品级别的文本数据——产品描述和评论,计算物品之间的语义相似度得分。
- 利用这些相似度得分在用户-物品交互图中添加新边,构建具有显式语义关系的多关系知识图。
- 在不依赖标注数据或修改模型架构的前提下,将这些新关系扩展到用户-物品图中。
- 在一系列推荐模型上评估增强后的图,包括在欧几里得空间、双曲空间和复数空间中的知识图方法。
- 使用局部和全局几何度量(如聚类系数、最短路径、曲率)对图进行结构分析,以评估其适合双曲嵌入的程度。
- 开展消融研究,以隔离增强关系对性能的影响,特别是在冷启动和低数据场景下的表现。
实验结果
研究问题
- RQ1RQ1:在多种模型架构中,通过文本相似度模型注入语义关系来增强用户-物品图,是否能提升推荐性能?
- RQ2RQ2:该数据增强技术是否能在未专门设计用于多关系知识图的模型中也提升性能?
- RQ3RQ3:该增强方法在冷启动场景下的表现如何,特别是对交互稀疏的新用户或新物品?
- RQ4RQ4:在产品描述与评论中,哪类文本输入能生成更有效的语义关系?
- RQ5RQ5:增强后图的结构特性是否表明其更偏好双曲几何而非欧几里得或复数空间?
主要发现
- 所提出的增强方法在所有测试模型中均显著提升了推荐性能,尤其在冷启动场景下增益最大,达到了当前最优结果。
- 增强后的图表现出更强的双曲特性,表现为更高的聚类系数和更短的平均路径长度,表明其具有适合双曲嵌入的层次化结构。
- 知识图推荐方法从该增强中获益最多,尤其是在结合双曲空间时,其性能优于以往的知识图推荐模型以及非知识图的当前最优模型。
- 仅使用产品描述即可生成高度有效的语义关系,其信息密度和性能增益通常优于评论。
- 该方法与模型架构无关:无论模型是否原生支持多关系知识图,该方法均能提升其性能。
- 双曲空间能提供更好的可解释性与更低维的图表示,且随着图的层次结构愈发明显,性能增益也进一步提升。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。