[论文解读] Learning Compatibility Across Categories for Heterogeneous Item Recommendation
Monomer 提出了一种可扩展的非度量学习框架,通过混合非度量嵌入来建模多种局部兼容性概念,实现异构物品推荐。该方法在跨类别和异构设置下,于多样化的亚马逊品类中,在共购买和共浏览链接预测任务上均优于基于度量的基线方法(如 LMT)。
Identifying relationships between items is a key task of an online recommender system, in order to help users discover items that are functionally complementary or visually compatible. In domains like clothing recommendation, this task is particularly challenging since a successful system should be capable of handling a large corpus of items, a huge amount of relationships among them, as well as the high-dimensional and semantically complicated features involved. Furthermore, the human notion of "compatibility" to capture goes beyond mere similarity: For two items to be compatible---whether jeans and a t-shirt, or a laptop and a charger---they should be similar in some ways, but systematically different in others. In this paper we propose a novel method, Monomer, to learn complicated and heterogeneous relationships between items in product recommendation settings. Recently, scalable methods have been developed that address this task by learning similarity metrics on top of the content of the products involved. Here our method relaxes the metricity assumption inherent in previous work and models multiple localized notions of 'relatedness,' so as to uncover ways in which related items should be systematically similar, and systematically different. Quantitatively, we show that our system achieves state-of-the-art performance on large-scale compatibility prediction tasks, especially in cases where there is substantial heterogeneity between related items. Qualitatively, we demonstrate that richer notions of compatibility can be learned that go beyond similarity, and that our model can make effective recommendations of heterogeneous content.
研究动机与目标
- 解决基于度量的方法在建模异构物品关系时的局限性,特别是在物品在某些方面系统性相似而其他方面不同时。
- 克服对显式类别标签和度量假设(如对称性、同一性、传递性)的依赖,这些假设限制了跨类别推荐。
- 通过同时捕捉多种相互竞争的相关性概念,实现多样化且上下文相关的推荐。
- 在学习高维视觉和文本特征空间中复杂、非度量的兼容性关系时,保持可扩展性和效率。
提出的方法
- 使用专家混合框架来建模多种非度量视觉空间,其中每个空间捕捉一种独特的局部相关性概念。
- 使用独立的嵌入矩阵将查询物品和候选物品投影到 N 个不同的视觉空间中,并在每个空间中计算欧几里得距离。
- 通过路由网络学习每个空间的概率权重,该网络根据查询物品自适应地组合距离分量。
- 通过允许非对称、非同一性和非传递性关系,放松度量性假设,从而实现更丰富的兼容性建模。
- 使用对比损失在亚马逊的共购买和共浏览对上端到端训练模型,且各空间间共享嵌入参数。
- 通过在使用相同数量嵌入参数时,使时间复杂度与先前方法(如 LMT)保持一致,确保计算效率。
实验结果
研究问题
- RQ1非度量、多概念嵌入框架是否能在预测异构物品兼容性方面优于基于度量的方法?
- RQ2Monomer 在不依赖显式类别标签的情况下,能在多大程度上生成多样化、跨类别的推荐?
- RQ3Monomer 在真实亚马逊数据中,对不同产品类别和链接类型(如 also_bought 与 also_viewed)的泛化能力如何?
- RQ4与单一全局相似性度量相比,建模多种局部相关性概念是否能提升推荐质量?
- RQ5Monomer 是否能有效学习超越视觉或文本相似性的兼容性,例如功能互补性(如笔记本电脑与充电器)或风格协调性(如牛仔裤与衬衫)?
主要发现
- Monomer 在链接预测任务上显著优于 LMT,在所有亚马逊品类中平均误差降低 23.8%。
- 在 'also_bought' 任务中,Monomer 在所有品类中的测试误差为 12.94%,而 LMT 为 17.19%,表明其在更困难、更异构的关系上表现更优。
- 在 'Phones' 品类中,Monomer 将误差从 LMT 的 29.44% 降低至 22.68%,显示出在高度异构产品空间中的强大性能。
- Monomer 在 'also_bought' 和 'also_viewed' 链接预测任务上均达到最先进性能,其中在 'Electronics' 类别中 'also_viewed' 任务误差降低 42%,在 'Phones' 类别中 'also_viewed' 任务误差降低 35%。
- 该模型生成了定性上多样化的推荐,反映出风格和功能兼容性,例如将 T 恤与鞋子或不同颜色的衬衫搭配,而不仅限于简单的视觉相似性。
- 当使用相同数量的嵌入参数时,Monomer 的时间复杂度与 LMT 保持一致,确保了在模型表达能力增强的同时仍具备可扩展性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。