Skip to main content
QUICK REVIEW

[论文解读] Why not Collaborative Filtering in Dual View? Bridging Sparse and Dense Models

Hanze Guo, Jianxun Lian|arXiv (Cornell University)|Jan 14, 2026
Recommender Systems and Techniques被引用 0
一句话总结

SaD 提出一个即插即用的双视图框架,将稀疏(基于结构)和密集(基于嵌入)的协同过滤对齐,以提升推荐,尤其是对长尾物品,具备理论 SNR 分析和双向跨视图对齐。

ABSTRACT

Collaborative Filtering (CF) remains the cornerstone of modern recommender systems, with dense embedding--based methods dominating current practice. However, these approaches suffer from a critical limitation: our theoretical analysis reveals a fundamental signal-to-noise ratio (SNR) ceiling when modeling unpopular items, where parameter-based dense models experience diminishing SNR under severe data sparsity. To overcome this bottleneck, we propose SaD (Sparse and Dense), a unified framework that integrates the semantic expressiveness of dense embeddings with the structural reliability of sparse interaction patterns. We theoretically show that aligning these dual views yields a strictly superior global SNR. Concretely, SaD introduces a lightweight bidirectional alignment mechanism: the dense view enriches the sparse view by injecting semantic correlations, while the sparse view regularizes the dense model through explicit structural signals. Extensive experiments demonstrate that, under this dual-view alignment, even a simple matrix factorization--style dense model can achieve state-of-the-art performance. Moreover, SaD is plug-and-play and can be seamlessly applied to a wide range of existing recommender models, highlighting the enduring power of collaborative filtering when leveraged from dual perspectives. Further evaluations on real-world benchmarks show that SaD consistently outperforms strong baselines, ranking first on the BarsMatch leaderboard. The code is publicly available at https://github.com/harris26-G/SaD.

研究动机与目标

  • 由于信噪比(SNR)约束,密集嵌入模型在稀疏、长尾物品上的局限性。
  • 提出一个 principled 的双视图框架,使稀疏视图与密集视图对齐,从而提升整体 SNR 与推荐性能。
  • 理论分析将稀疏视图与密集视图整合带来互利于融合的机理。
  • 显示 SaD 是可插拔的,且在基线和数据集上具有广泛适用性。

提出的方法

  • 定义密集视图和稀疏视图并形式化它们各自的预测。
  • 对密集模型的 SNR 上限以及稀疏视图的互补益处进行理论分析。
  • 引入 SaD 框架,具备稀疏组件与密集组件之间的双向对齐机制。
  • 描述两种骨干实现:基于 slim 的稀疏模块和基于广义 MF 的密集模块,并进行跨视图数据增强与引导。
  • 详细说明双向对齐过程:稀疏到密集的伪标签增强和密集到稀疏的伪交互通过教师预测实现。
  • 通过对齐投影器的线性组合,给出最终预测融合,将密集输出与稀疏输出结合在一起。
(a) Performance on Yelp
(a) Performance on Yelp

实验结果

研究问题

  • RQ1双视图对齐的稀疏与密集协同过滤视图是否能提升信噪比及整体推荐质量,尤其是对不常见物品?
  • RQ2在训练中引入稀疏视图结构信号如何影响基于嵌入的密集模型的稳定性和性能?
  • RQ3可插拔的 SaD 框架是否在不同骨干模型与数据集上具有泛化性?
  • RQ4在融合互补的稀疏和密集信号时,是否存在 SNR 增益的理论保障?

主要发现

  • SaD 在基准测试上达到最先进的性能,并在长尾物品上显示出显著提升。
  • 理论分析证明了密集模型对冷启动物品的 SNR 上限,并展示稀疏视图如何互补以提升融合的 SNR。
  • 双向对齐(稀疏到密集和密集到稀疏)始终提升各视图的 SNR 以及融合结果。
  • SaD 可插拔,可与多种骨干模型(如 MF、SGL、LightGCN)整合,而无需根本性的设计变更。
  • 在真实基准上进行的实验表明其鲁棒性与在未见数据集上的竞争力结果。
(b) Performance on Movielens
(b) Performance on Movielens

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。