Skip to main content
QUICK REVIEW

[論文レビュー] Why not Collaborative Filtering in Dual View? Bridging Sparse and Dense Models

Hanze Guo, Jianxun Lian|arXiv (Cornell University)|Jan 14, 2026
Recommender Systems and Techniques被引用数 0
ひとこと要約

SaD は、長尾アイテムを特に対象に、sparseとdenseを整合させるプラグアンドプレイ型の dual-view フレームワークを提案。理論的な SNR 分析と双方向のクロ_VIEW 整合化を含む。

ABSTRACT

Collaborative Filtering (CF) remains the cornerstone of modern recommender systems, with dense embedding--based methods dominating current practice. However, these approaches suffer from a critical limitation: our theoretical analysis reveals a fundamental signal-to-noise ratio (SNR) ceiling when modeling unpopular items, where parameter-based dense models experience diminishing SNR under severe data sparsity. To overcome this bottleneck, we propose SaD (Sparse and Dense), a unified framework that integrates the semantic expressiveness of dense embeddings with the structural reliability of sparse interaction patterns. We theoretically show that aligning these dual views yields a strictly superior global SNR. Concretely, SaD introduces a lightweight bidirectional alignment mechanism: the dense view enriches the sparse view by injecting semantic correlations, while the sparse view regularizes the dense model through explicit structural signals. Extensive experiments demonstrate that, under this dual-view alignment, even a simple matrix factorization--style dense model can achieve state-of-the-art performance. Moreover, SaD is plug-and-play and can be seamlessly applied to a wide range of existing recommender models, highlighting the enduring power of collaborative filtering when leveraged from dual perspectives. Further evaluations on real-world benchmarks show that SaD consistently outperforms strong baselines, ranking first on the BarsMatch leaderboard. The code is publicly available at https://github.com/harris26-G/SaD.

研究の動機と目的

  • 信号対雑音比(SNR)制約により、スパースな長尾アイテムに対する埋め込みモデルの限界を識別する。
  • sparse と dense のビューを整合させて全体の SNR と推奨性能を向上させる principled な双視点フレームワークを提案する。
  • sparse と dense のビューを統合することで融合時の相互利益を理論的に分析する。
  • SaD がプラグアンドプレイであり、ベースラインとデータセットを超えて広く適用可能であることを示す。」,

提案手法

  • dense ビューと sparse ビューを定義し、それぞれの予測を形式化する。
  • dense モデルの SNR 上限と sparse ビューの補完的利点について理論的分析を行う。
  • sparse と dense コンポーネント間の双方向整合機構を備えた SaD フレームワークを導入する。
  • 2つのバックボーン実装を説明する:slim に基づく sparse モジュールと、一般化 MF フレームワークに基づく dense モジュールで、クロ_VIEW データ拡張とガイダンスを行う。
  • 双方向の整合手順を詳述する:sparse-to-dense の疑似ラベル拡張と dense-to-sparse の疑似相互作用を教師予測で行う。
  • Alignment Projector による最終予測の融合を提示し、dense と sparse の出力を線形結合する。
(a) Performance on Yelp
(a) Performance on Yelp

実験結果

リサーチクエスチョン

  • RQ1sparse と dense の協調フィルタリングの dual-view 整合化は、特に人気の薄いアイテムに対する SNR と全体的な推奨品質を改善できるか(unpopular items)?
  • RQ2 sparse ビューの構造信号を導入することが、埋め込みベースの dense モデルの学習安定性と性能にどのように影響するか?
  • RQ3 plug-and-play な SaD フレームワークは、異なるバックボーンモデルやデータセットに一般化できるか?
  • RQ4 相補的な sparse および dense 信号を融合した際の SNR 増加の理論的保証は何か?

主な発見

  • SaD はベンチマークで最先端の性能を発揮し、長尾アイテムで強い利得を示す。
  • 理論分析により、dense モデルの cold item に対する SNR の上限が示され、sparse ビューが融合時の SNR を改善する補完性を持つことが示される。
  • 双方向整合(sparse-to-dense および dense-to-sparse)は、各ビューの SNR と融合結果を一貫して改善する。
  • SaD はプラグアンドプレイであり、MF、SGL、LightGCN などのさまざまなバックボーンと本質的な設計変更なしに統合可能である。
  • 実世界のベンチマークでの実験は堅牢な性能と未見データセットでの競争力のある結果を示す。
(b) Performance on Movielens
(b) Performance on Movielens

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。