Skip to main content
QUICK REVIEW

[논문 리뷰] Why not Collaborative Filtering in Dual View? Bridging Sparse and Dense Models

Hanze Guo, Jianxun Lian|arXiv (Cornell University)|2026. 01. 14.
Recommender Systems and Techniques인용 수 0
한 줄 요약

SaD는 구조 기반의 희소(구조 기반)와 임베딩 기반의 조밀(Embedding 기반) 협업 필터링을 정렬하는 플러그 앤 플레이 듀얼 뷰 프레임워크를 제시하여 특히 롱테일 아이템에 대한 추천을 개선하고, 이론적 SNR 분석과 양방향 교차 뷰 정렬을 제공한다.

ABSTRACT

Collaborative Filtering (CF) remains the cornerstone of modern recommender systems, with dense embedding--based methods dominating current practice. However, these approaches suffer from a critical limitation: our theoretical analysis reveals a fundamental signal-to-noise ratio (SNR) ceiling when modeling unpopular items, where parameter-based dense models experience diminishing SNR under severe data sparsity. To overcome this bottleneck, we propose SaD (Sparse and Dense), a unified framework that integrates the semantic expressiveness of dense embeddings with the structural reliability of sparse interaction patterns. We theoretically show that aligning these dual views yields a strictly superior global SNR. Concretely, SaD introduces a lightweight bidirectional alignment mechanism: the dense view enriches the sparse view by injecting semantic correlations, while the sparse view regularizes the dense model through explicit structural signals. Extensive experiments demonstrate that, under this dual-view alignment, even a simple matrix factorization--style dense model can achieve state-of-the-art performance. Moreover, SaD is plug-and-play and can be seamlessly applied to a wide range of existing recommender models, highlighting the enduring power of collaborative filtering when leveraged from dual perspectives. Further evaluations on real-world benchmarks show that SaD consistently outperforms strong baselines, ranking first on the BarsMatch leaderboard. The code is publicly available at https://github.com/harris26-G/SaD.

연구 동기 및 목표

  • 신호 대 잡음비(SNR) 제약으로 인해 희소하고 롱테일한 아이템에서 Dense 임베딩 모델의 한계를 식별한다.
  • 희소 뷰와 조밀 뷰를 정렬하여 전체 SNR 및 추천 성능을 향상시키는 원칙에 기반한 듀얼 뷰 프레임워크를 제안한다.
  • 희소 뷰와 조밀 뷰의 통합이 융합에서 상호 이점을 어떻게 가져오는지 이론적으로 분석한다.
  • SaD가 플러그 앤 플레이이며 다양한 베이스라인과 데이터셋에 광범위하게 적용 가능함을 보여준다.

제안 방법

  • 조밀 뷰와 희소 뷰를 정의하고 각각의 예측을 형식화한다.
  • 조밀 모델의 SNR 한계 상한과 희소 뷰의 보완적 이점을 이론적으로 분석한다.
  • 희소 및 조밀 구성 요소 간의 양방향 정렬 메커니즘을 갖춘 SaD 프레임워크를 도입한다.
  • Slim에 기반한 희소 모듈과 일반화된 MF 프레임워크에 기반한 조밀 모듈의 두 가지 백본 구현을 설명하고, 교차 뷰 데이터 증강 및 가이드를 포함한다.
  • 희소-에서-조밀로의 의사 레이블 증강 및 조밀-에서-희소로의 의사 상호 작용을 교사 예측을 통해 설명한다.
  • 밀도와 희소 출력을 선형 결합하는 Alignment Projector를 통한 최종 예측 융합을 제시한다.
(a) Performance on Yelp
(a) Performance on Yelp

실험 결과

연구 질문

  • RQ1희소와 조밀 협업 필터링 뷰의 이중 뷰 정렬이 SNR 및 전반적인 추천 품질을 향상시킬 수 있는가, 특히 인기가 낮은 아이템에서?
  • RQ2희소 뷰 구조 신호를 포함시킬 때 임베딩 기반의 조밀 모델의 학습 안정성 및 성능에 어떤 영향을 미치는가?
  • RQ3플러그 앤 플레이 SaD 프레임워크가 서로 다른 백본 모델과 데이터셋에 일반화되는가?
  • RQ4대응하는 희소 및 조밀 신호를 융합할 때 SNR 증가에 대한 이론적 보장이 무엇인가?

주요 결과

  • SaD는 벤치마크에서 최첨단 성능을 달성하고 롱테일 아이템에서 큰 이득을 보여준다.
  • 이론적 분석은 조밀 모델의 저수요 아이템에 대한 SNR 한계를 입증하고 희소 뷰가 융합 SNR을 향상시키기 위해 어떻게 보완될 수 있는지 보여준다.
  • 양방향 정렬(희소→조밀 및 조밀→희소)은 각 뷰의 SNR과 융합 결과를 일관되게 향상시킨다.
  • SaD는 플러그 앤 플레이이며 MF, SGL, LightGCN 등 다양한 백본과 기본 설계의 변경 없이 통합될 수 있다.
  • 실제 벤치마크에서의 실험은 견고한 성능과 미확인 데이터셋에서의 경쟁력 있는 결과를 나타낸다.
(b) Performance on Movielens
(b) Performance on Movielens

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.