[논문 리뷰] Generate What You Prefer: Reshaping Sequential Recommendation via Guided Diffusion
DreamRec은 순차 추천을 음의 샘플링을 피하고 아이템 공간의 탐색을 개선하기 위해 guided diffusion을 사용해 오라클 아이템을 생성하는 학습-생성(task)으로 재정의한다.
Sequential recommendation aims to recommend the next item that matches a user's interest, based on the sequence of items he/she interacted with before. Scrutinizing previous studies, we can summarize a common learning-to-classify paradigm -- given a positive item, a recommender model performs negative sampling to add negative items and learns to classify whether the user prefers them or not, based on his/her historical interaction sequence. Although effective, we reveal two inherent limitations:(1) it may differ from human behavior in that a user could imagine an oracle item in mind and select potential items matching the oracle; and (2) the classification is limited in the candidate pool with noisy or easy supervision from negative samples, which dilutes the preference signals towards the oracle item. Yet, generating the oracle item from the historical interaction sequence is mostly unexplored. To bridge the gap, we reshape sequential recommendation as a learning-to-generate paradigm, which is achieved via a guided diffusion model, termed DreamRec.Specifically, for a sequence of historical items, it applies a Transformer encoder to create guidance representations. Noising target items explores the underlying distribution of item space; then, with the guidance of historical interactions, the denoising process generates an oracle item to recover the positive item, so as to cast off negative sampling and depict the true preference of the user directly. We evaluate the effectiveness of DreamRec through extensive experiments and comparisons with existing methods. Codes and data are open-sourced at https://github.com/YangZhengyi98/DreamRec.
연구 동기 및 목표
- 순차 추천을 음의 샘플링이 있는 분류 문제에서 생성 문제로 전환하려는 동기를 부여한다.
- 사용자 선호를 기저 데이터 생성 과정으로 모델링하고 기록(history)에 맞춘 오라클 아이템을 생성한다.
- 히스토리에 의해 가이드되는 확산 기반 생성을 활용하여 음의 샘플링에 대한 의존성을 제거하거나 줄인다.
제안 방법
- 사용자 상호작용 시퀀스로부터 히스토리 가이드 신호를 도출하기 위해 Transformer 인코더를 사용한다.
- 히스토리에 조건화된 오라클 아이템을 생성하기 위해 확산 기반 노이즈 제거 과정을 적용한다 (e_{n}^{0} ~ p_{\theta}(·|e_{1:n-1})).
- 개인화된 가이드와 일반 확산 간의 균형을 맞추기 위해 classifier-free 가이던스를 도입한다 (Equation 15).
- 대상 아이템으로 노이즈를 제거하는 조건부 확산 목표로 학습한다 (Equation 14).
- 추론 시 가우시안 사전분포에서 노이즈 제거를 통해 e_{n}^{0}를 생성하고 추천 후보 세트 내에서 K-최근접 아이템을 검색한다.
실험 결과
연구 질문
- RQ1순차 추천을 음의 샘플링에 의존하지 않고 오라클 아이템을 생성하여 학습-분류에서 학습-생성으로 재정의할 수 있는가?
- RQ2히스토리 조건 가이던스를 갖춘 가이드 확산이 기존의 음의 샘플링 기준선과 비교해 생성된 오라클 아이템과 다운스트림 추천성을 향상시키는가?
- RQ3개인화된 가이던스 강도가 생성 품질과 추천 성능에 어떤 영향을 미치는가?
- RQ4음의 샘플링 없이 전체 아이템 공간을 탐색하는 데 있어 오라클 아이템 생성을 통한 영향은 무엇인가?
주요 결과
| 데이터셋 | HR@20 (%) | NDCG@20 (%) |
|---|---|---|
| YooChoose | 4.78 ± 0.06 | 2.23 ± 0.02 |
| KuaiRec | 5.16 ± 0.05 | 4.11 ± 0.02 |
| Zhihu | 2.26 ± 0.07 | 0.79 ± 0.01 |
- DreamRec은 YooChoose, KuaiRec, Zhihu에서 HR@20 및 NDCG@20 기준으로 강력한 베이스라인들(GRU4Rec, Caser, SASRec, S-IPS, AdaRanker, CL4SRec, DiffRec)을 능가한다.
- DreamRec은 세 데이터셋 모두에서 더 높은 HR@20 및 NDCG@20를 달성한다: YooChoose (HR 4.78, NDCG 2.23), KuaiRec (HR 5.16, NDCG 4.11), Zhihu (HR 2.26, NDCG 0.79).
- 시각화 결과 DreamRec은 음의 샘플링 없이도 더 넓은 아이템 공간을 탐색하는 반면, SASRec는 음의 샘플링 여부와 무관하게 제시된다.
- 히스토리 기반 가이던스가 개인화를 향상시키나, 가이던스가 너무 강하면(높은 w) 생성 품질과 전반적 성능에 악영향을 줄 수 있다.
- DreamRec은 학습 시 음의 샘플링이 필요하지 않지만 평가 시 후보 세트에 대한 검색 단계를 여전히 활용할 수 있다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.