[논문 리뷰] Sequential Recommendation with Diffusion Models
이 논문은 확산 모델 기반의 순차 추천 시스템 DiffRec를 소개하며, 이 시스템은 이산 아이템 시퀀스에 대해 확산 과정을 적응시키고, 효율적인 학습/추론을 제공하며, 최첨단 성능을 달성한다.
Generative models, such as Variational Auto-Encoder (VAE) and Generative Adversarial Network (GAN), have been successfully applied in sequential recommendation. These methods require sampling from probability distributions and adopt auxiliary loss functions to optimize the model, which can capture the uncertainty of user behaviors and alleviate exposure bias. However, existing generative models still suffer from the posterior collapse problem or the model collapse problem, thus limiting their applications in sequential recommendation. To tackle the challenges mentioned above, we leverage a new paradigm of the generative models, i.e., diffusion models, and present sequential recommendation with diffusion models (DiffRec), which can avoid the issues of VAE- and GAN-based models and show better performance. While diffusion models are originally proposed to process continuous image data, we design an additional transition in the forward process together with a transition in the reverse process to enable the processing of the discrete recommendation data. We also design a different noising strategy that only noises the target item instead of the whole sequence, which is more suitable for sequential recommendation. Based on the modified diffusion process, we derive the objective function of our framework using a simplification technique and design a denoise sequential recommender to fulfill the objective function. As the lengthened diffusion steps substantially increase the time complexity, we propose an efficient training strategy and an efficient inference strategy to reduce training and inference cost and improve recommendation diversity. Extensive experiment results on three public benchmark datasets verify the effectiveness of our approach and show that DiffRec outperforms the state-of-the-art sequential recommendation models.
연구 동기 및 목표
- 연속 추천에서 불확실성과 노출 편향을 모델링하는 동기를 부여한다.
- 순차 추천에 확산 모델을 도입하고 이를 이산 데이터에 맞게 적응시킨다.
- 시퀀스에 적합한 순전/역전 전이를 설계하고 타깃 노이싱 전략을 적용한다.
- 해로운 추정 없이 현실적으로 가능한 목적을 도출하고 denoise 순차 추천기를 구축한다.
- 비용을 줄이고 다양성을 높이기 위한 효율적 학습 및 추론 전략을 제안한다.
제안 방법
- 이산 아이템을 연속 숨겨진 표현으로 매핑하는 추가적인 순전 전이를 정의한다.
- 다음 아이템 예측 목표에 맞추기 위해 확산 단계에서 대상 아이템의 숨겨진 표현만 노이즈화한다.
- 숨겨진 표현을 선형 층과 소프트맥스를 통해 아이템 분포로 되돌리는 역전 전이를 도입한다.
- 단순화된 변분 목표를 도출하여 평균제곱오차(MSE) 손실과 표준 추천 손실로 축소한다.
- 포지션 및 확산 단계 임베딩을 포함한 트랜스포머 인코더를 사용한 Denoise Sequential Recommender(DSR)을 개발한다.
- harder한 확산 단계에 초점을 맞추기 위해 단계 샘플링 및 중요도 샘플링으로 효율적 학습을 적용한다.
실험 결과
연구 질문
- RQ1확산 모델이 이산 순차 추천 작업에 효과적으로 적응될 수 있는가?
- RQ2후처리/모델 붕괴를 피하기 위해 시퀀스에 대해 어떤 형태의 순전 및 역전 확산 전이가 설계되어야 하는가?
- RQ3확산 기반 순차 추천기의 학습을 가능하게 하는 목표 함수 형식은 무엇인가?
- RQ4효율적 학습 및 추론 전략이 비용을 크게 증가시키지 않으면서 경쟁력 있는 성능을 낼 수 있는가?
- RQ5DiffRec가 벤치마크 데이터셋에서 최첨단 성능과 향상된 다양성을 달성하는가?
주요 결과
- DiffRec가 세 가지 공개 벤치마크에서 최첨단 순차 추천기보다 더 우수한 성능을 보인다.
- 수정된 확산 과정(이산→연속 전이 및 타깃 아이템 노이싱)이 시퀀스 데이터를 효과적으로 처리한다.
- 단순화된 MSE 기반의 목적이 도출되어 시퀀스당 한 단계의 확산과 추가적인 추천 손실로 학습을 가능하게 한다.
- 확산 단계 샘플링과 중요도 샘플링을 활용한 효율적 학습 전략이 비용을 줄이면서 성능을 유지한다.
- 포지션 및 확산 임베딩을 포함한 트랜스포머를 사용한 DSR이 대상 아이템의 숨겨진 표현에 대해 정확한 디노이징을 제공한다.
- 추론 전략은 계산 비용을 줄이고 추천의 다양성을 향상시키도록 제안된다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.