[논문 리뷰] Zero Shot on the Cold-Start Problem: Model-Agnostic Interest Learning for Recommender Systems
이 논문은 사용자 속성과 행동 간 이중 오토인코더를 활용한 다중 모odal 재구성 기반으로 가상의 사용자 행동 데이터를 생성함으로써 추천 시스템의 냉시작 문제를 해결하는 모델에 종속적이지 않은 두 타워 프레임워크인 MAIL을 제안한다. 넷이즈 클라우드 뮤직에서의 실시간 구현에서 CTR가 13%~15% 향상되었으며, 이는 기존 사용자에게 성능 저하를 최소화하면서도 신규 사용자에게 효과적인 제로샷 관심도 전이를 실현함을 보여준다.
User behavior has been validated to be effective in revealing personalized preferences for commercial recommendations. However, few user-item interactions can be collected for new users, which results in a null space for their interests, i.e., the cold-start dilemma. In this paper, a two-tower framework, namely, the model-agnostic interest learning (MAIL) framework, is proposed to address the cold-start recommendation (CSR) problem for recommender systems. In MAIL, one unique tower is constructed to tackle the CSR from a zero-shot view, and the other tower focuses on the general ranking task. Specifically, the zero-shot tower first performs cross-modal reconstruction with dual auto-encoders to obtain virtual behavior data from highly aligned hidden features for new users; and the ranking tower can then output recommendations for users based on the completed data by the zero-shot tower. Practically, the ranking tower in MAIL is model-agnostic and can be implemented with any embedding-based deep models. Based on the co-training of the two towers, the MAIL presents an end-to-end method for recommender systems that shows an incremental performance improvement. The proposed method has been successfully deployed on the live recommendation system of NetEase Cloud Music to achieve a click-through rate improvement of 13% to 15% for millions of users. Offline experiments on real-world datasets also show its superior performance in CSR. Our code is available.
연구 동기 및 목표
- 신규 사용자가 상호작용 기록이 없을 때 발생하는 냉시작 추천(CSR) 문제를 해결하기 위해.
- CSR에서 희박한 사용자 행동 공간과 사용자 속성 공간 간의 모odal 이동 문제를 극복하기 위해.
- 기존 랭킹 모델을 대체하지 않고도 통합 가능한 실용적이고 모델에 종속적이지 않은 모듈을 설계하기 위해.
- 사용자 속성과 학습된 임베딩만을 사용하여 기존 사용자에서 신규 사용자로 지식 전이를 효과적으로 수행하기 위해.
- 기존 사용자의 성능에 최소한의 부정적 영향을 미치면서도 신규 사용자의 추천 성능을 향상시키기 위해.
제안 방법
- 제로샷 타워(가상 행동 생성 전용)와 모델에 종속적이지 않은 랭킹 타워로 구성된 두 타워 프레임워크를 제안한다.
- 사용자 행동과 사용자 속성에 대해 별도의 임베딩을 학습하기 위해 이중 오토인코더를 사용하며, 이를 공유된 은닉 공간으로 매핑한다.
- 재구성된 행동 특징와 속성 특징 간의 다중 모달 재구성 작업을 수행하여 모달 간의 정렬을 도모하고 분포 이동을 줄인다.
- 공유된 은닉 공간에서 기존 사용자와 신규 사용자의 주변 분포를 정렬하기 위해 최대 평균 차이(MMD) 손실을 적용한다.
- 행동 기반, 속성 기반, MMD 손실의 조합을 통해 제로샷 타워를 엔드 투 엔드로 훈련시켜 현실적인 가상 행동 데이터를 생성한다.
- 생성된 가상 행동 데이터를 임베딩 기반 랭킹 모델(예: DMR, ESMM)에 통합하여 점진적인 성능 향상을 이룬다.
실험 결과
연구 질문
- RQ1사용자 속성에서 효과적으로 가상의 사용자 행동을 합성하여 냉시작 문제를 완화할 수 있는가?
- RQ2사용자 속성과 행동 간의 다중 모달 정렬을 통해 모달 이동 문제를 최소화할 수 있는가?
- RQ3비전 기반 제로샷 학습(ZSL)과 유사한 성공을 거두기 위해 제로샷 학습 접근법을 냉시작 추천 환경에 적응시킬 수 있는가?
- RQ4제안된 방법이 기존 사용자의 성능을 떨어뜨리지 않으면서도 신규 사용자의 추천 성능을 향상시키는가?
- RQ5제로샷 타워가 기존 랭킹 모델에 모델에 종속적이지 않게 통합되어 점진적인 성능 향상을 이룰 수 있는가?
주요 결과
- 넷이즈 클라우드 뮤직에서의 온라인 A/B 테스트에서 MAIL-DMR은 클릭률(CTR)에서 13%~15%의 상대적 향상과 전환률(CTCVR)에서 3%~4%의 향상을 기록했다.
- 제로샷 타워는 t-SNE 시각화를 통해 생성된 특징와 실제 특징의 분포가 겹치는 것으로 확인되어, 사용자 속성과 행동 간의 모달 이동을 크게 감소시켰다.
- MAIL-Dual와 MAIL-Base는 MAIL-None과 MAIL-Single를 능가하여, 이중 다중 모달 재구성과 MMD 정규화가 효과적인 가상 행동 생성에 필수적임을 입증했다.
- 오프라인 실험에서 기존 사용자에 대한 랭킹 성능은 제로샷 모듈의 영향을 받지 않았으며, AUC 저하가 오직 0.05%~0.12% 수준에 그쳤다.
- 랭킹 타워 및 모든 구성 요소(행동 기반, 속성 기반, MMD)의 훈련 손실이 100배치 내에 급격히 감소하여 모델의 훈련 가능성과 수렴성을 확인했다.
- 산업용 데이터셋에 대한 시각화 결과, 신규 사용자의 속성 임베딩이 기존 사용자의 임베딩과 밀접하게 정렬됨을 확인하여, 행동 전이를 위한 공통된 속성 공간 가정이 타당함을 검증했다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.