QUICK REVIEW

[논문 리뷰] Zero Shot on the Cold-Start Problem: Model-Agnostic Interest Learning for Recommender Systems

Philip J. Feng, Pingjun Pan|arXiv (Cornell University)|2021. 08. 30.

Recommender Systems and Techniques참고 문헌 39인용 수 23

한 줄 요약

이 논문은 사용자 속성과 행동 간 이중 오토인코더를 활용한 다중 모odal 재구성 기반으로 가상의 사용자 행동 데이터를 생성함으로써 추천 시스템의 냉시작 문제를 해결하는 모델에 종속적이지 않은 두 타워 프레임워크인 MAIL을 제안한다. 넷이즈 클라우드 뮤직에서의 실시간 구현에서 CTR가 13%~15% 향상되었으며, 이는 기존 사용자에게 성능 저하를 최소화하면서도 신규 사용자에게 효과적인 제로샷 관심도 전이를 실현함을 보여준다.

ABSTRACT

User behavior has been validated to be effective in revealing personalized preferences for commercial recommendations. However, few user-item interactions can be collected for new users, which results in a null space for their interests, i.e., the cold-start dilemma. In this paper, a two-tower framework, namely, the model-agnostic interest learning (MAIL) framework, is proposed to address the cold-start recommendation (CSR) problem for recommender systems. In MAIL, one unique tower is constructed to tackle the CSR from a zero-shot view, and the other tower focuses on the general ranking task. Specifically, the zero-shot tower first performs cross-modal reconstruction with dual auto-encoders to obtain virtual behavior data from highly aligned hidden features for new users; and the ranking tower can then output recommendations for users based on the completed data by the zero-shot tower. Practically, the ranking tower in MAIL is model-agnostic and can be implemented with any embedding-based deep models. Based on the co-training of the two towers, the MAIL presents an end-to-end method for recommender systems that shows an incremental performance improvement. The proposed method has been successfully deployed on the live recommendation system of NetEase Cloud Music to achieve a click-through rate improvement of 13% to 15% for millions of users. Offline experiments on real-world datasets also show its superior performance in CSR. Our code is available.

연구 동기 및 목표

신규 사용자가 상호작용 기록이 없을 때 발생하는 냉시작 추천(CSR) 문제를 해결하기 위해.
CSR에서 희박한 사용자 행동 공간과 사용자 속성 공간 간의 모odal 이동 문제를 극복하기 위해.
기존 랭킹 모델을 대체하지 않고도 통합 가능한 실용적이고 모델에 종속적이지 않은 모듈을 설계하기 위해.
사용자 속성과 학습된 임베딩만을 사용하여 기존 사용자에서 신규 사용자로 지식 전이를 효과적으로 수행하기 위해.
기존 사용자의 성능에 최소한의 부정적 영향을 미치면서도 신규 사용자의 추천 성능을 향상시키기 위해.

제안 방법

제로샷 타워(가상 행동 생성 전용)와 모델에 종속적이지 않은 랭킹 타워로 구성된 두 타워 프레임워크를 제안한다.
사용자 행동과 사용자 속성에 대해 별도의 임베딩을 학습하기 위해 이중 오토인코더를 사용하며, 이를 공유된 은닉 공간으로 매핑한다.
재구성된 행동 특징와 속성 특징 간의 다중 모달 재구성 작업을 수행하여 모달 간의 정렬을 도모하고 분포 이동을 줄인다.
공유된 은닉 공간에서 기존 사용자와 신규 사용자의 주변 분포를 정렬하기 위해 최대 평균 차이(MMD) 손실을 적용한다.
행동 기반, 속성 기반, MMD 손실의 조합을 통해 제로샷 타워를 엔드 투 엔드로 훈련시켜 현실적인 가상 행동 데이터를 생성한다.
생성된 가상 행동 데이터를 임베딩 기반 랭킹 모델(예: DMR, ESMM)에 통합하여 점진적인 성능 향상을 이룬다.

실험 결과

연구 질문

RQ1사용자 속성에서 효과적으로 가상의 사용자 행동을 합성하여 냉시작 문제를 완화할 수 있는가?
RQ2사용자 속성과 행동 간의 다중 모달 정렬을 통해 모달 이동 문제를 최소화할 수 있는가?
RQ3비전 기반 제로샷 학습(ZSL)과 유사한 성공을 거두기 위해 제로샷 학습 접근법을 냉시작 추천 환경에 적응시킬 수 있는가?
RQ4제안된 방법이 기존 사용자의 성능을 떨어뜨리지 않으면서도 신규 사용자의 추천 성능을 향상시키는가?
RQ5제로샷 타워가 기존 랭킹 모델에 모델에 종속적이지 않게 통합되어 점진적인 성능 향상을 이룰 수 있는가?

주요 결과

넷이즈 클라우드 뮤직에서의 온라인 A/B 테스트에서 MAIL-DMR은 클릭률(CTR)에서 13%~15%의 상대적 향상과 전환률(CTCVR)에서 3%~4%의 향상을 기록했다.
제로샷 타워는 t-SNE 시각화를 통해 생성된 특징와 실제 특징의 분포가 겹치는 것으로 확인되어, 사용자 속성과 행동 간의 모달 이동을 크게 감소시켰다.
MAIL-Dual와 MAIL-Base는 MAIL-None과 MAIL-Single를 능가하여, 이중 다중 모달 재구성과 MMD 정규화가 효과적인 가상 행동 생성에 필수적임을 입증했다.
오프라인 실험에서 기존 사용자에 대한 랭킹 성능은 제로샷 모듈의 영향을 받지 않았으며, AUC 저하가 오직 0.05%~0.12% 수준에 그쳤다.
랭킹 타워 및 모든 구성 요소(행동 기반, 속성 기반, MMD)의 훈련 손실이 100배치 내에 급격히 감소하여 모델의 훈련 가능성과 수렴성을 확인했다.
산업용 데이터셋에 대한 시각화 결과, 신규 사용자의 속성 임베딩이 기존 사용자의 임베딩과 밀접하게 정렬됨을 확인하여, 행동 전이를 위한 공통된 속성 공간 가정이 타당함을 검증했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.