Skip to main content
QUICK REVIEW

[논문 리뷰] Self-supervised Learning for Large-scale Item Recommendations

Tiansheng Yao, Xinyang Yi|arXiv (Cornell University)|2020. 07. 25.
Recommender Systems and Techniques참고 문헌 44인용 수 29
한 줄 요약

이 논문은 대규모 항목 추천 시스템을 위한 자기지도학습(SSL) 프레임워크를 제안하며, 새로운 데이터 증강 및 대비 학습을 통해 비라벨 데이터를 활용해 표현 학습과 일반화 능력을 향상시킵니다. 이 방법은 특히 장꼬리 및 저감독 항목에서 성능을 크게 향상시키며, 실시간 A/B 테스트를 통해 웹스케일 추천 시스템에서 실제 영향을 입증했습니다. 신규 앱의 경우 +4.5%의 참여도 향상과 국제 시장에서의 핵심 지표에서 +5.47% 향상이 확인되었습니다.

ABSTRACT

Large scale recommender models find most relevant items from huge catalogs, and they play a critical role in modern search and recommendation systems. To model the input space with large-vocab categorical features, a typical recommender model learns a joint embedding space through neural networks for both queries and items from user feedback data. However, with millions to billions of items in the corpus, users tend to provide feedback for a very small set of them, causing a power-law distribution. This makes the feedback data for long-tail items extremely sparse. Inspired by the recent success in self-supervised representation learning research in both computer vision and natural language understanding, we propose a multi-task self-supervised learning (SSL) framework for large-scale item recommendations. The framework is designed to tackle the label sparsity problem by learning better latent relationship of item features. Specifically, SSL improves item representation learning as well as serving as additional regularization to improve generalization. Furthermore, we propose a novel data augmentation method that utilizes feature correlations within the proposed framework. We evaluate our framework using two real-world datasets with 500M and 1B training examples respectively. Our results demonstrate the effectiveness of SSL regularization and show its superior performance over the state-of-the-art regularization techniques. We also have already launched the proposed techniques to a web-scale commercial app-to-app recommendation system, with significant improvements top-tier business metrics demonstrated in A/B experiments on live traffic. Our online results also verify our hypothesis that our framework indeed improves model performance even more on slices that lack supervision.

연구 동기 및 목표

  • 장꼬리 항목에 대한 사용자 피드백이 극히 적은 상황에서 발생하는 레이블 희소성 문제를 해결하기 위해.
  • 자기지도학습(SSL)을 통해 비라벨 데이터를 활용해 표현 학습과 모델 일반화 능력을 향상시키기 위해.
  • 고기본도 카디널리티를 가진 범주형 특성 간의 상관관계를 활용해 더 나은 SSL 성능을 얻을 수 있도록 새로운 데이터 증강 전략을 설계하기 위해.
  • 실제 생산 환경에서의 SSL 프레임워크 효과성을 검증하고, 신규 또는 저항성 앱과 같은 저감독 환경에서의 성능 향상을 확인하기 위해.
  • 감독 신호가 부족한 상황에서 기존 최고 수준의 기술보다 더 강력한 정규화 효과를 제공할 수 있음을 입증하기 위해.

제안 방법

  • 사용자 피드백(예: 클릭)과 자기지도학습 대비 학습 목표를 모두 활용해 이중 타워 DNN 모델을 훈련하는 다중 과제 SSL 프레임워크를 제안합니다.
  • 유사한 특성을 마스킹하여 항목 특성의 상호보완적인 시각을 생성하는 새로운 데이터 증강 방법을 도입하여 다양하고 정보적인 증강을 보장합니다.
  • 동일한 항목의 두 개의 증강된 시각 중 어느 것이 원본인지 예측하도록 모델이 학습하는 대비 학습 목표를 적용하여 표현 품질을 향상시킵니다.
  • 마스킹된 특성의 선택을 지배하기 위해 상호정보를 활용하여, 증강된 시각이 의미적으로 다를 수는 있지만 관련성이 있어야 하도록 보장합니다.
  • 두 번째 시각의 특성 값에 무작위 드롭아웃을 적용하여 추가로 다양성을 증가시키고 단순 학습을 방지합니다.
  • 사용자 피드백에 대한 감독 손실과 증강된 시각에 대한 대비 손실을 조합하여 종합 손실을 사용해 모델을 엔드 투 엔드로 훈련합니다.

실험 결과

연구 질문

  • RQ1자기지도학습이 희소한 사용자 피드백을 가진 대규모 항목 추천 시스템에서 표현 학습과 일반화 능력을 향상시킬 수 있는가?
  • RQ2특성 상관관계와 마스킹에 기반한 제안된 데이터 증강 전략은 랜덤 또는 비상호보완성 증강과 비교해 어떻게 성능을 높이는가?
  • RQ3특히 저감독 설정에서 기존 최고 수준의 기술보다 SSL 프레임워크가 더 강력한 정규화 효과를 제공하는가?
  • RQ4장꼬리 및 콜드스타트 항목(예: 신규 앱 또는 저항성 시장)에서 SSL 프레임워크는 얼마나 성능을 향상시키는가?
  • RQ5오프라인 메트릭이 실시간 성능을 반영하지 못할 수 있는 상황에서, SSL의 이점은 실제 생산 환경에서 검증될 수 있는가?

주요 결과

  • 제안된 SSL 프레임워크는 웹스케일 앱 추천 시스템에서 실시간 A/B 실험에서 총 사용자 참여도 +0.67% 향상 및 핵심 비즈니스 지표 +1.5% 향상된 성과를 기록했습니다.
  • 신규 앱의 경우 사용자 참여도에서 +4.5% 향상되었으며, 이는 최소한의 감독 하에서도 성능 향상이 뚜렷하게 이루어졌음을 확인합니다.
  • 희소한 훈련 데이터를 가진 국제 시장에서는 핵심 비즈니스 지표에서 +5.47% 향상된 성과를 기록하여, 저감독 지역에서의 프레임워크 효과성을 입증했습니다.
  • 상호보완적인 특성 마스킹(CFM)을 적용한 대비 학습 태스크는 랜덤 마스킹(RFM) 및 비상호보완성 변형과 비교해 모든 베이스라인을 압도하며, 증강의 의미적 다양성이 중요함을 입증했습니다.
  • 제거 분석을 통해 특성 마스킹에서의 상호정보와 두 번째 시각에서의 무작위 드롭아웃이 성능 향상에 뚜렷한 기여를 함을 확인하였으며, 이는 표현 품질 향상에 기여하는 역할을 함을 시사합니다.
  • 모든 평가 지표(MAP@10, MAP@50, Recall@10, Recall@50)에서 SSL 프레임워크는 일관되게 성능 향상을 보였으며, 최고의 변종(CFM)은 AAI 데이터셋에서 MAP@10 0.1413을 기록했습니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.