Skip to main content
QUICK REVIEW

[논문 리뷰] MeLU: Meta-Learned User Preference Estimator for Cold-Start Recommendation

Hoyeop Lee, Jinbae Im|arXiv (Cornell University)|2019. 07. 31.
Recommender Systems and Techniques참고 문헌 31인용 수 53
한 줄 요약

MeLU는 최적화 기반의 메타 학습(MAML)을 사용하여 매우 적은 인터랙션으로 신규 사용자에 대한 추천을 신속하게 개인화하고, 초기 추천을 개선하기 위한 증거-후보 선택 전략을 도입합니다.

ABSTRACT

This paper proposes a recommender system to alleviate the cold-start problem that can estimate user preferences based on only a small number of items. To identify a user's preference in the cold state, existing recommender systems, such as Netflix, initially provide items to a user; we call those items evidence candidates. Recommendations are then made based on the items selected by the user. Previous recommendation studies have two limitations: (1) the users who consumed a few items have poor recommendations and (2) inadequate evidence candidates are used to identify user preferences. We propose a meta-learning-based recommender system called MeLU to overcome these two limitations. From meta-learning, which can rapidly adopt new task with a few examples, MeLU can estimate new user's preferences with a few consumed items. In addition, we provide an evidence candidate selection strategy that determines distinguishing items for customized preference estimation. We validate MeLU with two benchmark datasets, and the proposed model reduces at least 5.92% mean absolute error than two comparative models on the datasets. We also conduct a user study experiment to verify the evidence selection strategy.

연구 동기 및 목표

  • 추천 시스템에서 초기 상호작용이 거의 없는 사용자의 콜드 스타트를 해결한다.
  • 메타 학습을 활용하여 각 사용자별로 개인화된 선호도 추정기를 생성한다.
  • 초기 추천 품질을 향상시키기 위한 증거 후보 선택 전략을 제안한다.
  • 벤치마크 데이터셋과 증거 선택 평가를 위한 사용자 연구를 통해 성능을 검증한다.

제안 방법

  • 사용자와 아이템 콘텐츠를 임베딩하고 이를 다층 신경 의사결정 네트워크를 통해 통과시키는 사용자 선호도 추정기를 정의한다.
  • 지원 세트(그들의 아이템 이력)를 사용하여 각 새 사용자에 대해 모델 매개변수를 신속하게 적응시키는 최적화 기반 메타학습(MAML) 프레임워크를 채택한다.
  • 안정성을 유지하기 위해 로컬 업데이트 동안 사용자/아이템 임베딩을 업데이트하지 않고 의사결정 계층과 출력 계층만 업데이트한다.
  • 각 사용자의 지원 세트를 사용한 로컬 업데이트와 쿼리 세트를 사용한 작업 간 글로벌 업데이트의 두 단계로 학습한다.
  • 기울기 기반 구분성(Frobenius norm of personalization gradient)과 아이템 인기도를 결합하여 상위 k 개의 증거 후보를 형성하는 증거 후보 선택 전략을 도입한다.
  • MAE와 nDCG를 지표로 사용하여 MovieLens 1M 및 BookCrossing 데이터셋에서 기존 항목/신규 항목 및 기존 사용자/신규 사용자 네 가지 시나리오를 평가한다; PPR 및 Wide & Deep 베이스라인과 비교한다.

실험 결과

연구 질문

  • RQ1MAML 기반의 추천기가 단지 소량의 상호작용 데이터로 신규 사용자에 빠르게 개인화할 수 있는가?
  • RQ2증거 후보를 선택적으로 고르는 것이 인기도 기반 후보에 비해 신규 사용자의 초기 추천을 개선하는가?
  • RQ3냉 시작 설정에서 사용자의 아이템 소비 이력 길이가 달라져도 MeLU의 강건성은 얼마나 되는가?
  • RQ4학습된 개인화 매개변수가 서로 다른 데이터셋과 냉 시작 시나리오 간에 일반화되는가?

주요 결과

  • MeLU는 MovieLens 및 BookCrossing 데이터셋의 세 가지 콜드 스타트 시나리오에서 두 개의 베이스라인 모델을 능가한다.
  • 모델은 빠르게 적응하여 단 한 번의 로컬 업데이트 후에도 MAE가 상당히 개선되며, 추가 업데이트는 효과가 감소한다.
  • 증거 후보 선택이 개인화 기울기와 인기도를 기반으로 더 신뢰할 수 있는 후보를 제공하고 사용자 연구에서 더 높은 사용자 만족도를 이끈다.
  • MeLU는 매우 짧은 아이템 소비 이력에서도 여전히 뛰어난 성능을 유지하여 이력 길이에 대한 강건성을 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.