Skip to main content
QUICK REVIEW

[논문 리뷰] NISER: Normalized Item and Session Representations to Handle Popularity Bias

Priyanka Gupta, D. Garg|arXiv (Cornell University)|2019. 09. 10.
Speech Recognition and Synthesis참고 문헌 13인용 수 28
한 줄 요약

이 논문은 그래프 신경망(GNN) 기반 시스템에서 인기 품목에 대한 편향을 완화하기 위해 항목 및 세션-그래프 임베딩을 단위 초구면에 정규화하는 NISER라는 세션 기반 추천 모델을 제안한다. 내적 대신 코사인 유사도를 최적화함으로써, NISER는 장꼬리 및 신규 도입 품목의 추천 성능을 크게 향상시키며, 세 가지 벤치마크 데이터셋에서 최신 기술 성능을 달성하면서도 인기 품목에 대한 편향을 감소시킨다.

ABSTRACT

The goal of session-based recommendation (SR) models is to utilize the information from past actions (e.g. item/product clicks) in a session to recommend items that a user is likely to click next. Recently it has been shown that the sequence of item interactions in a session can be modeled as graph-structured data to better account for complex item transitions. Graph neural networks (GNNs) can learn useful representations for such session-graphs, and have been shown to improve over sequential models such as recurrent neural networks [14]. However, we note that these GNN-based recommendation models suffer from popularity bias: the models are biased towards recommending popular items, and fail to recommend relevant long-tail items (less popular or less frequent items). Therefore, these models perform poorly for the less popular new items arriving daily in a practical online setting. We demonstrate that this issue is, in part, related to the magnitude or norm of the learned item and session-graph representations (embedding vectors). We propose a training procedure that mitigates this issue by using normalized representations. The models using normalized item and session-graph representations perform significantly better: i. for the less popular long-tail items in the offline setting, and ii. for the less popular newly introduced items in the online setting. Furthermore, our approach significantly improves upon existing state-of-the-art on three benchmark datasets.

연구 동기 및 목표

  • 왜곡된 품목 빈도 분포로 인해 인기 있는 품목이 과도하게 표현되는 GNN 기반 세션 기반 추천 모델에서 인기 품목 편향을 해결하기 위해.
  • 항목 및 세션-그래프 임베딩의 L2 노름을 정규화함으로써 편향을 줄이고, 장꼬리 및 신규 도입 품목의 성능을 향상시킬 수 있는지 조사하기 위해.
  • 학습 및 추론 모두 동안 표현을 단위 초구면에 제약하는 학습 절차를 개발하여 공정성과 일반화 능력을 향상시키기 위해.
  • 오프라인 및 온라인 추천 환경에서 정규화된 표현의 효과를 입증하고, 특히 저빈도 및 신규 품목에 대해 성능 향상을 보여주기 위해.
  • 기존의 GNN 기반 모델인 SR-GNN과 비교하여 성능을 향상시켜 세션 기반 추천 분야에서 새로운 최신 기술 성능을 수립하기 위해.

제안 방법

  • 항목 및 세션-그래프 임베딩의 L2 노름을 단위로 정규화하여, 표현이 단위 초구면 위에 위치하도록 하는 NISER 모델을 제안한다.
  • 표준 내적 손실 대신 코사인 유사도를 학습 목표에 통합하여, 임베딩 노름의 크기 차이로 인한 편향을 줄인다.
  • 순서 정보를 유지하면서도 그래프 기반 메시지 전파를 유지하기 위해 GNN 아키텍처에 위치 임베딩을 통합한다.
  • 특히 신규 품목의 데이터가 적은 환경에서 과적합을 줄이고 일반화 능력을 향상시키기 위해 항목 임베딩에 드롭아웃을 적용한다.
  • 세션-그래프 표현이 다음 클릭된 품목의 표현과 일치하도록 유도하는 대조 학습 목표를 사용하여 모델을 훈련한다.
  • 이중 단계 훈련 과정을 적용: 먼저 정규화된 L2 제약 조건을 갖는 임베딩을 사전 훈련하고, 이후 위치 및 드롭아웃 구성 요소를 포함한 전체 손실 함수로 미세조정한다.

실험 결과

연구 질문

  • RQ1GNN 기반 세션 기반 추천 모델에서 항목 및 세션-그래프 임베딩의 L2 노름을 정규화하면 인기 편향이 감소하는가?
  • RQ2정규화된 표현은 온라인 환경에서 덜 인기 있는 품목 및 신규 도입 품목의 추천 성능을 향상시킬 수 있는가?
  • RQ3정규화, 위치 임베딩, 드롭아웃의 조합이 모델의 전체 성능와 내구성에 어떤 영향을 미치는가?
  • RQ4NISER는 오프라인 및 온라인 평가 환경 모두에서 기존 최신 기술 모델을 얼마나 뛰어넘는가?
  • RQ5다중 클래스 분류 설정에서 소프트맥스 손실이 유도하는 반경 편향을 정규화된 임베딩이 얼마나 효과적으로 완화하는가?

주요 결과

  • ϕ* = 0.01인 매우 저빈도 품목을 대상으로 하는 세션에 대해 NISER+는 Recall@20와 MRR@20에서 각각 13%에서 28%의 상대적 향상률을 기록했으며, ϕ* = 0.001일 경우 각각 최대 26%와 34%의 향상률을 기록했다.
  • 신규 도입된 장꼬리 품목에 대해 NISER+는 출시 당일 GNN+를 능가했으며, 훈련 데이터가 제한된 상황에서도 효과적으로 신규 품목을 추천할 수 있음을 보여주었다.
  • NISER+는 시간이 지남에 따라 인기 편향이 증가함에도 불구하고 일관된 성능을 유지하는 반면, GNN+는 특히 YC 데이터셋에서 심각하게 성능이 저하되었다.
  • 절단 실험 결과, 임베딩의 L2 정규화가 가장 중요한 구성 요소로 밝혀졌으며, 모든 데이터셋에서 위치 임베딩이나 드롭아웃보다 더 큰 기여를 하였다.
  • NISER+는 세 가지 벤치마크 데이터셋(DN, RR, YC)에서 새로운 최신 기술 성능을 달성했으며, 모든 설정에서 Recall@20와 MRR@20에서 GNN+를 능가했다.
  • ARP(Average Recall for Popularity)가 크게 감소하여, 특히 저빈도 품목에 대해 인기 편향이 현저히 감소함을 나타내었다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.