Skip to main content
QUICK REVIEW

[논문 리뷰] Next Item Recommendation with Self-Attention

Shuai Zhang, Yi Tay|arXiv (Cornell University)|2018. 08. 20.
Recommender Systems and Techniques참고 문헌 44인용 수 51
한 줄 요약

AttRec은 self-attention 기반의 순차 추천기로, 단기 사용자 의도는 self-attention으로, 장기 선호도는 metric learning으로 모델링하며, 다양한 데이터셋에서 최첨단 성능을 달성한다.

ABSTRACT

In this paper, we propose a novel sequence-aware recommendation model. Our model utilizes self-attention mechanism to infer the item-item relationship from user's historical interactions. With self-attention, it is able to estimate the relative weights of each item in user interaction trajectories to learn better representations for user's transient interests. The model is finally trained in a metric learning framework, taking both short-term and long-term intentions into consideration. Experiments on a wide range of datasets on different domains demonstrate that our approach outperforms the state-of-the-art by a wide margin.

연구 동기 및 목표

  • 더 나은 순차 추천을 위해 사용자의 이력 내 아이템 간 상호작용을 모델링해야 할 필요성을 제시한다.
  • 최근 상호작용으로부터 단기 사용 의도를 포착하기 위한 self-attention 기반 모듈을 도입한다.
  • 자체 주의 표현과 협업 metric learning 구성요소를 연결하여 장기 사용자 선호를 모델링한다.
  • dense 및 sparse 데이터셋에서 AttRec를 포괄적으로 평가하고 하이퍼파라미터 및 어텐션 동작을 분석한다.

제안 방법

  • 쿼리, 키, 값이 마지막 L개의 상호작용 아이템에서 도출되는 self-attention 모듈을 사용하여 사용자의 의도에 대한 주의력 있는 단기 표현을 생성한다.
  • 투사 전에 쿼리와 키에 더해지는 위치(시간) 임베딩을 통해 시간 정보를 포함한다.
  • 잠재 요인 U(사용자)와 V(아이템)를 통해 장기 사용자 선호도와 아이템 임베딩을 표현하고 유클리드 거리로 상호작용을 모델링한다.
  • 단기 신호(m_t via self-attention)와 장기 신호를 하나의 점수 y_{t+1} = ω ||U_u - V_{H^u_{t+1}}||^2 + (1-ω) ||m^u_t - X^u_{t+1}||^2로 결합한다.
  • 양성/음성 아이템에 대한 페어와이즈 마진 기반 힌지 손실로 학습하고 L2로 정규화하며, 적응형 그래디언트 최적화를 사용한다.
  • L(단기 창), T(다음 아이템들) 및 기타 하이퍼파라미터를 격자 검색으로 설정하고, 다수의 데이터셋에서 HR@50 및 MRR로 평가한다.

실험 결과

연구 질문

  • RQ1AttRec이 다양한 순차 추천 데이터셋에서 최첨단 성능을 달성하는가?
  • RQ2self-attention 구성요소가 단기 의도 및 전체 랭킹 성능 모델링에 어떤 영향을 미치는가?
  • RQ3주요 하이퍼파라미터(예: L, 집계 방법, ω, d)가 성능에 미치는 영향은 무엇인가?
  • RQ4AttRec이 밀집한 데이터셋과 희박한 데이터셋 모두에서 잘 작동하고 짧은 시퀀스를 효과적으로 처리할 수 있는가?

주요 결과

  • AttRec은 12 개의 벤치마크 데이터셋에서 HR@50와 MRR 지표에 대해 모든 베이스라인을 지속적으로 능가한다.
  • 적소 실험에서 self-attention를 포함하면 비주의적 버전에 비해 성능이 향상되며, 일부 데이터셋에서는 이를 사용하지 않아도 여전히 경쟁력이 있다.
  • Self-attention 어텐션 맵은 해석 가능하며, 단순히 가장 최근 아이템을 선호하기보다는 과거 행동에 걸친 가중치가 다양하게 나타난다.
  • 주의 출력을 결합하는 집계 방법은 성능에 영향을 주며, 일반적으로 평균(mean) 집계가 기본값으로 사용된다.
  • 모델은 단기 의도( self-attention를 통해)와 장기 선호도(잠재 요인)를 통합하여 개선된 추천을 이끈다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.