QUICK REVIEW

[논문 리뷰] Managing Popularity Bias in Recommender Systems with Personalized Re-ranking

Himan Abdollahpouri, Robin Burke|arXiv (Cornell University)|2019. 01. 22.

Recommender Systems and Techniques참고 문헌 22인용 수 83

한 줄 요약

본 논문은 xQuAD-스타일 다각화를 개인화된 재정렬 프레임워크에 적용하여 추천 시스템의 인기 편향을 줄이고, 어떤 추천 알고리즘의 출력 후 롱테일 아이템을 홍보함으로써 이를 개선한다. Binary와 Smooth 변형을 규제 기반 기준선과 비교한다.

ABSTRACT

Many recommender systems suffer from popularity bias: popular items are recommended frequently while less popular, niche products, are recommended rarely or not at all. However, recommending the ignored products in the `long tail' is critical for businesses as they are less likely to be discovered. In this paper, we introduce a personalized diversification re-ranking approach to increase the representation of less popular items in recommendations while maintaining acceptable recommendation accuracy. Our approach is a post-processing step that can be applied to the output of any recommender system. We show that our approach is capable of managing popularity bias more effectively, compared with an existing method based on regularization. We also examine both new and existing metrics to measure the coverage of long-tail items in the recommendation.

연구 동기 및 목표

추천 시스템에서의 인기 편향 문제와 롱테일 아이템 표현의 중요성을 동기화한다.
정확도를 보존하면서 롱테일 커버리지를 개선하도록 기존 추천 목록을 조정하는 포스트-프로세스 재랭킹 접근법을 제안한다.
개별 사용자의 롱테일 아이템 관심도에 따라 롱테일 프로모션의 가중치를 통해 개인화를 가능하게 한다.
다 datasets에서 재랭킹 접근법을 정규화 기반 기준선과 비교하여 롱테일 커버리지와 랭킹 품질을 평가한다.]
method1
method2
method3
method4
method5
method6
method7
method8

제안 방법

xQuAD 결과 다각화 프레임워크를 재정렬 출력을 제어하는 데 적용한다.
기본 예측 적합도와 단기-장기(head) 범주 간 개인화된 다각화 항을 결합하는 재랭킹 점수를 형식화한다(Gamma와 Gamma′).
다각화 항을 추정하기 위한 두 가지 변형을 도입한다: 이진형 xQuAD(카테고리 커버리지 지시자)와 매끄러운 xQuAD(비율 기반 커버리지).
식 4를 사용하여 정확도와 다각화를 균형 있게 하며 기본 추천기에서 P(v|u)와 사용자 선호도 P(d|u) (단기-헤드 대 롱테일)를 계산한다.
초기 정렬 목록 R에서 바람직한 길이의 최종 목록 S를 생성하기 위해 재랭킹을 반복적으로 적용하고, 바이어스-정확도 트레이드오프를 제어하는 구성 가능한 람다를 사용한다.
롱테일 커버리지 지표(APLT, ACLT)와 정확도 지표(NDCG), 노출 측정을 위한 ARP를 포함하여 평가한다.
데이터셋은 MovieLens 1M과 Epinions를 사용하며 항목은 평점 분포를 기준으로 상단 ~80%과 하단 ~20%로 구분된다.

실험 결과

연구 질문

RQ1개인화된 재랭킹이 추천 정확도를 보존하면서 인기 편향을 줄일 수 있는가?
RQ2Binary와 Smooth xQuAD 변형이 롱테일 커버리지와 순위 품질 측면에서 정규화된 롱테일 다각화 기준선과 비교하여 어떤 차이를 보이는가?
RQ3데이터셋의 희소성(MovieLens 대 Epinions)이 롱테일 프로모션 및 다양성-정확도 트레이드오프에 미치는 영향은 무엇인가?
RQ4ARP만으로 롱테일 프로모션을 충분히 평가할 수 있는가, 아니면 APLT 및 ACLT와 같은 추가 지표를 함께 사용해야 하는가?
RQ5추천 시스템의 멀티-이해관계자 환경으로 이 접근법을 확장할 수 있는가?

주요 결과

재랭킹 방법이 정규화 기반 기준선에 비해 롱테일 노출을 개선하며, Smooth xQuAD가 종종 더 강한 롱테일 커버리지를 제공한다.
Binary xQuAD는 목록을 최소한으로 조정하는 경향이 있으며, Smooth xQuAD는 롱테일 아이템 증가와 랭킹 품질 유지 사이의 균형을 맞춘다.
LT-Reg는 평가된 메트릭(APLT 및 ACLT)에서 롱테일 아이템 프로모션에 덜 효과적이다.
두 데이터셋 모두에서 ARP만으로는 롱테일 다양성을 fully 포착하지 못하며, 효과를 평가하려면 APLT 및 ACLT와 함께 평가해야 한다.
이 접근법은 재랭킹이 NDCG의 중간 손실로도 더 나은 롱테일 표현을 달성할 수 있음을 보여주며, 다양성-정확도 트레이드오프를 우호적으로 시사한다.
결과적으로 Epinions(더 희소한 데이터셋)이 MovieLens보다 롱테일 다각화에 더 큰 도전을 제시하며 Binary와 Smooth variant의 상대적 성능이 다르게 나타난다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.