[논문 리뷰] The Unfairness of Multifactorial Bias in Recommendation
이 논문은 인기 편향과 긍정 편향의 결합(다요인 편향)이 추천 시스템에서 노출 공정성에 미치는 영향을 연구하고, 거의 정확도 손실 없이 편향을 완화하기 위한 전처리 방법으로 분위수 기반 등급 변환을 제안한다.
Popularity bias and positivity bias are two prominent sources of bias in recommender systems. Both arise from input data, propagate through recommendation models, and lead to unfair or suboptimal outcomes. Popularity bias occurs when a small subset of items receives most interactions, while positivity bias stems from the over-representation of high rating values. Although each bias has been studied independently, their combined effect, to which we refer to as multifactorial bias, remains underexplored. In this work, we examine how multifactorial bias influences item-side fairness, focusing on exposure bias, which reflects the unequal visibility of items in recommendation outputs. Through simulation studies, we find that positivity bias is disproportionately concentrated on popular items, further amplifying their over-exposure. Motivated by this insight, we adapt a percentile-based rating transformation as a pre-processing strategy to mitigate multifactorial bias. Experiments using six recommendation algorithms across four public datasets show that this approach improves exposure fairness with negligible accuracy loss. We also demonstrate that integrating this pre-processing step into post-processing fairness pipelines enhances their effectiveness and efficiency, enabling comparable or better fairness with reduced computational cost. These findings highlight the importance of addressing multifactorial bias and demonstrate the practical value of simple, data-driven pre-processing methods for improving fairness in recommender systems.
연구 동기 및 목표
- 다요인 편향(인기도 + 긍정도)이 추천 시스템에서 아이템 노출 공정성에 미치는 영향 조사.
- 공개 데이터셋에서 긍정 편향과 아이템 인기도 간의 상관관계 분석.
- 다요인 편향을 완화하기 위해 분위수 기반 등급 변환을 적용하고 평가.
- 제안된 전처리 방법을 사용할 때 포스트 처리 공정 공정성 파이프라인의 효율성 향상 평가.
제안 방법
- 4개 공용 데이터셋(Goodreads, MovieLens, Google Local Data, Yelp)에서 인기 편향과 긍정 편향 특성화.
- 아이템 및 등급 값 요인이 사용자 평점에 영향을 미치는 과정을 다요인 편향으로 정의.
- 인기 아이템의 긍정 편향이 노출 공정성과 정확도에 미치는 영향을 시뮬레이션으로 연구.
- 아이템 프로필에 대해 분위수 기반 등급 변환을 적용(등급을 분위수 값으로 변환)하여 인기 아이템의 긍정 편향을 줄임.
- 여섯 가지 추천기(BiasedMF, SVD++, WRMF, ListRank, UserKNN, ItemKNN)를 원시 등급과 분위수 변환 데이터를 모두 사용해 네 가지 데이터셋에서 평가.
- 공정성 지표(IA, LIA, EE)와 정확도 지표(Precision, nDCG)를 조건 간 비교.
실험 결과
연구 질문
- RQ1다요인 편향이 추천에서 아이템 노출 공정성에 어떤 영향을 미치는가?
- RQ2긍정 편향이 인기 아이템에 더 집중되어 있는가, 그리고 이것이 공정성에 어떤 영향을 미치는가?
- RQ3분위수 기반 등급 변환이 다요인 편향을 완화하고 노출 공정성을 정확도 손실 없이 개선할 수 있는가?
- RQ4분위수 변환으로의 전처리가 포스트 프로세싱 공정성 방법의 효율성을 향상시키는가?
- RQ5다양한 데이터셋과 추천 알고리즘에서 결과가 일관되는가?
주요 결과
- 긍정 편향은 인기 아이템에서 더 강하게 나타나며 추천에서 이들의 과도한 노출을 증폭한다.
- 인기 아이템의 긍정 편향을 완화하면 노출 공정성 지표(IA, LIA, EE)가 개선되지만 정확도에는 가변적인 영향이 있다.
- 등급을 분위수 값으로 변환하면 입력 데이터의 다요인 편향이 감소하고 데이터셋과 모델 전반에서 공정한 노출로 이어진다.
- 분위수 변환 데이터를 입력으로 사용할 때 여러 알고리즘에서 공정성과 정확도 모두 개선되는 경우가 많고(ListRank가 Yelp에서 제외된 경우를 제외하고는) 일반적으로 그렇다.
- 전처리로 분위수 변환을 사용하면 포스트 프로세싱 공정성 파이프라인의 초기 추천 목록을 더 짧게 설정하더라도 공정성을 유지할 수 있다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.