Skip to main content
QUICK REVIEW

[논문 리뷰] Recommendations as Treatments: Debiasing Learning and Evaluation

Tobias Schnabel, Adith Swaminathan|arXiv (Cornell University)|2016. 02. 17.
Advanced Bandit Algorithms Research참고 문헌 45인용 수 143
한 줄 요약

본 논문은 MNAR 데이터 하에서 학습 및 평가의 편향을 줄이기 위한 인과적 개입으로 추천을 다루고, 성향 가중 추정량과 이론적 보장 및 강건한 성향 추정치를 갖춘 확장 가능한 행렬 분해 접근법을 제안한다.

ABSTRACT

Most data for evaluating and training recommender systems is subject to selection biases, either through self-selection by the users or through the actions of the recommendation system itself. In this paper, we provide a principled approach to handling selection biases, adapting models and estimation techniques from causal inference. The approach leads to unbiased performance estimators despite biased data, and to a matrix factorization method that provides substantially improved prediction performance on real-world data. We theoretically and empirically characterize the robustness of the approach, finding that it is highly practical and scalable.

연구 동기 및 목표

  • 추천 시스템 데이터의 선택 편향을 인과 추론의 개입으로 체계화하여 해결한다.
  • MNAR 조건에서 일반 지표에 대한 편향 없는 성능 추정치를 개발한다(예: MAE, MSE, DCG).
  • biases를 학습에 적용하기 위한 ERM 프레임워크를 제안하고 확장 가능한 행렬 분해 방법을 도출한다.
  • 성향 추정 방법과 잘못 명시된 성향에 대한 강건성을 조사한다.

제안 방법

  • 성향 가중화(IPS)와 완전 사례 아이디어를 활용하여 MAE, MSE, DCG 및 관련 지표에 대한 편향 없는 추정치를 만든다.
  • 성향 하에서의 경험적 위험 최소화(ERM) 목적함수를 형식화하고 일반화 경계를 도출한다.
  • 단일 항목 가중치가 1/P_{u,i}인 표준 불완전 MF와 유사하지만 항목별 가중치를 갖는 성향-가중 행렬 분해 목적함수를 도출한다.
  • IPS의 분산을 줄이기 위한 자기정규화 SNIPS를 도입하여 작은 편향과 함께 분산을 감소시킨다.
  • 실험적(알려진 P) 설정과 관측적(추정된 P) 설정을 구분하고 성향 오-명시화에 대한 강건성을 분석한다.
  • Naive Bayes와 로지스틱 회귀(사용자/항목 편향 포함)로 성향 추정 방법을 제공한다.

실험 결과

연구 질문

  • RQ1추천 시스템에서의 선택 편향이 평가 및 학습에 어떻게 왜곡을 일으키는지, 인과 추론 기법으로 편향 없는 추정치를 얻을 수 있는가?
  • RQ2성향 기반 추정치를 통해 MNAR 데이터에서 일반 지표(MAE, MSE, DCG)에 대한 편향 없는 평가가 가능한가?
  • RQ3선택 편향을 고려하면서 성능을 유지하는 확장 가능한 행렬 분해 방법을 개발할 수 있는가?
  • RQ4관측적 설정에서 성향은 어떻게 추정되어야 하며, 추정 오명에 대해 접근 방식은 얼마나 강건한가?

주요 결과

MAE 참값MAE IPSMAE SNIPSMAE NaiveDCG@50 참값DCG@50 IPSDCG@50 SNIPSDCG@50 Naive
REC_ONES0.1020.102 ± 0.0070.102 ± 0.0070.011 ± 0.00130.7630.64 ± 0.7530.66 ± 0.74153.07 ± 2.13
REC_FOURS0.0260.026 ± 0.0000.026 ± 0.0000.173 ± 0.00152.0051.98 ± 0.4152.08 ± 0.58313.48 ± 2.36
ROTATE2.5792.581 ± 0.0312.579 ± 0.0121.168 ± 0.00312.9013.00 ± 0.8512.99 ± 0.831.38 ± 0.09
SKEWED1.3061.304 ± 0.0121.304 ± 0.0090.912 ± 0.00224.5924.55 ± 0.9224.58 ± 0.9354.87 ± 1.03
COARSENED1.3201.314 ± 0.0151.318 ± 0.0050.387 ± 0.00246.4546.45 ± 0.5346.44 ± 0.70293.27 ± 1.99
  • IPS 및 SNIPS는 MNAR에서 편향된 상태로 남는 바쁜(naive) 방법과 비교하여 MAE 및 DCG에 대해 편향이 없는(IPS) 또는 분산이 낮은 편향 추정(SNIPS)을 제공한다.
  • 성향-스코어 MF(MF-IPS)는 다양한 MNAR 심각도에서 무가중 MF에 비해 평점 예측 정확도(낮은 MSE)를 개선한다(세미-합성 데이터 기준).
  • 성향 가중을 사용한 경험적 위험 최소화는 유한 가설 공간에 대한 일반화 보장을 제공한다.
  • 추정된 성향은 불완전한 경우에도 편향 없는 평가 및 학습 성능을 제공하거나 강건하게 만들며, 종종 naive 접근법보다 우수한 경우가 많다.
  • 제안된 방법은 최첨단 결합 가능도 MNAR 방법과 비교할 때 확장성이 더 뛰어나고 실제 데이터셋(Yahoo! R3 및 Coat Shopping)에서 경쟁력이 있다.
  • 논문은 MNAR 평가를 위한 구현체와 벤치마크 데이터셋을 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.