[논문 리뷰] Debiased Collaborative Filtering with Kernel-Based Causal Balancing
이 논문은 IPS와 DR 편향 보정 협업 필터링에 대한 적응형 커널 기반 균형화로 성향 점수 학습을 제시하여 인과적 균형 제약을 더 잘 만족시키고 평점 예측의 편향을 줄이는 것을 목표로 한다.
Debiased collaborative filtering aims to learn an unbiased prediction model by removing different biases in observational datasets. To solve this problem, one of the simple and effective methods is based on the propensity score, which adjusts the observational sample distribution to the target one by reweighting observed instances. Ideally, propensity scores should be learned with causal balancing constraints. However, existing methods usually ignore such constraints or implement them with unreasonable approximations, which may affect the accuracy of the learned propensity scores. To bridge this gap, in this paper, we first analyze the gaps between the causal balancing requirements and existing methods such as learning the propensity with cross-entropy loss or manually selecting functions to balance. Inspired by these gaps, we propose to approximate the balancing functions in reproducing kernel Hilbert space and demonstrate that, based on the universal property and representer theorem of kernel functions, the causal balancing constraints can be better satisfied. Meanwhile, we propose an algorithm that adaptively balances the kernel function and theoretically analyze the generalization error bound of our methods. We conduct extensive experiments to demonstrate the effectiveness of our methods, and to promote this research direction, we have released our project at https://github.com/haoxuanli-pku/ICLR24-Kernel-Balancing.
연구 동기 및 목표
- 관찰적 협업 필터링 데이터의 편향을 동기 부여하고 해결한다.
- RKHS에서 인과적 균형을 강제하여 성향 점수 학습의 격차를 줄인다.
- 균형 제약을 만족시키고 일반화 오차를 줄이기 위해 적응적이고 최악의 경우 커널 균형화를 제안한다.
- 제안된 커널 기반 방법에 대한 이론적 보장 및 일반화 경계를 제공한다.
- IPS 및 DR 추정기 전반에 걸친 실제 데이터셋에서 경험적 이득을 입증한다.
제안 방법
- IPS 및 DR 손실과 연결된 편향 보정 CF를 형식화하고 균형 제약을 성향 학습과 연결한다.
- 모든 φ에 대해 인과적 균형을 만족시키도록 Gaussian 또는 exponential 커널을 사용하여 RKHS에서 균형 함수를 근사한다.
- RKHS 함수 전체에 걸친 잠재적 편향을 최소화하기 위해 최악의 경우 커널 균형화(WKB)를 개발한다.
- 데이터 기반의 기준으로 가장 영향력 있는 커널 함수를 선택하기 위해 적응형 커널 균형화(AKB)를 도입한다.
- 예측, 균형 가중치, 보간 모델이 공동으로 업데이트되는 교대 학습 프레임워크를 제시한다(Algorithm 1과 같이).
- KBIPS와 KBDR에 대해 RKHS에서 일반화 오차 경계를 도출하고 WKB/AKB를 통한 편향 제어를 보인다.
실험 결과
연구 질문
- RQ1편향 제거를 위한 성향 학습에서 인과 균형 제약을 어떻게 더 잘 만족시킬 수 있는가?
- RQ2RKHS 기반 커널 균형이 모든 φ에 대한 균형을 유한 함수 접근법보다 더 효과적으로 근사할 수 있는가?
- RQ3적응적 또는 최악의 경우 균형화를 갖춘 커널 기반 성향 추정기(KBIPS/KBDR)가 편향을 줄이고 예측 성능을 개선하는가?
- RQ4협업 필터링의 커널 기반 디바이어싱 방법에 대한 이론적 일반화 보장은 무엇인가?
- RQ5표준 데이터셋에서 커널 기반 방법이 기존 IPS/DR 디바이어싱 베이스라인과 어떻게 비교되는가?
주요 결과
| Method | Coat AUC | Coat NDCG@5 | Coat F1@5 | Music AUC | Music NDCG@5 | Music F1@5 | Product AUC | Product NDCG@20 | Product F1@20 |
|---|---|---|---|---|---|---|---|---|---|
| MF | 0.703 ±0.006 | 0.605 ±0.012 | 0.467 ±0.007 | 0.673 ±0.001 | 0.635 ±0.002 | 0.306 ±0.002 | 0.753 ±0.001 | 0.449 ±0.002 | 0.124 ±0.002 |
| + IPS | 0.717 ±0.007 | 0.617 ±0.009 | 0.473 ±0.008 | 0.678 ±0.001 | 0.638 ±0.002 | 0.318 ±0.002 | 0.755 ±0.004 | 0.452 ±0.010 | 0.131 ±0.004 |
| + SNIPS | 0.714 ±0.012 | 0.614 ±0.012 | 0.474 ±0.009 | 0.683 ±0.002 | 0.639 ±0.002 | 0.316 ±0.002 | 0.754 ±0.003 | 0.453 ±0.004 | 0.126 ±0.003 |
| + ASIPS | 0.719 ±0.009 | 0.618 ±0.012 | 0.476 ±0.009 | 0.679 ±0.003 | 0.640 ±0.003 | 0.319 ±0.003 | 0.757 ±0.005 | 0.474 ±0.007 | 0.130 ±0.005 |
| + IPS-V2 | 0.726 ±0.005 | 0.627 ±0.009 | 0.479 ±0.008 | 0.685 ±0.002 | 0.646 ±0.003 | 0.320 ±0.002 | 0.764 ±0.001 | 0.476 ±0.003 | 0.135 ±0.003 |
| + RKBIPS-Exp | 0.714 ±0.003 | 0.618 ±0.010 | 0.474 ±0.007 | 0.676 ±0.002 | 0.642 ±0.003 | 0.318 ±0.002 | 0.763 ±0.001 | 0.463 ±0.007 | 0.134 ±0.002 |
| + RKBIPS-Gau | 0.715 ±0.005 | 0.619 ±0.010 | 0.475 ±0.008 | 0.678 ±0.001 | 0.640 ±0.004 | 0.315 ±0.003 | 0.760 ±0.003 | 0.470 ±0.008 | 0.133 ±0.003 |
| + WKBIPS-Exp | 0.723 ±0.004 | 0.624 ±0.009 | 0.480 ±0.007 | 0.687 ±0.002 | 0.654 ±0.002 | 0.322 ±0.002 | 0.765 ±0.003 | 0.475 ±0.007 | 0.138 ±0.003 |
| + WKBIPS-Gau | 0.722 ±0.004 | 0.625 ±0.008 | 0.479 ±0.007 | 0.686 ±0.002 | 0.650 ±0.002 | 0.321 ±0.002 | 0.763 ±0.003 | 0.476 ±0.007 | 0.137 ±0.003 |
| + AKBIPS-Exp | 0.732* ±0.004 | 0.636* ±0.006 | 0.483 ±0.006 | 0.689* ±0.001 | 0.658* ±0.002 | 0.324* ±0.002 | 0.766* ±0.003 | 0.478 ±0.009 | 0.138* ±0.003 |
| + AKBIPS-Gau | 0.730* ±0.003 | 0.633 ±0.008 | 0.484 ±0.007 | 0.688* ±0.003 | 0.655* ±0.003 | 0.324* ±0.002 | 0.767* ±0.003 | 0.480 ±0.009 | 0.139* ±0.003 |
| + DR | 0.718 ±0.008 | 0.623 ±0.009 | 0.474 ±0.007 | 0.684 ±0.002 | 0.658 ±0.003 | 0.326 ±0.002 | 0.755 ±0.008 | 0.462 ±0.010 | 0.135 ±0.005 |
| + DR-JL | 0.723 ±0.005 | 0.629 ±0.007 | 0.479 ±0.005 | 0.685 ±0.002 | 0.653 ±0.002 | 0.324 ±0.002 | 0.766 ±0.002 | 0.467 ±0.005 | 0.136 ±0.003 |
| + MRDR-JL | 0.727 ±0.005 | 0.627 ±0.008 | 0.480 ±0.008 | 0.684 ±0.002 | 0.652 ±0.003 | 0.325 ±0.002 | 0.768 ±0.005 | 0.473 ±0.007 | 0.139 ±0.004 |
| + DR-BIAS | 0.726 ±0.004 | 0.629 ±0.009 | 0.482 ±0.007 | 0.685 ±0.002 | 0.653 ±0.002 | 0.325 ±0.003 | 0.768 ±0.003 | 0.477 ±0.006 | 0.137 ±0.004 |
| + DR-MSE | 0.727 ±0.007 | 0.631 ±0.008 | 0.484 ±0.007 | 0.687 ±0.002 | 0.657 ±0.003 | 0.327 ±0.003 | 0.770 ±0.003 | 0.480 ±0.006 | 0.140 ±0.003 |
| + MR | 0.724 ±0.004 | 0.636 ±0.006 | 0.481 ±0.006 | 0.691 ±0.002 | 0.647 ±0.002 | 0.316 ±0.003 | 0.776 ±0.005 | 0.483 ±0.006 | 0.142 ±0.003 |
| + TDR | 0.714 ±0.006 | 0.634 ±0.011 | 0.483 ±0.008 | 0.688 ±0.003 | 0.662 ±0.002 | 0.329 ±0.002 | 0.772 ±0.003 | 0.486 ±0.005 | 0.140 ±0.003 |
| + TDR-JL | 0.731 ±0.005 | 0.639 ±0.007 | 0.484 ±0.007 | 0.689 ±0.002 | 0.656 ±0.004 | 0.327 ±0.003 | 0.772 ±0.003 | 0.489 ±0.005 | 0.142 ±0.003 |
| + SDR | 0.735 ±0.005 | 0.640 ±0.007 | 0.484 ±0.006 | 0.688 ±0.002 | 0.661 ±0.003 | 0.329 ±0.002 | 0.773 ±0.001 | 0.491 ±0.003 | 0.143 ±0.003 |
| + DR-V2 | 0.734 ±0.007 | 0.639 ±0.009 | 0.487 ±0.006 | 0.690 ±0.002 | 0.660 ±0.005 | 0.328 ±0.002 | 0.773 ±0.003 | 0.488 ±0.006 | 0.142 ±0.004 |
| + RKBDR-Exp | 0.730 ±0.003 | 0.631 ±0.005 | 0.482 ±0.006 | 0.682 ±0.002 | 0.648 ±0.003 | 0.323 ±0.002 | 0.765 ±0.004 | 0.460 ±0.006 | 0.138 ±0.003 |
| + RKBDR-Gau | 0.726 ±0.005 | 0.630 ±0.008 | 0.480 ±0.008 | 0.683 ±0.002 | 0.652 ±0.003 | 0.325 ±0.002 | 0.766 ±0.003 | 0.469 ±0.007 | 0.134 ±0.004 |
| + WKBDR-Exp | 0.735 ±0.005 | 0.637 ±0.009 | 0.483 ±0.006 | 0.685 ±0.003 | 0.654 ±0.003 | 0.325 ±0.002 | 0.773 ±0.003 | 0.489 ±0.008 | 0.142 ±0.003 |
| + WKBDR-Gau | 0.732 ±0.003 | 0.638 ±0.007 | 0.483 ±0.005 | 0.687 ±0.001 | 0.655 ±0.002 | 0.327 ±0.002 | 0.773 ±0.002 | 0.490 ±0.005 | 0.142 ±0.004 |
| + AKBDR-Exp | 0.745* ±0.004 | 0.645 ±0.008 | 0.493* ±0.007 | 0.692 ±0.002 | 0.661 ±0.002 | 0.328 ±0.002 | 0.782* ±0.003 | 0.498* ±0.008 | 0.147* ±0.003 |
| + AKBDR-Gau | 0.746* ±0.004 | 0.646* ±0.008 | 0.492 ±0.007 | 0.694* ±0.002 | 0.664* ±0.002 | 0.332* ±0.002 | 0.782* ±0.005 | 0.503* ±0.006 | 0.148* ±0.004 |
- 적응형 커널 균형화(AKB)는 다양한 데이터셋과 커널에서 베이스라인 균형화 방법에 비해 디바이어싱 성능을 일관되게 향상시킨다.
- AKB는 Gaussian 또는 exponential 커널 중 어느 것을 사용하더라도 Coat, Music, Product 데이터셋에서 가장 높은 전체 AUC, NDCG@5, F1 점수를 달성한다.
- 커널 균형화 방법(KBIPS/KBDR)은 무작위 커널 균형화(RKB) 및 모먼트 균형(MB) 베이스라인보다 우수하며, AKB가 가장 큰 이득을 제공한다.
- RKHS 가정 하의 커널 기반 균형화 하에서 KBIPS/KBDR의 일반화 경계가 감소하는 이론적 일반화 보장을 제시한다.
- 실험적으로 AKBDR이 다수의 IPS/DR 베이스라인 대비 통계적으로 유의미한 개선을 보이며(예: AKBDR-Exp 및 AKBDR-Gau).
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.