Skip to main content
QUICK REVIEW

[論文レビュー] Debiased Collaborative Filtering with Kernel-Based Causal Balancing

Haoxuan Li, Chunyuan Zheng|arXiv (Cornell University)|Apr 30, 2024
Bayesian Modeling and Causal Inference被引用数 7
ひとこと要約

本論文は適応カーネルベースのバランシングを用いてIPSおよびDRデバイアスのある協調フィルタリングの傾向スコアを学習し、因果バランス制約をより満たし、評価予測のバイアスを低減することを目的としている。

ABSTRACT

Debiased collaborative filtering aims to learn an unbiased prediction model by removing different biases in observational datasets. To solve this problem, one of the simple and effective methods is based on the propensity score, which adjusts the observational sample distribution to the target one by reweighting observed instances. Ideally, propensity scores should be learned with causal balancing constraints. However, existing methods usually ignore such constraints or implement them with unreasonable approximations, which may affect the accuracy of the learned propensity scores. To bridge this gap, in this paper, we first analyze the gaps between the causal balancing requirements and existing methods such as learning the propensity with cross-entropy loss or manually selecting functions to balance. Inspired by these gaps, we propose to approximate the balancing functions in reproducing kernel Hilbert space and demonstrate that, based on the universal property and representer theorem of kernel functions, the causal balancing constraints can be better satisfied. Meanwhile, we propose an algorithm that adaptively balances the kernel function and theoretically analyze the generalization error bound of our methods. We conduct extensive experiments to demonstrate the effectiveness of our methods, and to promote this research direction, we have released our project at https://github.com/haoxuanli-pku/ICLR24-Kernel-Balancing.

研究の動機と目的

  • 観測データにおける協調フィルタリングの偏りを動機づけ、対処する。
  • RKHSにおける因果バランスを強制することで propensity 学習のギャップを埋める。
  • バランス制約を満たし一般化誤差を抑えるために適応的かつ最悪ケースのカーネルバランシングを提案する。
  • 提案するカーネルベース手法に対する理論的保証と一般化境界を提供する。
  • IPSおよびDR推定量の枠組みで実世界データセットにおける経験的利得を示す。

提案手法

  • IPSとDRの損失を用いてデ바イアストCFを定式化し、バランシング制約を傾向スコア学習へ結びつける。
  • 全ての φ に対して因果バランスを満たすようガウス核や指数核を用いてRKHS内のバランス関数を近似する。
  • 潜在的なバイアスを最小化するための最悪ケースカーネルバランシング(WKB)を開発する。
  • データ駆動の基準で最も影響力のあるカーネル関数を選択する適応カーネルバランシング(AKB)を導入する。
  • 予測、バランスウェイト、および欠損推定モデルを同時に更新する反復トレーニング枠組みを提供する(アルゴリズム1のように)。
  • KBIPSおよびKBDRのRKHSにおける一般化誤差境界を導出し、WKB/AKBによるバイアス制御を示す。

実験結果

リサーチクエスチョン

  • RQ1デバイアスCSの propensity 学習において因果バランス制約をどのようにより適切に満たすことができるか。
  • RQ2RKHSベースのカーネルバランシングは有限関数アプローチよりも全φのバランスをより効果的に近似できるか。
  • RQ3適応的または最悪ケースのバランシングを用いたカーネルベースの propensity 推定量(KBIPS/KBDR)はバイアスを低減し予測性能を改善するか。
  • RQ4協調フィルタリングのカーネルベースデバイアリング手法の理論的一般化保証は何か。
  • RQ5標準的なデータセットに対して、カーネルベース手法は既存のIPS/DRデバイア Baselineとどう比較されるか。

主な発見

手法Coat AUCCoat NDCG@5Coat F1@5Music AUCMusic NDCG@5Music F1@5Product AUCProduct NDCG@20Product F1@20
MF0.703 ±0.0060.605 ±0.0120.467 ±0.0070.673 ±0.0010.635 ±0.0020.306 ±0.0020.753 ±0.0010.449 ±0.0020.124 ±0.002
+ IPS0.717 ±0.0070.617 ±0.0090.473 ±0.0080.678 ±0.0010.638 ±0.0020.318 ±0.0020.755 ±0.0040.452 ±0.0100.131 ±0.004
+ SNIPS0.714 ±0.0120.614 ±0.0120.474 ±0.0090.683 ±0.0020.639 ±0.0020.316 ±0.0020.754 ±0.0030.453 ±0.0040.126 ±0.003
+ ASIPS0.719 ±0.0090.618 ±0.0120.476 ±0.0090.679 ±0.0030.640 ±0.0030.319 ±0.0030.757 ±0.0050.474 ±0.0070.130 ±0.005
+ IPS-V20.726 ±0.0050.627 ±0.0090.479 ±0.0080.685 ±0.0020.646 ±0.0030.320 ±0.0020.764 ±0.0010.476 ±0.0030.135 ±0.003
+ RKBIPS-Exp0.714 ±0.0030.618 ±0.0100.474 ±0.0070.676 ±0.0020.642 ±0.0030.318 ±0.0020.763 ±0.0010.463 ±0.0070.134 ±0.002
+ RKBIPS-Gau0.715 ±0.0050.619 ±0.0100.475 ±0.0080.678 ±0.0010.640 ±0.0040.315 ±0.0030.760 ±0.0030.470 ±0.0080.133 ±0.003
+ WKBIPS-Exp0.723 ±0.0040.624 ±0.0090.480 ±0.0070.687 ±0.0020.654 ±0.0020.322 ±0.0020.765 ±0.0030.475 ±0.0070.138 ±0.003
+ WKBIPS-Gau0.722 ±0.0040.625 ±0.0080.479 ±0.0070.686 ±0.0020.650 ±0.0020.321 ±0.0020.763 ±0.0030.476 ±0.0070.137 ±0.003
+ AKBIPS-Exp0.732* ±0.0040.636* ±0.0060.483 ±0.0060.689* ±0.0010.658* ±0.0020.324* ±0.0020.766* ±0.0030.478 ±0.0090.138* ±0.003
+ AKBIPS-Gau0.730* ±0.0030.633 ±0.0080.484 ±0.0070.688* ±0.0030.655* ±0.0030.324* ±0.0020.767* ±0.0030.480 ±0.0090.139* ±0.003
+ DR0.718 ±0.0080.623 ±0.0090.474 ±0.0070.684 ±0.0020.658 ±0.0030.326 ±0.0020.755 ±0.0080.462 ±0.0100.135 ±0.005
+ DR-JL0.723 ±0.0050.629 ±0.0070.479 ±0.0050.685 ±0.0020.653 ±0.0020.324 ±0.0020.766 ±0.0020.467 ±0.0050.136 ±0.003
+ MRDR-JL0.727 ±0.0050.627 ±0.0080.480 ±0.0080.684 ±0.0020.652 ±0.0030.325 ±0.0020.768 ±0.0050.473 ±0.0070.139 ±0.004
+ DR-BIAS0.726 ±0.0040.629 ±0.0090.482 ±0.0070.685 ±0.0020.653 ±0.0020.325 ±0.0030.768 ±0.0030.477 ±0.0060.137 ±0.004
+ DR-MSE0.727 ±0.0070.631 ±0.0080.484 ±0.0070.687 ±0.0020.657 ±0.0030.327 ±0.0030.770 ±0.0030.480 ±0.0060.140 ±0.003
+ MR0.724 ±0.0040.636 ±0.0060.481 ±0.0060.691 ±0.0020.647 ±0.0020.316 ±0.0030.776 ±0.0050.483 ±0.0060.142 ±0.003
+ TDR0.714 ±0.0060.634 ±0.0110.483 ±0.0080.688 ±0.0030.662 ±0.0020.329 ±0.0020.772 ±0.0030.486 ±0.0050.140 ±0.003
+ TDR-JL0.731 ±0.0050.639 ±0.0070.484 ±0.0070.689 ±0.0020.656 ±0.0040.327 ±0.0030.772 ±0.0030.489 ±0.0050.142 ±0.003
+ SDR0.735 ±0.0050.640 ±0.0070.484 ±0.0060.688 ±0.0020.661 ±0.0030.329 ±0.0020.773 ±0.0010.491 ±0.0030.143 ±0.003
+ DR-V20.734 ±0.0070.639 ±0.0090.487 ±0.0060.690 ±0.0020.660 ±0.0050.328 ±0.0020.773 ±0.0030.488 ±0.0060.142 ±0.004
+ RKBDR-Exp0.730 ±0.0030.631 ±0.0050.482 ±0.0060.682 ±0.0020.648 ±0.0030.323 ±0.0020.765 ±0.0040.460 ±0.0060.138 ±0.003
+ RKBDR-Gau0.726 ±0.0050.630 ±0.0080.480 ±0.0080.683 ±0.0020.652 ±0.0030.325 ±0.0020.766 ±0.0030.469 ±0.0070.134 ±0.004
+ WKBDR-Exp0.735 ±0.0050.637 ±0.0090.483 ±0.0060.685 ±0.0030.654 ±0.0030.325 ±0.0020.773 ±0.0030.489 ±0.0080.142 ±0.003
+ WKBDR-Gau0.732 ±0.0030.638 ±0.0070.483 ±0.0050.687 ±0.0010.655 ±0.0020.327 ±0.0020.773 ±0.0020.490 ±0.0050.142 ±0.004
+ AKBDR-Exp0.745* ±0.0040.645 ±0.0080.493* ±0.0070.692 ±0.0020.661 ±0.0020.328 ±0.0020.782* ±0.0030.498* ±0.0080.147* ±0.003
+ AKBDR-Gau0.746* ±0.0040.646* ±0.0080.492 ±0.0070.694* ±0.0020.664* ±0.0020.332* ±0.0020.782* ±0.0050.503* ±0.0060.148* ±0.004
  • 適応カーネルバランシング(AKB)は、データセットとカーネルを問わず、デバイアリング性能を一貫して改善する。
  • Gaussianまたは指数カーネルを用いたAKBは、Coat、Music、Productデータセットで最良の総合AUC、NDCG@5、F1スコアを達成。
  • カーネルバランシング手法(KBIPS/KBDR)はランダムカーネルバランシング(RKB)およびモーメントバランシング(MB)ベースラインを上回り、AKBが最も大きな改善をもたらす。
  • RKHS仮定の下でKBIPS/KBDRを用いた一般化境界が、カーネルベースのバランシングを適用したとき誤差を減少させることを示す。
  • 実証的な結果は、AKBDRとカーネルバランシングを組み合わせた場合、多くのIPS/DRベースラインよりも統計的有意な改善を示す(例: AKBDR-ExpおよびAKBDR-Gau)。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。