[論文レビュー] Contrastive Learning for Debiased Candidate Generation at Scale.
CLRecは、対照的学習フレームワークを提案し、大規模な候補生成における露出バイアスを軽減する。逆確率スコアリングを用いた対照的損失関数と固定サイズのキューを活用し、効率的なネガティブサンプリングを実現。Mobile Taobaoに導入された結果、4か月間のA/Bテストでアイテム露出におけるマーシャール効果が顕著に低減された。
Deep candidate generation (DCG) that narrows down the collection of relevant items from billions to hundreds via representation learning is essential to large-scale recommender systems. Standard approaches approximate maximum likelihood estimation (MLE) through sampling for better scalability and address the problem of DCG in a way similar to language modeling. However, live recommender systems face severe unfairness of exposure with a vocabulary several orders of magnitude larger than that of natural language, implying that (1) MLE will preserve and even exacerbate the exposure bias in the long run in order to faithfully fit the observed samples, and (2) suboptimal sampling and inadequate use of item features can lead to inferior representations for the unfairly ignored items. In this paper, we introduce CLRec, a Contrastive Learning paradigm that has been successfully deployed in a real-world massive recommender system, to alleviate exposure bias in DCG. We theoretically prove that a popular choice of contrastive loss is equivalently reducing the exposure bias via inverse propensity scoring, which provides a new perspective on the effectiveness of contrastive learning. We further employ a fixed-size queue to store the items' representations computed in previously processed batches, and use the queue to serve as an effective sampler of negative examples. This queue-based design provides great efficiency in incorporating rich features of the thousand negative items per batch thanks to computation reuse. Extensive offline analyses and four-month online A/B tests in Mobile Taobao demonstrate substantial improvement, including a dramatic reduction in the Matthew effect.
研究の動機と目的
- 自然言語とは比較して、語彙が数個のオーダーも大きい大規模レコメンデーションシステムにおける、深層的候補生成(DCG)における深刻な露出バイアスに対処すること。
- 不適切なサンプリングと未活用のアイテム特徴が、めったに露出されないアイテムの表現学習に与える悪影響を軽減すること。
- 訓練効率を損なわずに、DCGにおける公平性と表現品質を向上させる、効率的かつスケーラブルな対照的学習手法を設計すること。
- 対照的学習が逆確率スコアリングを用いて露出バイアスを低減する有効性を理論的に裏付けること。
- Mobile Taobaoにおける4か月間のオンラインA/Bテストを通じて、本手法の有効性を検証すること。
提案手法
- CLRecは、逆確率スコアリングによる露出バイアスの低減と同等であると示される対照的損失関数を用いる対照的学習パラダイムを採用している。
- 固定サイズのキューが、以前に処理されたバッチからのアイテム表現を格納し、動的で効率的なネガティブサンプルの供給源として機能する。
- キューにより計算再利用が可能となり、1バッチあたり最大1000件のネガティブアイテムに対して豊富な特徴統合が可能であり、オーバーヘッドは最小限に抑えられる。
- 本手法は表現学習を活用し、ポジティブおよびネガティブなアイテムの両方の高品質な埋め込み表現を生成することで、候補スコアリングの公平性を向上させる。
- スケーラビリティを考慮したフレームワーク設計により、Mobile Taobaoのような生産規模のシステムにおけるリアルタイムのトレーニングと推論を実現している。
- 対照的目的関数は、ポジティブに相互作用されたアイテムの表現を埋め込み空間で近づける一方で、ネガティブなアイテムの表現を遠ざけるように促進する。
実験結果
リサーチクエスチョン
- RQ1どのようにして、巨大なアイテム語彙を持つ大規模な候補生成において、対照的学習を効果的に露出バイアスの低減に応用できるか?
- RQ2対照的学習と逆確率スコアリングの間には、露出バイアス低減においてどのような理論的関係があるか?
- RQ3固定サイズのキューを用いることで、トレーニングパフォーマンスを低下させることなく、大規模なスケールで効率的かつ効果的にネガティブアイテムをサンプリングできるか?
- RQ4CLRecは、標準的なMLEベースのDCG手法と比較して、アイテム露出におけるマーシャール効果をどの程度低減できるか?
- RQ5提案手法は、計算効率を維持しつつ、オンラインレコメンデーションパフォーマンスに測定可能な改善をもたらすことができるか?
主な発見
- CLRecで用いられる対照的損失は、理論的に逆確率スコアリングを適用することと同等であり、露出バイアス低減におけるその有効性を原理的根拠で裏付ける。
- キューに基づくネガティブサンプリング機構により、計算再利用が可能となり、1バッチあたり最大1000件のネガティブアイテムに対して豊富な特徴統合が可能であり、オーバーヘッドは最小限に抑えられる。
- オフライン分析の結果、CLRecはめったに露出されないアイテムの表現品質を向上させ、アイテム間での埋め込み忠実度の乖離を低減していることが示された。
- Mobile Taobaoにおける4か月間のオンラインA/Bテストでは、マーシャール効果が顕著に低減されたことが確認され、より公平な露出分布が実現された。
- CLRecは測定可能な推薦パフォーマンスの向上を達成しており、実世界での導入における有効性が確認された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。