QUICK REVIEW

[論文レビュー] Self-supervised Learning for Large-scale Item Recommendations

Tiansheng Yao, Xinyang Yi|arXiv (Cornell University)|Jul 25, 2020

Recommender Systems and Techniques参考文献 44被引用数 29

ひとこと要約

本論文は、新しいデータ拡張および対照学習を用いてラベルなしデータを活用することで、表現学習と一般化性能を向上させる大規模なアイテム推薦向け自己教師型学習（SSL）フレームワークを提案する。この手法は、特に長尾および低教師信号のアイテムにおいて顕著な性能向上を示し、新規アプリでは+4.5%のエンゲージメント向上、国際市場では主要指標で+5.47%の改善を達成。ライブA/Bテストにより、ウェブ規模の推薦システムにおける実世界の影響が確認された。

ABSTRACT

Large scale recommender models find most relevant items from huge catalogs, and they play a critical role in modern search and recommendation systems. To model the input space with large-vocab categorical features, a typical recommender model learns a joint embedding space through neural networks for both queries and items from user feedback data. However, with millions to billions of items in the corpus, users tend to provide feedback for a very small set of them, causing a power-law distribution. This makes the feedback data for long-tail items extremely sparse. Inspired by the recent success in self-supervised representation learning research in both computer vision and natural language understanding, we propose a multi-task self-supervised learning (SSL) framework for large-scale item recommendations. The framework is designed to tackle the label sparsity problem by learning better latent relationship of item features. Specifically, SSL improves item representation learning as well as serving as additional regularization to improve generalization. Furthermore, we propose a novel data augmentation method that utilizes feature correlations within the proposed framework. We evaluate our framework using two real-world datasets with 500M and 1B training examples respectively. Our results demonstrate the effectiveness of SSL regularization and show its superior performance over the state-of-the-art regularization techniques. We also have already launched the proposed techniques to a web-scale commercial app-to-app recommendation system, with significant improvements top-tier business metrics demonstrated in A/B experiments on live traffic. Our online results also verify our hypothesis that our framework indeed improves model performance even more on slices that lack supervision.

研究の動機と目的

長期間にわたるユーザーのフィードバックが最小限の長尾アイテムを含む大規模なアイテム推薦システムにおけるラベルのスパarsity問題に対処すること。
自己教師型学習（SSL）を用いてラベルなしデータを活用することで、表現学習とモデルの一般化性能を向上させること。
高基数のカテゴリカル特徴間の相関関係を活用する新しいデータ拡張戦略を設計し、より優れたSSL性能を実現すること。
実際のプロダクション環境において、特に新規または未代表的なアプリのような低教師信号の状況において、SSLフレームワークの有効性を検証すること。
教師信号が乏しい状況において、SSLが最先端技術よりも強い正則化効果を示すかどうかを示すこと。

提案手法

監視付きフィードバック（例：クリック）と自己教師型対照学習の目的関数を併用して学習する二塔型DNNモデルを採用する、マルチタスクSSLフレームワークを提案する。
相関する特徴をマスクすることで、アイテム特徴の補完的ビューを生成する新しいデータ拡張法を導入し、多様で情報豊富な拡張を実現する。
同じアイテムの2つの拡張ビューのうち、どちらがオリジナルかを予測するようにモデルを学習する対照学習目的関数を採用し、表現品質を向上させる。
マスクされた特徴の選択を、相互情報量で制御することで、拡張ビューが意味的に異なるが関連性のあるものになるように保証する。
2番目のビューの特徴値にランダムドロップアウトを適用することで、さらに多様性を高め、短絡的学習を防ぐ。
ユーザーのフィードバックに対する監視付き損失と、拡張ビューに対する対照損失を組み合わせた、エンドツーエンドの学習を実施する。

実験結果

リサーチクエスチョン

RQ1自己教師型学習は、ユーザーのフィードバックがスパースな大規模なアイテム推薦システムにおいて、表現学習と一般化性能を向上させることができるか？
RQ2特徴相関とマスキングに基づく本研究のデータ拡張戦略は、ランダム拡張や非補完的拡張と比較して、SSLにおいてどのように優れているか？
RQ3特に低教師信号の状況において、SSLフレームワークは既存の最先端技術よりも強い正則化効果を示すか？
RQ4SSLフレームワークは、新規アプリや未代表的な市場のような長尾およびコールドスタートアイテムのパフォーマンスをどの程度向上させるか？
RQ5オフライン指標がライブパフォーマンスを反映しない場合でも、SSLの利点を実世界のプロダクションシステムで検証できるか？

主な発見

提案されたSSLフレームワークは、ウェブ規模のアプリ推薦システムにおけるライブA/B実験で、全体のユーザーエンゲージメントが+0.67%向上し、主要ビジネス指標が+1.5%向上した。
新規アプリではユーザーエンゲージメントが+4.5%向上し、最小限の教師信号のもとでコールドスタートアイテムの性能向上が確認された。
訓練データがスパースな国際市場では主要ビジネス指標が+5.47%向上し、低教師信号地域におけるフレームワークの有効性が裏付けられた。
補完的特徴マスキング（CFM）を用いた対照学習タスクは、すべてのベースライン（ランダムマスキング（RFM）や補完性なしバージョン）を上回り、拡張の意味的多様性の重要性を示した。
アブレーションスタディにより、特徴マスキングにおける相互情報量と2番目のビューにおけるランダムドロップアウトの両方がパフォーマンス向上に顕著に寄与することが確認され、表現品質の向上に寄与することが示された。
SSLフレームワークは、すべての評価指標（MAP@10、MAP@50、Recall@10、Recall@50）でモデルパフォーマンスを向上させ、最良のバリエーション（CFM）はAAIデータセットでMAP@10が0.1413を達成した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。