Skip to main content
QUICK REVIEW

[論文レビュー] LLMRec: Large Language Models with Graph Augmentation for Recommendation

Wei Wei, Xubin Ren|arXiv (Cornell University)|Nov 1, 2023
Recommender Systems and Techniques被引用数 10
ひとこと要約

LLMRec は、相互作用エッジ、アイテム属性、ユーザープロファイルの三つの LLM 主導戦略と雑音除去による堅牢化コンポーネントを組み合わせ、ベンチマークデータセットで推奨精度を向上させる。

ABSTRACT

The problem of data sparsity has long been a challenge in recommendation systems, and previous studies have attempted to address this issue by incorporating side information. However, this approach often introduces side effects such as noise, availability issues, and low data quality, which in turn hinder the accurate modeling of user preferences and adversely impact recommendation performance. In light of the recent advancements in large language models (LLMs), which possess extensive knowledge bases and strong reasoning capabilities, we propose a novel framework called LLMRec that enhances recommender systems by employing three simple yet effective LLM-based graph augmentation strategies. Our approach leverages the rich content available within online platforms (e.g., Netflix, MovieLens) to augment the interaction graph in three ways: (i) reinforcing user-item interaction egde, (ii) enhancing the understanding of item node attributes, and (iii) conducting user node profiling, intuitively from the natural language perspective. By employing these strategies, we address the challenges posed by sparse implicit feedback and low-quality side information in recommenders. Besides, to ensure the quality of the augmentation, we develop a denoised data robustification mechanism that includes techniques of noisy implicit feedback pruning and MAE-based feature enhancement that help refine the augmented data and improve its reliability. Furthermore, we provide theoretical analysis to support the effectiveness of LLMRec and clarify the benefits of our method in facilitating model optimization. Experimental results on benchmark datasets demonstrate the superiority of our LLM-based augmentation approach over state-of-the-art techniques. To ensure reproducibility, we have made our code and augmented data publicly available at: https://github.com/HKUDS/LLMRec.git

研究の動機と目的

  • レコメンデーションシステムにおけるデータのスパース性と低品質なサイド情報に対処する。
  • モダリティベースのレコメンダーにおいて相互作用グラフとサイド情報を拡張するために大規模言語モデルを活用する。
  • ノイズを剪定し特徴を強化するデノイズドデータ堅牢化機構を提供する。
  • LLM ベースのグラフ拡張の利点を理論的に分析し、経験的に検証する。
  • 再現性のためにコードと拡張データを公開する。

提案手法

  • 三つの LLM ベースの拡張戦略:ユーザーとアイテムの相互作用エッジを強化し、アイテム属性を強化し、ユーザープロファイリングを行う。
  • 候補プール内でのベイズ個別推薦(BPR)学習のための陽性/陰性の暗黙的フィードバックサンプルを生成するための LLM ベースのサンプリング。
  • LLM 生成のサイド情報(ユーザー/アイテム属性)を統一埋め込みに変換し、それを拡張された意味表現射影、協調文脈注入、特徴組み込みを介して統合する。
  • ノイズエッジの剪定と MAE ベースの特徴強化を含むデノイズド堅牢化により拡張の品質を向上させる。
  • 拡張データ上の BPR 損失での共同最適化と、拡張特徴を正則化するための MAE からの特徴復元損失。

実験結果

リサーチクエスチョン

  • RQ1LLM をどのように利用して、従来の ID ベース信号を超えるユーザー-アイテム相互作用を予測・拡張できるか?
  • RQ2過度なノイズを導入することなく、拡張コンテンツをどのように生成・組み込むことができるか?
  • RQ3拡張ノード属性とユーザー/アイテムプロファイルをレコメンダエンコーダにどのように統合すべきか?
  • RQ4デノイズと MAE ベースの特徴強化は、LLM 拡張推奨の堅牢性と性能を改善できるか?

主な発見

ベースラインNetflix_R10Netflix_N10Netflix_R20Netflix_N20Netflix_R50Netflix_N50Netflix_P20MovieLens_R10MovieLens_N10MovieLens_R20MovieLens_N20MovieLens_R50MovieLens_N50MovieLens_P20
MF-BPR0.02820.01400.05420.02050.09320.02810.00270.18900.08150.25640.09850.34420.11610.0128
NGCF0.03470.01610.06990.02350.10920.03360.00320.20840.08860.29260.11000.42620.13620.0146
LightGCN0.03520.01600.07010.02380.11250.03390.00320.19940.08370.26600.10050.36920.12090.0133
VBPR0.03250.01420.05530.01990.10240.02910.00280.21440.09290.29800.11420.40760.13610.0149
MMGCN0.03630.01740.06990.02490.11640.03420.00330.23140.10970.28560.12330.42820.15140.0147
GRCN0.03790.01920.07060.02570.11480.03580.00350.23840.10400.31300.12360.45320.15160.0150
LATTICE0.04330.01810.07370.02590.13010.03700.00360.21160.09550.34540.12680.46670.14790.0167
MICRO0.04660.01960.07640.02710.13060.03780.00380.21500.11310.34610.14680.48980.17430.0175
CLCRec0.04280.02170.06070.02620.09810.03350.00300.22660.09710.31640.11980.44880.14590.0158
MMSSL0.04550.02240.07430.02870.12570.03830.00370.24820.11130.33540.13100.48140.16160.0170
LLMRec0.05310.02720.08290.03470.13820.04560.00410.26030.12500.36430.16280.52810.19010.0186
  • LLMRec は Netflix および MovieLens データセットで最先端ベースラインを上回るリコール、NDCG、精度を達成する。
  • アブレーション研究は、三つの LLM ベース拡張コンポーネントの有効性を示している。
  • デノイズ(ノイズ剪定)と MAE ベースの特徴強化は学習を安定化させ、結果を改善する。
  • このアプローチは複数の指標(例:リコールや NDCG)にわたって顕著な改善をもたらし、合理的な時間計算量を維持する。
  • ターゲット分析を通じて、どの構成要素が利益に最も寄与するかを示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。