[論文レビュー] Recommender AI Agent: Integrating Large Language Models for Interactive Recommendations
本論文は InteRecAgent を提示する。大規模言語モデルをブレインとして、従来のレコメンダー手法をエンジンとして用い、メモリ、計画、反省を備えた対話型の、記憶を持つ推奨を可能にするコンパクトな LLM ベースのフレームワークである。
Recommender models excel at providing domain-specific item recommendations by leveraging extensive user behavior data. Despite their ability to act as lightweight domain experts, they struggle to perform versatile tasks such as providing explanations and engaging in conversations. On the other hand, large language models (LLMs) represent a significant step towards artificial general intelligence, showcasing remarkable capabilities in instruction comprehension, commonsense reasoning, and human interaction. However, LLMs lack the knowledge of domain-specific item catalogs and behavioral patterns, particularly in areas that diverge from general world knowledge, such as online e-commerce. Finetuning LLMs for each domain is neither economic nor efficient. In this paper, we bridge the gap between recommender models and LLMs, combining their respective strengths to create a versatile and interactive recommender system. We introduce an efficient framework called extbf{InteRecAgent}, which employs LLMs as the brain and recommender models as tools. We first outline a minimal set of essential tools required to transform LLMs into InteRecAgent. We then propose an efficient workflow within InteRecAgent for task execution, incorporating key components such as memory components, dynamic demonstration-augmented task planning, and reflection. InteRecAgent enables traditional recommender systems, such as those ID-based matrix factorization models, to become interactive systems with a natural language interface through the integration of LLMs. Experimental results on several public datasets show that InteRecAgent achieves satisfying performance as a conversational recommender system, outperforming general-purpose LLMs. The source code of InteRecAgent is released at https://aka.ms/recagent.
研究の動機と目的
- LLMs の一般的な能力とドメイン固有のレコメンダーのニーズのギャップを埋める。
- 自然言語インターフェースを通じてレコメンダーシステムを対話的にする。
- ツール利用の向上と堅牢性のために記憶、計画、反省モジュールを提案する。
- 小規模言語モデルが推奨タスクのブレインを模倣できるようにする。
- 公開データセットでの有効性を示し、RecLlama を小規模モデル向けに公開する。
提案手法
- LLM 主導の対話型推奨のための最小限のツールセットを定義する(情報照会、アイテム取得、ランキング)。
- Candidate Bus 記憶を導入してツール間でアイテム候補をストリームする。
- 対話を跨いで個人化するために長期・短期のユーザープロフィールを維持する。
- プロンプトを減らし API 呼び出しを減らすために計画優先の実行と動的デモを採用する。
- ツール使用中の誤りを識別・修正するための actor-critic 反省メカニズムを組み込む。
- GPT-4 が生成したツール計画データを用いた模倣データセットで RecLlama(7B)をファインチューニングして学習する。
実験結果
リサーチクエスチョン
- RQ1LLMs を従来のレコメンダーツールと統合して、対話的で自然言語の推奨を実現できるか。
- RQ2記憶、計画、反省モジュールはツールの使用精度と最終推奨を改善するか。
- RQ3GPT-4 生成データで訓練した小規模言語モデルは、レコメンドエージェントのブレインとして競争力を持てるか。
主な発見
- InteRecAgent は複数の公開データセットにおいて競争力のある対話型推奨性能を達成する。
- 計画優先の実行戦略は、ステップバイステップ手法に比べて API 呼び出しと待機時間を削減する。
- 動的デモは現在のユーザ意図に最も類似するデモを選択することで計画の質を向上させる。
- 記憶モジュール(Candidate Bus とユーザープロフィール)は長い対話にわたるスケーラブルな通信と個人化を可能にする。
- RecLlama、GPT-4 由来データでファインチューニングされた 7B モデルはレコメンダーエージェントとしての役割でより大きなモデルを一部上回る。
- 実験は世界知識のカバーが薄いドメイン(例: Beauty データセット)で強い利点を示す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。