[論文レビュー] TALLRec: An Effective and Efficient Tuning Framework to Align Large Language Model with Recommendation
TALLRec は軽量の Alpaca と rec-tuning ステージを用いて LLaMA-7B をチューニングし、LoRA を使用して LLM をレコメンデーションタスクに適合させ、少数ショットでの強力な性能とドメイン横断一般化を実現し、従来のベースラインおよび In-context Learning を上回る。
Large Language Models (LLMs) have demonstrated remarkable performance across diverse domains, thereby prompting researchers to explore their potential for use in recommendation systems. Initial attempts have leveraged the exceptional capabilities of LLMs, such as rich knowledge and strong generalization through In-context Learning, which involves phrasing the recommendation task as prompts. Nevertheless, the performance of LLMs in recommendation tasks remains suboptimal due to a substantial disparity between the training tasks for LLMs and recommendation tasks, as well as inadequate recommendation data during pre-training. To bridge the gap, we consider building a Large Recommendation Language Model by tunning LLMs with recommendation data. To this end, we propose an efficient and effective Tuning framework for Aligning LLMs with Recommendation, namely TALLRec. We have demonstrated that the proposed TALLRec framework can significantly enhance the recommendation capabilities of LLMs in the movie and book domains, even with a limited dataset of fewer than 100 samples. Additionally, the proposed framework is highly efficient and can be executed on a single RTX 3090 with LLaMA-7B. Furthermore, the fine-tuned LLM exhibits robust cross-domain generalization. Our code and data are available at https://github.com/SAI990323/TALLRec.
研究の動機と目的
- LLM の学習タスクとレコメンデーションタスクのギャップを埋め、Large Recommendation Language Model (LRLM) を構築する。
- 限られたデータとGPU リソースで LLM をレコメンデーションへ適応させる、効率的な二段階チューニングフレームワーク(alpaca tuning と rec-tuning)を開発する。
- チューニングされた LRLM が従来のレコメンダーおよび In-context Learning ベースラインを少数ショット設定で上回り、跨ドメイン一般化を示すことを実証する。
提案手法
- rec-tuning の入力・出力として推奨データを指示形式にフォーマットする。
- 自己指示データを用いた Alpaca チューニングで LLM の一般化を向上させる。
- 過去の相互作用を用いてターゲットアイテムへのユーザー嗜好予測を行うようモデルを調整するために rec-tuning を適用する。
- LoRA を用いて LLaMA-7B 上で軽量なパラメータ効率的ファインチューニングを可能にし、ベースパラメータを凍結する。
- 二段階のフレームワーク(alpaca tuning の後に rec-tuning)を、単一の RTX 3090 上で実装して訓練する。
- バックボーンモデルの選択は実用的なデプロイとデータセキュリティを反映するため、API ベースのモデルよりオープンソースの LLaMA に焦点を当てる。
実験結果
リサーチクエスチョン
- RQ1RQ1: TALLRec は現在の LLM ベースおよび従来のレコメンデーションモデルと比較してどの程度の性能を示すか?
- RQ2RQ2: TALLRec の異なる構成要素はその有効性にどのような影響を与えるか?
- RQ3RQ3: TALLRec は跨ドメインのレコメンデーションでどのように機能するか?
主な発見
| 少数ショット | GRU4Rec | Caser | SASRec | DROS | GRU-BERT | DROS-BERT | TALLRec | |
|---|---|---|---|---|---|---|---|---|
| 映画 | 16 | 49.07 | 49.68 | 50.43 | 50.76 | 50.85 | 50.21 | 67.24 |
| 映画 | 64 | 49.87 | 51.06 | 50.48 | 51.54 | 51.65 | 51.71 | 67.48 |
| 映画 | 256 | 52.89 | 54.20 | 52.25 | 54.07 | 53.44 | 53.94 | 71.98 |
| 本 | 16 | 48.95 | 49.84 | 49.48 | 49.28 | 50.07 | 50.07 | 56.36 |
| 本 | 64 | 49.64 | 49.72 | 50.06 | 49.13 | 49.64 | 48.98 | 60.39 |
| 本 | 256 | 49.86 | 49.57 | 50.20 | 49.13 | 49.79 | 50.20 | 64.38 |
- TALLRec は少数ショット設定で従来ベースラインおよび LLM ベースのベースラインの両方を大幅に上回る。
- rec-tuning の下で GPT-3.5 ベースのプロンプトを用いた In-context Learning は調整された LLM と比べて性能が低い。
- Alpaca tuning は一般化に寄与するが、少数ショットのシナリオで強いレコメンデーション性能を達成するには rec-tuning が不可欠。
- TALLRec は跨ドメイン一般化が強く(例:映画から本へ)、複数ドメインのデータを組み合わせるとさらに改善できる。
- GRU-BERT および DROS-BERT の変種は、少数ショット設定でベースモデルを大幅に改善しない。テキストの説明だけでは従来モデルを大幅に向上させられない可能性。
- 結果はデータセット全体で AUC の明確な改善を示し、報告表の最終的な TALLRec 変種が最高スコアを達成。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。