Skip to main content
QUICK REVIEW

[論文レビュー] Personalization of Large Language Models: A Survey

Zhehao Zhang, Ryan A. Rossi|arXiv (Cornell University)|Oct 29, 2024
Topic Modeling被引用数 10
ひとこと要約

包括的な調査であり、使用、データ、粒度、技術、評価、データセット、アプリケーション全体で大規模言語モデルのパーソナライズを統一し分類し、未解決の課題を概説する。

ABSTRACT

Personalization of Large Language Models (LLMs) has recently become increasingly important with a wide range of applications. Despite the importance and recent progress, most existing works on personalized LLMs have focused either entirely on (a) personalized text generation or (b) leveraging LLMs for personalization-related downstream applications, such as recommendation systems. In this work, we bridge the gap between these two separate main directions for the first time by introducing a taxonomy for personalized LLM usage and summarizing the key differences and challenges. We provide a formalization of the foundations of personalized LLMs that consolidates and expands notions of personalization of LLMs, defining and discussing novel facets of personalization, usage, and desiderata of personalized LLMs. We then unify the literature across these diverse fields and usage scenarios by proposing systematic taxonomies for the granularity of personalization, personalization techniques, datasets, evaluation methods, and applications of personalized LLMs. Finally, we highlight challenges and important open problems that remain to be addressed. By unifying and surveying recent research using the proposed taxonomies, we aim to provide a clear guide to the existing literature and different facets of personalization in LLMs, empowering both researchers and practitioners.

研究の動機と目的

  • 直接的なテキスト生成と下流タスクの両方で、パーソナライズされたLLMの使用に関する統一的な見解と分類法を提供する。
  • パーソナライズされたLLMの基礎概念と定義を形式化する。
  • パーソナライゼーションの粒度(ユーザー、ペルソナ、グローバル)とトレードオフを特徴づける。
  • パーソナライゼーション技術を整理・分類する(RAG、 prompting、ファインチューニング、埋め込み、RLHF)。
  • 指標、データセット、アプリケーション、今後の課題を調査し、今後の研究を指針とする。

提案手法

  • パーソナライズドLLMの使用には二つのカテゴリがあるという提案:直接的なパーソナライズドテキスト生成と下流タスクのパーソナライズ。
  • 基礎概念(パーソナライゼーション、ユーザーペリファレンス、パーソナライズされたLLM、ユーザデータタイプ)を定義し、パーソナライゼーションの正式な表記を提供する。
  • 三段階の粒度フレームワークを提供する:ユーザー層、ペルソナ層、グローバルな好みのパーソナライゼーション。
  • データの利用法別にパーソナライゼーション技術を整理する:リトリーブ強化生成(RAG)、プロンプト、教師ありファインチューニング、埋め込み学習、RLHF。
  • 直接・間接のパーソナライゼーションの評価指標とデータセットの分類を提供し、それらの強みと限界を詳述する。
  • 教育、医療、金融、法務、コーディング、検索/推奨システムにわたるアプリケーションを調査し、未解決課題と今後の展望を概説する。
Figure 1: Taxonomy for Personalized LLM Usage. To bridge the gap in the existing literature on personalized LLMs, we propose the intuitive taxonomy outlined above, which categorizes work into two main areas. The first focuses on studying the ➊ personalized text generated directly, while the second e
Figure 1: Taxonomy for Personalized LLM Usage. To bridge the gap in the existing literature on personalized LLMs, we propose the intuitive taxonomy outlined above, which categorizes work into two main areas. The first focuses on studying the ➊ personalized text generated directly, while the second e

実験結果

リサーチクエスチョン

  • RQ1どのようにして、個別化されたLLM研究のさまざまな分野を、統一された分類法とフレームワークへ統一できるか?
  • RQ2LLMのパーソナライズを支える基礎概念とデータモダリティは何か?
  • RQ3異なるパーソナライゼーションの粒度(ユーザー、ペルソナ、グローバル)と技術のトレードオフは何か?
  • RQ4どの指標、データセット、アプリケーションがパーソナライズされたLLMsの全体像を適切に網羅し、未解決の問題は何か?
  • RQ5プライバシー、バイアス、コールドスタート、多モーダルパーソナライゼーションにおける主要な課題と今後の研究方向は何か?

主な発見

  • 本論文は、直接的なテキスト生成と下流タスクのパーソナライゼーションを区別し、パーソナライズドLLM使用の統一的な視点と分類法を提供する。
  • パーソナライゼーションの基礎を形式化し、定義と表記法を伴う正式なフレームワークを導入する。
  • パーソナライゼーションの三つの粒度レベルを導入し、それらのトレードオフを分析する。
  • RAG、 prompting、ファインチューニング、埋め込み、RLHF を含むパーソナライゼーション技術を調査・分類する。
  • 指標、評価手法、データセット、アプリケーションを検討し、今後の課題や挑戦を概説する。
Figure 2: Overview of Personalization Data. This figure presents an overview of the various types of user-specific data used in downstream personalization tasks. It categorizes the data into three primary formats: (i) Static Attributes , which include demographic information and item metadata that r
Figure 2: Overview of Personalization Data. This figure presents an overview of the various types of user-specific data used in downstream personalization tasks. It categorizes the data into three primary formats: (i) Static Attributes , which include demographic information and item metadata that r

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。