[論文レビュー] Generative Recommendation: Towards Next-generation Recommender Paradigm
本論文は、ユーザーの指示とフィードバックに導かれてアイテムを再利用または新規作成するAI生成コンテンツを活用する生成型レコメンダーのパラダイム、GeneRecを提案する。忠実性検証とマイクロ動画コンテンツに関する実現可能性調査を含む。
Recommender systems typically retrieve items from an item corpus for personalized recommendations. However, such a retrieval-based recommender paradigm faces two limitations: 1) the human-generated items in the corpus might fail to satisfy the users' diverse information needs, and 2) users usually adjust the recommendations via inefficient passive feedback, e.g., clicks. Nowadays, AI-Generated Content (AIGC) has revealed significant success, offering the potential to overcome these limitations: 1) generative AI can produce personalized items to satisfy users' information needs, and 2) the newly emerged large language models significantly reduce the efforts of users to precisely express information needs via natural language instructions. In this light, the boom of AIGC points the way towards the next-generation recommender paradigm with two new objectives: 1) generating personalized content through generative AI, and 2) integrating user instructions to guide content generation. To this end, we propose a novel Generative Recommender paradigm named GeneRec, which adopts an AI generator to personalize content generation and leverages user instructions. Specifically, we pre-process users' instructions and traditional feedback via an instructor to output the generation guidance. Given the guidance, we instantiate the AI generator through an AI editor and an AI creator to repurpose existing items and create new items. Eventually, GeneRec can perform content retrieval, repurposing, and creation to satisfy users' information needs. Besides, to ensure the trustworthiness of the generated items, we emphasize various fidelity checks. Moreover, we provide a roadmap to envision future developments of GeneRec and several domain-specific applications of GeneRec with potential research tasks. Lastly, we study the feasibility of implementing AI editor and AI creator on micro-video generation.
研究の動機と目的
- AI生成コンテンツ(AIGC)が取得ベースの推薦システムの制約に対処する潜在能力を強調する。
- GeneRec パラダイムを、インストラクター、AIエディター、AIクリエイターの三要素で定義する。
- 生成アイテムの忠実性検証(偏り、プライバシー、安全性、真正性、合法性、識別性)を紹介する。
- マイクロ動画データ上でのAIエディター/クリエイターの実現可能性を示し、今後の研究課題を概説する。
提案手法
- ユーザー指示とフィードバックを利用するAIジェネレーターと従来の取得を組み合わせた2ループのパラダイムとしてGeneRecを導入する。
- 3つのモジュールを定義する:指示を処理するインストラクター、既存アイテムを再用途化するAIエディター、そして新規アイテムを生成するAIクリエイター。
- 偏り、プライバシー、安全性、真正性、合法性、識別性を含む忠実性検証を実装する(透かし付け、検出を含む)。
- アイテム側(品質と忠実性)とユーザー側(満足度)の評価設計を概説する。
- 現代のAIGC手法(CLIP、RDM、MCVD、VToonify、拡散モデル)を用いたマイクロ動画の編集と作成のタスクを示す。
- 大規模マイクロ動画データセットを対象とした実現可能性調査を提供し、サムネイル選択、サムネイル生成、クリッピング、内容の改訂、作成の実験を行う。
実験結果
リサーチクエスチョン
- RQ1AIジェネレーターは個別化されたユーザー情報ニーズに応じて、アイテムを再利用または新規作成することが効果的にできるか?
- RQ2ユーザー指示とマルチモーダルなフィードバックが、関連性と満足度を高めるようなコンテンツ生成をどのように導くか?
- RQ3推奨におけるAI生成コンテンツの信頼性を確保するために、どのような忠実性・安全性メカニズムが実現可能か?
- RQ4現在のAIGC技術は、マイクロ動画コンテンツのAIエディターおよびAIクリエイターの実用的な具現化を支えることができるか?
- RQ5従来の取得ベース手法と比較して、生成的コンテンツをレコメンドシステムに統合することの潜在的な利点と制約は何か?
主な発見
| 実験 | コサイン@5 | コサイン@10 | PS@5 | PS@10 | FVD |
|---|---|---|---|---|---|
| サムネイル選択 - ランダムフレーム | 0.4796 | 0.4786 | 22.6735 | 23.1950 | - |
| サムネイル選択 - オリジナル | 0.4978 | 0.4970 | 22.2606 | 22.7445 | - |
| サムネイル選択 - CLIP | 0.5142 | 0.5134 | 22.7682 | 23.2854 | - |
| サムネイル選択 - RDM | 0.5369 | 0.5347 | 23.0145 | 23.3712 | - |
| マイクロ動画クリッピング - ランダム | 0.4864 | 0.4851 | 22.1483 | 23.1401 | - |
| マイクロ動画クリッピング - 最初のクリップ | 0.4910 | 0.4899 | 22.1509 | 23.1657 | - |
| マイクロ動画クリッピング - 未クリップ | 0.4969 | 0.4976 | 22.1685 | 23.1700 | - |
| マイクロ動画クリッピング - CLIP | 0.5052 | 0.5038 | 22.1863 | 23.1758 | - |
| MCVD - オリジナル | 0.5010 | 0.5083 | 25.8900 | 24.6800 | - |
| MCVD - ユーザ履歴 | 0.5166 | 0.5127 | 25.9012 | 24.7107 | 783.7505 |
| MCVD - ユーザー埋め込み | 0.5273 | 0.5200 | 26.0200 | 24.7900 | 646.7156 |
| MCVD クリエーション - オリジナル | 0.4883 | 0.4907 | - | - | - |
| MCVD クリエーション - ユーザ履歴 | 0.4902 | 0.4915 | - | - | 735.0413 |
| MCVD クリエーション - ユーザー埋め込み | 0.5356 | 0.5376 | - | - | 743.1090 |
- GenRecは、既存アイテムコーパスを超えて、多様なユーザーのニーズを満たすためのコンテンツの取得、再利用、作成を可能にします。
- 忠実性検査(偏り、プライバシー、安全性、真正性、合法性、識別性)は、信頼できる生成コンテンツにとって不可欠です。
- マイクロ動画の実現可能性調査では、AIエディターのタスク(サムネイル選択/生成、クリッピング、内容の改訂)が、ベースラインを上回る性能を示し、一部のタスクでRDM/大型拡散系手法が最も良い結果を示した。
- CLIPを用いた個別化サムネイル選択のAIエディターは、Cosine@KおよびPS@K 指標をRandom/Originalベースラインより改善し、サムネイル生成にはRDMが最も良い結果を出す。
- CLIPによるマイクロ動画のクリッピングは、Cosine@KおよびPS@K指標で一貫してベースラインを上回る。
- MCVDベースのマイクロ動画内容の改訂と作成は、ユーザー埋め込みや履歴的嗜好に導かれた場合に、ユーザー適合性の結果を改善できるが、無条件生成と比較していくつかの品質ギャップが残る。
- 生成タスクは短期的なコサイン類似度が高い一方でFVDスコアが大きく、現状は個別化生成を完全に満たすには限界があることを示している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。