[論文レビュー] Breaking User-Centric Agency: A Tri-Party Framework for Agent-Based Recommendation
TriRec は、ユーザーの有用性、アイテム露出、プラットフォームの公平性を明示的に調整する2段階・三者間LLMエージェントフレームワークを導入し、アイテムの自己プロモーションとプラットフォーム主導の多目的再ランク付けを可能にすることで、精度と長期的なエコシステムの健全性を改善します。
Recent advances in large language models (LLMs) have stimulated growing interest in agent-based recommender systems, enabling language-driven interaction and reasoning for more expressive preference modeling. However, most existing agentic approaches remain predominantly user-centric, treating items as passive entities and neglecting the interests of other critical stakeholders. This limitation exacerbates exposure concentration and long-tail under-representation, threatening long-term system sustainability. In this work, we identify this fundamental limitation and propose the first Tri-party LLM-agent Recommendation framework (TriRec) that explicitly coordinates user utility, item exposure, and platform-level fairness. The framework employs a two-stage architecture: Stage~1 empowers item agents with personalized self-promotion to improve matching quality and alleviate cold-start barriers, while Stage~2 uses a platform agent for sequential multi-objective re-ranking, balancing user relevance, item utility, and exposure fairness. Experiments on multiple benchmarks show consistent gains in accuracy, fairness, and item-level utility. Moreover, we find that item self-promotion can simultaneously enhance fairness and effectiveness, challenging the conventional trade-off assumption between relevance and fairness. Our code is available at https://github.com/Marfekey/TriRec.
研究の動機と目的
- レコメンドシステムにおけるユーザー中心モデルの限界とマルチステークホルダー調整の必要性を特定する。
- 自己プロモーションによるアイテム代理とプラットフォーム制御露出規制を備えた2段階のTriRecフレームワークを提案する。
- 実データセットで、ユーザー・アイテム・プラットフォームの目的を均衡させることが精度・公平性・アイテムの有用性を改善することを示す。
提案手法
- Stage 1: Generative item self-promotion where item agents generate personalized self-promotions for a target user using a frozen LLM and item memories.
- Stage 2: Platform-agent sequential re-ranking that uses a stateful exposure model and a joint utility function to balance user relevance, item exposure, and platform fairness.
- Preference interaction modeled via AgentCF-style user/item memory-based reasoning with a fixed LLM for inference.
- Exposure as a dynamic state with position-aware re-ranking guided by a greedy sequential construction.
- Relevance–fairness gain combines normalized user and platform signals through a position-dependent alpha_k weighting schedule.
- Item utility modified by exposure-aware modulation to encourage long-term visibility for under-exposed items.
実験結果
リサーチクエスチョン
- RQ1RQ1: TriRec は既存手法と比較して精度、公平性、予想アイテム有用性の観点でどのように動作するか?
- RQ2RQ2: 二段階フレームワークの個々の貢献が最終性能にどう寄与するか?
- RQ3RQ3: 主要ハイパーパラメータは三者間のトレードオフにどう影響するか?
- RQ4RQ4: Stage 1 におけるアイテム自己プロモーションはコールドスタートアイテムのランキング改善にどれほど有効か?
主な発見
- TriRec は4つのデータセットにおいて一貫してユーザー関連性(NDCG/MRR)、プラットフォームの公平性(DGU/MGU)、アイテム有用性(EIU)を改善。
- Stage 1 のアイテム自己プロモーションは露出とクリック率を高め、長尾アイテムを支援。
- プラットフォーム主導の多目的再ランク付けは、ユーザー・アイテム・プラットフォームのユーティリティ間でのバランスのとれた最適化を実現。
- アイテム自己プロモーションは公平性と有効性を改善する可能性があり、関連性と公平性の間の一般的なトレードオフに挑戦。
- CDs & Vinyl、Movies & TV、Goodreads YA、Steam Games のデータセットで、TriRec はベースラインより有利な利得を示す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。