[论文解读] Toward Personalized LLM-Powered Agents: Foundations, Evaluation, and Future Directions
一个以能力为导向的综述,将个性化的基于LLM的代理围绕画像建模、记忆、规划与执行行动进行组织,评述用于用户对齐的代理的方法、基准和未来方向。
Large language models have enabled agentic systems that reason, plan, and interact with tools and environments to accomplish complex tasks. As these agents operate over extended interaction horizons, their effectiveness increasingly depends on adapting behavior to individual users and maintaining continuity across interactions, giving rise to personalized LLM-powered agents (PLAs). In such long-term, user-dependent settings, personalization permeates the entire decision pipeline rather than remaining confined to surface-level response generation. This survey provides a capability-oriented review of personalized LLM-powered agents. Existing work is organized around four interdependent capabilities: profile modeling, memory, planning, and action execution. Using this taxonomy, representative methods are synthesized and analyzed to illustrate how user signals are represented, propagated, and utilized across the agent pipeline, highlighting cross-component interactions and recurring design challenges. Evaluation metrics and benchmarking paradigms tailored to personalized agents are further examined, along with application scenarios ranging from conversational assistants to domain-specific expert systems. By clarifying the design space of personalization in agent systems, this survey provides a structured foundation for developing more user-aligned, adaptive, and deployable LLM-powered agents.
研究动机与目标
- 定义一个统一的、以能力为导向的个性化LLM驱动代理框架,围绕四个相互依赖的组件:画像建模、记忆、规划、和行动执行。
- 综合这些组件的代表性方法、基准和评测协议。
- 分析用户信号在端到端个性化流水线中的表示、传播和利用方式。
- 讨论应用领域、挑战以及走向可扩展、值得信赖的个性化代理的方向。
提出的方法
- 提出一个四组件分类法(画像建模、记忆、规划、行动执行)以分析代理生命周期中的个性化。
- 回顾以用户为中心的数据概念,包括历史数据和交互数据,以及它们如何条件化偏好。
- 调研画像建模方法:基于角色的与基于响应的,以及用户模拟与自适应代理定义之间的区别。
- 检视记忆架构:内部记忆与外部记忆,以及文本型与结构化记忆及其更新机制。
- 讨论记忆更新策略(文本记忆的相似性驱动与推理引导;结构化记忆的节点/边与维护)。
- 概述个性化代理的评测与部署考虑因素,包括权衡与安全性。

实验结果
研究问题
- RQ1哪些核心组件和机制能够实现对LLM驱动代理的有效个性化?
- RQ2应该如何在画像建模、记忆、规划和行动执行中表示、存储和传播用户信号?
- RQ3在构建、评测与部署个性化代理系统时存在哪些挑战与权衡?
- RQ4记忆与画像选择如何影响长期用户对齐与系统鲁棒性?
- RQ5在跨域的可扩展、可信的个性化代理方面,哪些方向具有潜力?
主要发现
- 统一的分类法揭示了个性化所必需的四个相互依赖的能力:画像建模、记忆、规划、与行动执行。
- 个性化作为一个闭环,用户偏好决定决策,行动产生反馈,结果再度细化偏好。
- 两层次的用户信号(历史数据与交互数据)支持双时间尺度的个性化,便于长期和上下文特定的自适应。
- 画像建模分为用户画像建模(基于角色和基于响应)以及代理角色定义(用户模拟与自适应),各自面临不同挑战。
- 用于个性化的记忆架构覆盖内部与外部记忆,含文本型与结构化形式;每种形式都需要慎重的更新机制与检索策略。
- 对基准、评测协议和应用领域的全面综述凸显需要对跨组件进行整体评估,推动可部署的个性化代理的发展。

更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。