[论文解读] Privacy Control in Conversational LLM Platforms: A Walkthrough Study
这篇论文对六个面向用户的会话式大型语言模型平台进行了专家驱动的逐步评估,以记录它们在界面层面对数据访问、编辑、删除和分享控制的定义与实现。
Large language models (LLMs) are increasingly integrated into daily life through conversational interfaces, processing user data via natural language inputs and exhibiting advanced reasoning capabilities, which raises new concerns about user control over privacy. While much research has focused on potential privacy risks, less attention has been paid to the data control mechanisms these platforms provide. This study examines six conversational LLM platforms, analyzing how they define and implement features for users to access, edit, delete, and share data. Our analysis reveals an emerging paradigm of data control in conversational LLM platforms, where user data is generated and derived through interaction itself, natural language enables flexible yet often ambiguous control, and multi-user interactions with shared data raise questions of co-ownership and governance. Based on these findings, we offer practical insights for platform developers, policymakers, and researchers to design more effective and usable privacy controls in LLM-powered conversational interactions.
研究动机与目标
- 调查六个广泛使用的会话式大型语言模型平台在界面层面呈现隐私政策与控制的方式。
- 识别用于管理用户数据的数据单位、控制选项和执行机制。
- 检查不同账户状态(已登出、已登录未付费、已登录付费)以及跨用户数据共享场景的差异。
- 为开发者和政策制定者提供可操作的见解,以改善基于LLM的对话中的可用隐私性。
提出的方法
- 应用专家驱动的应用评估(Light et al., 2018)于六个平台:Character.ai、ChatGPT、Claude、Gemini、Meta AI、Pi。
- 进行三阶段的平台识别过程:搜索、追溯到面向消费者的平台、并筛选符合纳入标准的项。
- 分析使用环境(愿景、运营模型、治理)并对数据控制机制(访问、编辑、删除、分享)进行技术性 walkthrough。
- 以截图和实地记录文档化界面层级的数据控制特征,聚焦可见控制,而非后端机制。
- 对比已登出、已登录未付费、已登录付费的用户视角,以揭示账户状态的差异。
- 调整 walkthrough 协议以适应平台特定布局(如 CUI、侧边面板、记忆功能)。
实验结果
研究问题
- RQ1会话式LLM平台如何对数据实践进行治理并提供用户管理数据的控制?
- RQ2这些平台在界面层面暴露哪些隐私控制机制(访问、编辑、删除、分享),它们如何被执行?
- RQ3在用户状态(已登出、已登录未付费、已登录付费)及多用户数据共享场景下,平台特征有何不同?
- RQ4在会话式LLMs中,关于数据单位、基于自然语言的控制以及治理,出现了哪些设计模式?
主要发现
- 平台呈现出不同的隐私控制机制,治理用户数据的访问、编辑、删除或共享的“谁、什么、如何、在哪里”。
- 由于界面架构和功能集的差异(如记忆小部件、共享链接、定制商店),数据单位和执行机制在各平台间存在差异。
- 自然语言界面提供灵活的控制,但可能在数据如何被管理和治理方面带来歧义。
- 多用户数据共享引发治理与共同所有权的问题,强调需要更清晰的跨用户控制与政策。
- 此次评估揭示了会话式LLMs中隐私管理的新兴设计范式,并为开发者和政策制定者提供了基于实证的含义。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。