Skip to main content
QUICK REVIEW

[论文解读] What do they know about me? Contents and Concerns of Online Behavioral Profiles

Ashwini Rao, Florian Schaub|arXiv (Cornell University)|Jun 4, 2015
Privacy, Security, and Data Protection参考文献 12被引用 46
一句话总结

本研究通过分析主要公司提供的用户可访问数据,调查了在线行为档案的特征,揭示了展示数据与实际持有的数据之间存在显著差距,错误率高达80%,且用户普遍存在对隐私和数据敏感性的担忧。研究结果暴露了当前透明度机制的局限性,并呼吁提升数据准确性、增强用户理解能力,以及改革数据收集实践的政策。

ABSTRACT

Data aggregators collect large amount of information about individual users and create detailed online behavioral profiles of individuals. Behavioral profiles benefit users by improving products and services. However, they have also raised concerns regarding user privacy, transparency of collection practices and accuracy of data in the profiles. To improve transparency, some companies are allowing users to access their behavioral profiles. In this work, we investigated behavioral profiles of users by utilizing these access mechanisms. Using in-person interviews (n=8), we analyzed the data shown in the profiles, elicited user concerns, and estimated accuracy of profiles. We confirmed our interview findings via an online survey (n=100). To assess the claim of improving transparency, we compared data shown in profiles with the data that companies have about users. More than 70% of the participants expressed concerns about collection of sensitive data such as credit and health information, level of detail and how their data may be used. We found a large gap between the data shown in profiles and the data possessed by companies. A large number of profiles were inaccurate with as much as 80% inaccuracy. We discuss implications for public policy management.

研究动机与目标

  • 调查用户可访问的在线行为档案的实际内容。
  • 评估用户对其档案中数据的关注与意外之处。
  • 比较用户档案中显示的数据与公司实际持有的数据。
  • 评估透明度机制在提升用户意识和控制力方面的有效性。
  • 识别当前档案访问系统在可用性和准确性方面的问题。

提出的方法

  • 通过面对面半结构化访谈对8名参与者进行,以检查其个人行为档案并收集其关注点。
  • 通过在线调查对100名参与者进行,以验证访谈发现并推广结果。
  • 分析数据聚合商和服务提供商的公开文件,以确定所收集数据的完整范围。
  • 将用户可访问档案中的数据与公司声称持有的数据进行对比,以衡量透明度差距。
  • 通过用户对理解能力、导航便捷性及数据导出功能的反馈,评估访问机制的可用性。
  • 评估编辑或删除档案数据对关联公司中数据持久性的影响。

实验结果

研究问题

  • RQ1与公司声称持有的数据相比,用户可访问的行为档案中实际显示的数据类型有哪些?
  • RQ2用户可访问行为档案中的数据准确度如何,其不准确的程度有多大?
  • RQ3用户对其行为档案内容的主要关注点和意外之处是什么?
  • RQ4当前的档案访问机制在提升透明度和用户控制力方面发挥了多大作用?
  • RQ5当前访问和理解行为档案数据的机制在可用性和可理解性方面如何?

主要发现

  • 超过70%的参与者对其信用和健康信息等敏感数据的收集表示担忧。
  • 档案中显示的数据与公司实际持有的数据之间存在巨大差距,公司持有的数据粒度更细(例如出生日期、ZIP+4、完整姓名),而这些并未在档案中显示。
  • 档案中的不准确率高达80%,许多条目包含错误或过时的信息。
  • 用户难以理解档案术语(例如“MOB/品牌数据”、“高置信度”),表明访问界面的可理解性较差。
  • 从档案中编辑或删除数据并不能保证关联公司中数据被清除,这引发了对用户控制有效性存疑。
  • 在八名访谈参与者中仅有一人知晓档案访问机制,凸显用户认知度低和透明度严重不足。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。