Skip to main content
QUICK REVIEW

[论文解读] Faceless Person Recognition; Privacy Implications in Social Media

Seong Joon Oh, Rodrigo Benenson|arXiv (Cornell University)|Jul 28, 2016
Digital Media Forensic Detection参考文献 10被引用 23
一句话总结

本文提出了一种无需人脸的人员识别系统,利用深度卷积特征与图模型,在人脸被遮挡的情况下仍能识别社交媒体图像中的个体。即使采用模糊化或遮黑等遮蔽技术,该系统在事件内识别准确率最高达86.4%,跨事件识别准确率也达51.1%,表明仅需极少量标记图像(最少10张)即构成重大隐私风险,即便已采取隐私保护措施。

ABSTRACT

As we shift more of our lives into the virtual domain, the volume of data shared on the web keeps increasing and presents a threat to our privacy. This works contributes to the understanding of privacy implications of such data sharing by analysing how well people are recognisable in social media data. To facilitate a systematic study we define a number of scenarios considering factors such as how many heads of a person are tagged and if those heads are obfuscated or not. We propose a robust person recognition system that can handle large variations in pose and clothing, and can be trained with few training samples. Our results indicate that a handful of images is enough to threaten users' privacy, even in the presence of obfuscation. We show detailed experimental results, and discuss their implications.

研究动机与目标

  • 量化在社交媒体上分享个人照片所伴随的隐私风险,特别是当人脸被遮挡时。
  • 研究常见遮蔽技术(如模糊化、遮黑)在防止机器视觉系统识别方面的有效性。
  • 开发一种鲁棒的人员识别系统,仅需极少训练数据即可在不同姿态、着装和视角下识别个体。
  • 分析真实社交媒体场景中图像内容、遮蔽处理与识别性能之间的相互作用。
  • 基于视觉内容本身(不依赖元数据)建立隐私损失的下限估计。

提出的方法

  • 无脸人员识别器利用深度卷积神经网络(CNN)特征,从身体和着装线索中提取与身份相关表征,避免依赖面部特征。
  • 图模型在多张未标记图像间执行联合推理,利用上下文一致性与外观相似性。
  • 系统仅使用每身份约10张图像进行训练,模拟真实社交媒体数据约束。
  • 系统性评估遮蔽类型(黑色、白色、模糊、可见)对降低识别准确率的效果。
  • 实验基于PIPA数据集进行,比较不同场景下的性能表现:事件内与跨事件识别,涵盖不同程度的遮蔽处理。
  • 通过不同配置下的识别准确率评估性能,包括单个图像与完整系统推理。

实验结果

研究问题

  • RQ1当人脸被模糊化、遮黑或其他技术遮挡时,视觉系统在社交媒体图像中识别个体的能力有多强?
  • RQ2当仅存在少量某人标记图像时,常见遮蔽方法在保护隐私方面的有效性如何?
  • RQ3某人标记图像的数量(如1–10张)是否显著影响识别准确率,即使在不同事件和条件下?
  • RQ4与单图分析相比,该系统在多张未标记图像间进行联合推理如何提升识别性能?
  • RQ5仅基于视觉数据本身(不依赖时间戳或地理位置等元数据),隐私威胁有多大?

主要发现

  • 模糊化等遮蔽技术提供的隐私保护有限,系统在最激进遮蔽条件(S3)下事件内识别准确率仍达71.3%。
  • 当仅对一个头部进行遮蔽(S2)时,识别准确率从S1的86.4%降至71.3%,但跨图像的联合推理有助于部分恢复性能。
  • 跨事件识别准确率显著下降(S1为51.1%,S3为23.9%),表明遮蔽在图像来自不同事件时更有效。
  • 即使所有头部均被遮黑(S3),系统准确率仍为随机猜测的12倍,表明面部之外的视觉线索仍具高度判别性。
  • 遮蔽方法的隐私保护效果排序为:黑色 ≈ 白色 > 模糊 > 可见,模糊化相比无遮蔽仅提供微弱改善。
  • 该系统的联合推理机制通过利用多张图像间的一致性,在S2和S3场景下显著提升识别性能,表明上下文对隐私泄露具有重要影响。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。