Skip to main content
QUICK REVIEW

[论文解读] Celeb-DF: A Large-scale Challenging Dataset for DeepFake Forensics

Yuezun Li, Xin Yang|arXiv (Cornell University)|Sep 27, 2019
Digital Media Forensic Detection参考文献 50被引用 103
一句话总结

Celeb-DF 引入一个大规模、高质量的 DeepFake 视频数据集(5,639 个 DeepFakes,超过 200 万帧),以更好地评估检测方法,结果显示当前检测器在这一更高质量的数据上存在困难。

ABSTRACT

AI-synthesized face-swapping videos, commonly known as DeepFakes, is an emerging problem threatening the trustworthiness of online information. The need to develop and evaluate DeepFake detection algorithms calls for large-scale datasets. However, current DeepFake datasets suffer from low visual quality and do not resemble DeepFake videos circulated on the Internet. We present a new large-scale challenging DeepFake video dataset, Celeb-DF, which contains 5,639 high-quality DeepFake videos of celebrities generated using improved synthesis process. We conduct a comprehensive evaluation of DeepFake detection methods and datasets to demonstrate the escalated level of challenges posed by Celeb-DF.

研究动机与目标

  • 推动需要一个更大规模、质量更高的 DeepFake 视频数据集,以更好地匹配现实互联网内容。
  • 创建 Celeb-DF,改进合成以减少先前数据集中出现的伪影。
  • 对 Celeb-DF 和现有数据集上的当前 DeepFake 检测方法进行全面评估,以评估现实世界的挑战。

提出的方法

  • 开发改进的 DeepFake 合成流程,生成 256x256 的脸部区域,更高的视觉质量,伪影更少。
  • 应用颜色增强和颜色传输,以减少供体与目标面部之间的颜色不匹配。
  • 改进人脸蒙版,使覆盖完整的面部区域并具有平滑的边界。
  • 引入 Kalman 平滑到时序关键点,以减少帧间闪烁。
  • 使用 Mask-SSIM(聚焦头部区域)定量评估视觉质量。
  • 在包括 Celeb-DF 在内的多个数据集上,使用帧级 AUC 评估检测方法。

实验结果

研究问题

  • RQ1Celeb-DF 数据集在视觉质量上与以往的 DeepFake 数据集相比如何?
  • RQ2当前 DeepFake 检测方法在 Celeb-DF 相对于早期数据集的表现如何?
  • RQ3视频压缩对最先进检测器的检测性能有何影响?

主要发现

  • Celeb-DF 包含 5,639 个 DeepFake 视频(超过 2,000,000 帧)和 59 位名人旗下的 590 个真实视频。
  • Celeb-DF 的合成流水线在视觉质量方面的表现更高、伪影更少,凭借更高的 Mask-SSIM 分数得到证明(Celeb-DF:Table 2 中列出的 0.92 -SSIM)。
  • 在评估的检测器中,Celeb-DF 通常是最具挑战的数据集,与较早的数据集相比,帧级平均 AUC 较低。
  • 最近的方法(DSP-FWA)在测试检测器中达到最高性能,在研究摘要中大约为 87.4%(跨数据集的总体表现)。
  • 压缩实验表明,随着更高的 H.264 压缩,检测器性能下降,尽管某些模型(例如 Xception 变体)仍相对稳健。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。