[论文解读] Celeb-DF: A Large-scale Challenging Dataset for DeepFake Forensics
Celeb-DF 引入一个大规模、高质量的 DeepFake 视频数据集(5,639 个 DeepFakes,超过 200 万帧),以更好地评估检测方法,结果显示当前检测器在这一更高质量的数据上存在困难。
AI-synthesized face-swapping videos, commonly known as DeepFakes, is an emerging problem threatening the trustworthiness of online information. The need to develop and evaluate DeepFake detection algorithms calls for large-scale datasets. However, current DeepFake datasets suffer from low visual quality and do not resemble DeepFake videos circulated on the Internet. We present a new large-scale challenging DeepFake video dataset, Celeb-DF, which contains 5,639 high-quality DeepFake videos of celebrities generated using improved synthesis process. We conduct a comprehensive evaluation of DeepFake detection methods and datasets to demonstrate the escalated level of challenges posed by Celeb-DF.
研究动机与目标
- 推动需要一个更大规模、质量更高的 DeepFake 视频数据集,以更好地匹配现实互联网内容。
- 创建 Celeb-DF,改进合成以减少先前数据集中出现的伪影。
- 对 Celeb-DF 和现有数据集上的当前 DeepFake 检测方法进行全面评估,以评估现实世界的挑战。
提出的方法
- 开发改进的 DeepFake 合成流程,生成 256x256 的脸部区域,更高的视觉质量,伪影更少。
- 应用颜色增强和颜色传输,以减少供体与目标面部之间的颜色不匹配。
- 改进人脸蒙版,使覆盖完整的面部区域并具有平滑的边界。
- 引入 Kalman 平滑到时序关键点,以减少帧间闪烁。
- 使用 Mask-SSIM(聚焦头部区域)定量评估视觉质量。
- 在包括 Celeb-DF 在内的多个数据集上,使用帧级 AUC 评估检测方法。
实验结果
研究问题
- RQ1Celeb-DF 数据集在视觉质量上与以往的 DeepFake 数据集相比如何?
- RQ2当前 DeepFake 检测方法在 Celeb-DF 相对于早期数据集的表现如何?
- RQ3视频压缩对最先进检测器的检测性能有何影响?
主要发现
- Celeb-DF 包含 5,639 个 DeepFake 视频(超过 2,000,000 帧)和 59 位名人旗下的 590 个真实视频。
- Celeb-DF 的合成流水线在视觉质量方面的表现更高、伪影更少,凭借更高的 Mask-SSIM 分数得到证明(Celeb-DF:Table 2 中列出的 0.92 -SSIM)。
- 在评估的检测器中,Celeb-DF 通常是最具挑战的数据集,与较早的数据集相比,帧级平均 AUC 较低。
- 最近的方法(DSP-FWA)在测试检测器中达到最高性能,在研究摘要中大约为 87.4%(跨数据集的总体表现)。
- 压缩实验表明,随着更高的 H.264 压缩,检测器性能下降,尽管某些模型(例如 Xception 变体)仍相对稳健。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。