Skip to main content
QUICK REVIEW

[论文解读] In Ictu Oculi: Exposing AI Generated Fake Face Videos by Detecting Eye Blinking

Yuezun Li, Ming‐Ching Chang|arXiv (Cornell University)|Jun 7, 2018
Generative Adversarial Networks and Image Synthesis参考文献 17被引用 181
一句话总结

该论文提出一种法证方法,通过分析眼部眨眼,利用 Long-term Recurrent Convolutional Network (LRCN) 的时序眼部动态来区分真实与合成视频,从而检测 AI 生成的假脸视频。

ABSTRACT

The new developments in deep generative networks have significantly improve the quality and efficiency in generating realistically-looking fake face videos. In this work, we describe a new method to expose fake face videos generated with neural networks. Our method is based on detection of eye blinking in the videos, which is a physiological signal that is not well presented in the synthesized fake videos. Our method is tested over benchmarks of eye-blinking detection datasets and also show promising performance on detecting videos generated with DeepFake.

研究动机与目标

  • 激发对 AI 生成的假脸视频进行法证分析的必要性。
  • 提出一种生理信号——眨眼——作为可靠的法证信号。
  • 开发一个深度学习架构,捕捉眼部的时序动态以检测伪造视频中的眨眼缺失。
  • 在眼眨数据集和 DeepFake 生成的视频上评估该方法。

提出的方法

  • 逐帧检测人脸并将其对齐到规范坐标系统。
  • 基于关键点裁剪眼部区域以形成眼序列。
  • 使用基于 VGG16 的 CNN 提取帧级眼部特征,且不包含最后的全连接层。
  • 采用带有 LSTM 的 Long-term Recurrent Convolutional Network (LRCN) 来建模眼部眨眼的时序动态。
  • 在 open/closed eye 标签上对前端 CNN 进行训练,然后在 Back-propagation through time 下端到端训练 LRCN。

实验结果

研究问题

  • RQ1AI 生成的视频中眼睛眨动的缺失或不规则性是否可作为可检测的伪像?
  • RQ2通过 LRCN 引入时序信息是否比逐帧 CNN 或基于关键点的方法在眨眼状态分类上具有改进?
  • RQ3基于眨眼的方法对 DeepFake 生成内容的泛化能力如何?
  • RQ4哪些数据集和训练策略能够在真实与伪视频中实现鲁棒的眨眼检测?

主要发现

  • LRCN 以 ROC 0.99 的最佳性能,优于 CNN (0.98) 和 EAR (0.79)。
  • CNN 仅使用 CNN 能在单帧上捕捉眼睛状态,但缺乏时序一致性。
  • 通过 LSTM 建模时序动态提高对模糊帧的鲁棒性并保持平滑的眼睛状态序列。
  • 该方法能检测真实视频中的眨眼模式,而在 DeepFake 生成的视频中这些模式往往缺失或被改变。
  • 创建并用于评估的专门眼睛眨眼视频(EBV)数据集,以及 CEW 等其他数据集。
  • 该方法在检测由 DeepFake 生成的视频方面显示出有前景的性能。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。