[论文解读] Deep Anomaly Detection for Generalized Face Anti-Spoofing
本文提出了一种用于广义人脸反 spoofing的深度度量学习框架,通过将呈现攻击检测重新表述为异常检测问题。该方法引入了一种由三元组焦点损失正则化的新型'度量-Softmax'损失,以学习具有区分性的特征表示,在GRAD-GPAD基准上实现了最先进性能,CASIA-FASD数据集上的ACER为16.8%,Replay-Attack数据集上的ACER为45.62%,并通过少量样本后验概率估计实现了无需分类器的推理。
Face recognition has achieved unprecedented results, surpassing human capabilities in certain scenarios. However, these automatic solutions are not ready for production because they can be easily fooled by simple identity impersonation attacks. And although much effort has been devoted to develop face anti-spoofing models, their generalization capacity still remains a challenge in real scenarios. In this paper, we introduce a novel approach that reformulates the Generalized Presentation Attack Detection (GPAD) problem from an anomaly detection perspective. Technically, a deep metric learning model is proposed, where a triplet focal loss is used as a regularization for a novel loss coined "metric-softmax", which is in charge of guiding the learning process towards more discriminative feature representations in an embedding space. Finally, we demonstrate the benefits of our deep anomaly detection architecture, by introducing a few-shot a posteriori probability estimation that does not need any classifier to be trained on the learned features. We conduct extensive experiments using the GRAD-GPAD framework that provides the largest aggregated dataset for face GPAD. Results confirm that our approach is able to outperform all the state-of-the-art methods by a considerable margin.
研究动机与目标
- 解决人脸反 spoofing模型中的泛化差距问题,这些模型通常在训练数据上过拟合,并在面对未见攻击的真实场景中失效。
- 将广义呈现攻击检测(GPAD)重新表述为异常检测问题,以提升对分布外伪造样本的鲁棒性。
- 开发一种深度度量学习架构,以在共享嵌入空间中学习真实人脸与伪造人脸的区分性特征表示。
- 通过引入少量样本后验概率估计方法,实现在不训练独立分类器情况下的决策能力。
提出的方法
- 使用具有共享权重的孪生CNN架构,在基于三元组的学习设置中提取锚点、正样本和负样本的特征。
- 提出一种新型的'度量-Softmax'损失,对每个三元组对的概率分布进行建模,增强真实样本与伪造样本之间的特征可分性。
- 将三元组焦点损失作为正则化项应用于度量-Softmax损失,使训练聚焦于难负样本,提升边缘学习能力。
- 端到端训练模型,以学习一个紧凑且具有区分性的嵌入空间,使真实样本紧密聚集,而伪造样本被推至外围。
- 仅使用每类M=3个支持样本,实现少量样本后验概率估计,从而在推理阶段无需单独的分类器。
- 利用嵌入空间中的固有距离分布,将伪造样本检测为异常点,将其视为分布外点。
实验结果
研究问题
- RQ1使用新型损失公式的深度度量学习是否能在广义人脸反 spoofing中超越域偏移测试集,实现更好的泛化能力?
- RQ2所提出的'度量-Softmax'损失与三元组焦点损失结合,在学习伪造检测的区分性特征表示方面有多高效?
- RQ3少量样本后验概率估计是否能够替代传统分类器,同时保持高精度?
- RQ4在极端域偏移下(如在未见过的CASIA-FASD和Replay-Attack数据集上测试)模型表现如何?
- RQ5与传统的基于分类的反 spoofing模型相比,异常检测视角在多大程度上提升了鲁棒性?
主要发现
- 在CASIA-FASD数据集的跨数据集测试协议下,所提方法的ACER为16.8%,显著优于先前最先进方法。
- 在Replay-Attack数据集上,该方法的ACER为45.62%,尽管因域偏移和未见攻击类型导致性能严重下降,但仍是所有对比方法中的最佳表现。
- 少量样本后验概率估计(Ours†)的性能与基于SVM的版本(Ours)相当,验证了无分类器推理流程的有效性。
- 在Replay-Attack数据集上,模型保持了25.00%的低HTER,优于所有基线方法在HTER和BPCER上的表现,表明其具有强大的泛化能力和鲁棒性。
- 度量-Softmax与三元组焦点损失的结合,通过在多个跨数据集评估中持续提升性能,证明了其能生成更具区分性的特征表示。
- 该方法对未见攻击类型和域具有良好的泛化能力,表明将伪造行为视为异常检测可显著提升实际应用中的适用性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。