Skip to main content
QUICK REVIEW

[论文解读] Attention-aware fusion for RGB-D face recognition

Hardik Uppal, Alireza Sepas‐Moghaddam|arXiv (Cornell University)|Feb 29, 2020
Face recognition and analysis参考文献 10被引用 4
一句话总结

本文提出了一种用于RGB-D人脸识别的注意力感知融合方法,通过在融合特征图和其空间结构上应用两种注意力机制,增强了特征表示。结合迁移学习与数据增强,该方法在CurtinFaces数据集上达到98.2%的准确率,在IIIT-D数据集上达到99.3%的准确率,优于当前最先进方法。

ABSTRACT

A novel attention aware method is proposed to fuse two image modalities, RGB and depth, for enhanced RGB-D facial recognition. The proposed method uses two attention layers, the first focused on the fused feature maps generated by convolution layers, and the second focused on the spatial features of those maps. The training database is preprocessed and augmented through a set of geometric transformations, and the learning process is further aided using transfer learning from a pure 2D RGB image training process. Comparative evaluations demonstrate that the proposed method outperforms other state-of-the-art approaches, including both traditional and deep neural network-based methods, on the challenging CurtinFaces and IIIT-D RGB-D benchmark databases, achieving classification accuracies over 98:2% and 99:3% respectively.

研究动机与目标

  • 通过使用注意力机制有效融合RGB与深度模态,提升RGB-D人脸识别性能。
  • 解决真实世界人脸识别场景中噪声或不一致深度数据的挑战。
  • 通过聚焦融合特征图与空间特征图中的判别区域,增强特征表示。
  • 利用来自2D RGB模型的迁移学习,提升训练效率与性能。
  • 在CurtinFaces与IIIT-D等具有挑战性的RGB-D基准数据集上实现最先进性能。

提出的方法

  • 应用两个连续的注意力层:一个作用于RGB与深度流融合后的特征图,另一个作用于这些特征的空间分布。
  • 使用卷积层从RGB与深度输入中提取初始特征,再进行融合。
  • 采用几何数据增强技术,提升训练过程中的鲁棒性与泛化能力。
  • 通过使用预训练的2D RGB人脸识别模型权重初始化网络,实现迁移学习。
  • 通过注意力分数动态加权重要特征,优化融合过程。
  • 集成注意力机制以抑制无关或噪声特征,增强判别能力。

实验结果

研究问题

  • RQ1注意力机制在人脸识别中如何提升RGB与深度特征的融合效果?
  • RQ2基于注意力的特征选择在具有挑战性的RGB-D数据集上能在多大程度上提升识别准确率?
  • RQ3从2D RGB模型进行迁移学习是否能在深度数据有限的情况下提升RGB-D人脸识别性能?
  • RQ4所提出方法与现有最先进融合策略在基准数据集上的表现相比如何?
  • RQ5几何数据增强对注意力感知融合模型的鲁棒性有何影响?

主要发现

  • 所提方法在CurtinFaces基准数据集上实现了98.2%的分类准确率。
  • 在IIIT-D RGB-D基准数据集上,该方法达到了99.3%的识别准确率,超越了现有最先进方法。
  • 双注意力机制通过聚焦相关空间与通道特征,显著提升了特征判别能力。
  • 从2D RGB模型进行迁移学习有助于加快收敛速度并提升性能,尤其在深度数据有限的情况下表现更优。
  • 几何数据增强提升了模型在不同光照与姿态条件下的鲁棒性与泛化能力。
  • 该方法在所评估的基准数据集上,优于传统融合技术与近期基于深度学习的方法。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。