[论文解读] PyramidBox++: High Performance Detector for Finding Tiny Face
PyramidBox++ 通过在 WIDER FACE 上使用平衡数据采样、双金字塔锚点、密集上下文模块以及多任务训练,提升极小人脸检测并在困难集上达到最先进的结果。
With the rapid development of deep convolutional neural network, face detection has made great progress in recent years. WIDER FACE dataset, as a main benchmark, contributes greatly to this area. A large amount of methods have been put forward where PyramidBox designs an effective data augmentation strategy (Data-anchor-sampling) and context-based module for face detector. In this report, we improve each part to further boost the performance, including Balanced-data-anchor-sampling, Dual-PyramidAnchors and Dense Context Module. Specifically, Balanced-data-anchor-sampling obtains more uniform sampling of faces with different sizes. Dual-PyramidAnchors facilitate feature learning by introducing progressive anchor loss. Dense Context Module with dense connection not only enlarges receptive filed, but also passes information efficiently. Integrating these techniques, PyramidBox++ is constructed and achieves state-of-the-art performance in hard set.
研究动机与目标
- 在无约束环境下促进鲁棒的人脸检测,面对大尺度变化和极小的人脸。
- 通过解决数据采样不平衡和上下文利用问题,改进 PyramidBox。
- 利用多任务学习提供额外的监督与正则化。
提出的方法
- 引入平衡数据锚采样(BDAS)以实现统一的脸部尺度采样。
- 提出双金字塔锚点(Dual-PyramidAnchors),以实现接近主干网络的逐步上下文监督。
- 结合密集连接的密集上下文模块,以扩大感受野并改善信息流。
- 采用包括分割和无锚检测在内的多任务训练,以提供额外的监督。
实验结果
研究问题
- RQ1在面部尺度上的采样平衡如何提升 WIDER FACE 上极小人脸的召回率?
- RQ2相比于之前的 PyramidBox,结合双金字塔锚点和密集上下文是否能改善小脸部定位?
- RQ3分割和无锚任务对极小人脸的整体检测性能有何影响?
主要发现
- 在 WIDER FACE 上,PyramidBox++ 在验证集达到 Easy 96.5%、Medium 95.9%、Hard 91.2%,在测试集达到 Easy 95.6%、Medium 95.2%、Hard 90.9%。
- 该方法在 hard 子集上超过所有方法,表明极小人脸检测性能强劲。
- BDAS 使脸部尺度的采样更均匀,提升小脸召回率。
- 密集上下文模块和双金字塔锚点在不增加额外运行时开销的情况下,提升了靠近主干网络的特征学习。
- 包含分割和无锚分支的多任务训练提供额外的监督,提升检测性能。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。