Skip to main content
QUICK REVIEW

[论文解读] Deep Learning for Generic Object Detection: A Survey

Li Liu, Wanli Ouyang|arXiv (Cornell University)|Sep 6, 2018
Advanced Neural Network Applications参考文献 311被引用 241
一句话总结

对深度学习进展如何塑造通用目标检测的全面综述,涵盖框架、表示、候选框、上下文、训练与评估,并提出未来方向。

ABSTRACT

Object detection, one of the most fundamental and challenging problems in computer vision, seeks to locate object instances from a large number of predefined categories in natural images. Deep learning techniques have emerged as a powerful strategy for learning feature representations directly from data and have led to remarkable breakthroughs in the field of generic object detection. Given this period of rapid evolution, the goal of this paper is to provide a comprehensive survey of the recent achievements in this field brought about by deep learning techniques. More than 300 research contributions are included in this survey, covering many aspects of generic object detection: detection frameworks, object feature representation, object proposal generation, context modeling, training strategies, and evaluation metrics. We finish the survey by identifying promising directions for future research.

研究动机与目标

  • 总结基于深度学习的通用对象检测格局并指出关键研究方向。
  • 基于数据集、评估标准和问题子任务提供方法的分类法和高层次组织结构。
  • 突出推动通用对象检测进展的重大里程碑、数据集和训练策略。
  • 讨论在可扩展、精确且高效的通用对象检测器方面尚存的挑战和未来研究方向。

提出的方法

  • 回顾并对自深度学习兴起以来该领域的300多项贡献进行分类。
  • 给出一个聚焦于数据集、评估指标、上下文建模和检测候选框的分类体系。
  • 综合从传统手工特征到基于深度CNN的检测器(如RCNN)及其后的进展。
  • 讨论在精度、效率和可扩展性方面的挑战,并勾勒未来的研究方向。

实验结果

研究问题

  • RQ1基于深度学习的通用对象检测的主要挑战与设计考量是什么?
  • RQ2数据集、评估指标和检测框架如何发展,以支撑通用对象检测的进展?
  • RQ3从手工特征到深度学习的对象检测中的关键里程碑和方法转变有哪些?
  • RQ4哪些未来方向对于推动通用对象检测系统发展具有前景?

主要发现

  • 自2012年起,深度学习显著提升了通用对象检测的性能,推动了快速进展。
  • 全面的分类法有助于将方法围绕数据集、评估、上下文建模和提案策略进行组织。
  • 大规模带注释的数据集和GPU对训练跨多物体类别的深度检测器至关重要。
  • 进展包括从手工特征向基于CNN的检测器和基于区域的框架的转变。
  • 综述指出在准确性、效率和可扩展性方面仍存在挑战,并提出未来研究方向。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。