Skip to main content
QUICK REVIEW

[论文解读] Object Detection with Pixel Intensity Comparisons Organized in Decision Trees

Nenad Markuš, Miroslav Frljak|arXiv (Cornell University)|May 20, 2013
Advanced Image and Video Retrieval Techniques参考文献 26被引用 37
一句话总结

本文提出了一种基于像素强度比较构建的决策树的快速、轻量级目标检测框架,通过级联拒绝器结构实现实时性能。该方法在计算量极小的情况下实现了具有竞争力的人脸检测准确率,无需积分图像或预处理步骤,可高效部署于低功耗设备,并通过旋转特征测试实现快速的旋转不变检测。

ABSTRACT

We describe a method for visual object detection based on an ensemble of optimized decision trees organized in a cascade of rejectors. The trees use pixel intensity comparisons in their internal nodes and this makes them able to process image regions very fast. Experimental analysis is provided through a face detection problem. The obtained results are encouraging and demonstrate that the method has practical value. Additionally, we analyse its sensitivity to noise and show how to perform fast rotation invariant object detection. Complete source code is provided at https://github.com/nenadmarkus/pico.

研究动机与目标

  • 开发一种适用于资源受限设备(如手机和嵌入式系统)的实时、低复杂度目标检测系统。
  • 在保持具有竞争力的检测准确率的同时,提升现有Viola-Jones风格检测器的处理速度。
  • 消除对计算成本较高的预处理步骤(如积分图像、HOG或图像缩放)的需求。
  • 通过旋转二元测试避免图像重采样,实现高效且旋转不变的人脸检测。
  • 评估模型在噪声下的鲁棒性,并在真实世界数据集上验证其实际可行性。

提出的方法

  • 该方法使用基于像素强度比较的二元测试的决策树集成:$\text{bintest}(I;\mathbf{l}_1,\mathbf{l}_2) = 0$ 当 $I(\mathbf{l}_1) \leq I(\mathbf{l}_2)$ 时成立,否则为1。
  • 树的每个内部节点通过在归一化图像坐标上进行贪婪采样,选择使训练数据加权均方误差(WMSE)最小的强度比较。
  • 通过基于回归的方法结合加权最小二乘法优化树的构建,并使用GentleBoost方法构建弱学习器的集成。
  • 采用级联拒绝器结构,每一级阶段均提前过滤负样本,从而显著提升整体推理速度。
  • 为实现旋转不变检测,预先使用查找表计算多个方向的像素强度比较,避免运行时的三角函数计算。
  • 系统不依赖积分图像、HOG或其它特征金字塔,仅依靠强度比较实现速度与简洁性。

实验结果

研究问题

  • RQ1仅基于像素强度比较的决策树框架能否在显著快于现有方法的同时,实现具有竞争力的目标检测准确率?
  • RQ2该方法在不同噪声水平下的表现如何?是否可在无需额外预处理的情况下实现鲁棒性?
  • RQ3系统能否在不进行重采样或昂贵特征变换的前提下,高效支持旋转不变的人脸检测?
  • RQ4在低功耗设备上,检测准确率与处理速度之间的权衡关系如何?
  • RQ5与OpenCV的LBP-based人脸检测器相比,该方法在旋转条件下的速度与性能表现如何?

主要发现

  • 在标准PC上,系统可在单核处理器上以低于32ms的时间完成对 $640 \times 480$ 图像在12个方向上的实时处理。
  • 在GENKI-SZSL数据集上,即使检测旋转人脸,检测准确率仍与OpenCV的LBP-based正面人脸检测器相当。
  • 该方法对高噪声水平较为敏感,在强高斯噪声下检测率显著下降,但可通过预滤波有效缓解。
  • 系统无需积分图像、HOG或对比度归一化、图像缩放等预处理步骤,从而降低了计算开销。
  • 旋转不变检测是可行且高效的,处理时间随方向数线性增加,且在所有测试角度下性能保持稳定。
  • 完整源代码已公开发布于 https://github.com/nenadmarkus/pico,支持可复现性与进一步开发。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。