Skip to main content
QUICK REVIEW

[论文解读] A novel pLSA based Traffic Signs Classification System

Mrinal Haloi|arXiv (Cornell University)|Mar 23, 2015
Advanced Image and Video Retrieval Techniques参考文献 5被引用 19
一句话总结

该论文提出了一种基于pLSA的新型交通标志分类系统,结合使用HOG特征的形状分类与基于SIFT描述符的pLSA驱动视觉词表示,其在GTSRB基准测试中实现了98.14%的准确率——接近最先进水平,且计算复杂度低于深度学习或SVM方法。

ABSTRACT

In this work we developed a novel and fast traffic sign recognition system, a very important part for advanced driver assistance system and for autonomous driving. Traffic signs play a very vital role in safe driving and avoiding accident. We have used image processing and topic discovery model pLSA to tackle this challenging multiclass classification problem. Our algorithm is consist of two parts, shape classification and sign classification for improved accuracy. For processing and representation of image we have used bag of features model with SIFT local descriptor. Where a visual vocabulary of size 300 words are formed using k-means codebook formation algorithm. We exploited the concept that every image is a collection of visual topics and images having same topics will belong to same category. Our algorithm is tested on German traffic sign recognition benchmark (GTSRB) and gives very promising result near to existing state of the art techniques.

研究动机与目标

  • 开发一种计算效率高且准确的交通标志分类系统,用于高级驾驶辅助系统(ADAS)和自动驾驶系统。
  • 解决在形状和颜色仅有微小差异的视觉相似交通标志的分类挑战,尤其在遮挡、光照变化和视角变化等真实场景条件下。
  • 利用pLSA进行无监督主题建模,以提升分类准确率,同时减少对复杂监督模型(如CNN或SVM)的依赖。
  • 提出一种两阶段分类流程:首先使用HOG和模板匹配对标志形状进行分类,然后基于SIFT特征的视觉词应用pLSA进行最终类别预测。

提出的方法

  • 通过将输入图像调整为90×97像素并应用仿射变换,以减轻视角变化的影响。
  • 使用HOG特征与模板匹配,将交通标志分类为六种类别:三角形、正方形、圆形、单环形、矩形和六边形。
  • 通过k-means聚类对训练图像中的SIFT描述符进行处理,构建包含300个视觉词的视觉词汇表。
  • 应用局部约束线性编码(LLC)将测试图像编码为视觉词直方图,作为pLSA的输入。
  • 使用35个主题(通过实验确定的最优数量)训练pLSA模型,以发现图像中的潜在主题并计算主题概率。
  • 在pLSA编码特征上使用KNN分类,基于最大后验概率分配最终类别标签。

实验结果

研究问题

  • RQ1与深度学习或SVM方法相比,无监督主题建模方法(如pLSA)是否能在计算复杂度更低的前提下实现接近最先进水平的交通标志分类性能?
  • RQ2两阶段分类系统(先利用HOG特征分类形状,再在SIFT特征上应用pLSA)在细粒度交通标志识别中是否能有效提升准确率?
  • RQ3在交通标志分类中,pLSA的最优主题数量是多少,能够实现准确率与计算效率之间的最佳平衡?
  • RQ4所提出方法在真实交通标志图像中对视角变化、遮挡和光照变化的鲁棒性如何?

主要发现

  • 所提出的基于pLSA的系统在GTSRB数据集上实现了98.14%的整体准确率,优于传统方法(如LDA+HOG和随机森林)。
  • 系统在“Unique”类别上达到100%准确率,在“Mandatory”标志上超过96.86%的准确率,表明其在具有挑战性的子类别上表现优异。
  • 当pLSA模型使用35个主题时达到最优性能,准确率在29至44个主题之间达到峰值。
  • 系统在“Speed Limits”类别上达到98.82%的准确率,表明其在各类子类别中具有良好的泛化能力。
  • 通过仿射变换预处理,系统在视角变化方面表现出鲁棒性,并在多种图像变体(包括旋转和平移版本)上进行了测试。
  • 基于pLSA的方法实现了接近最先进水平的性能,与委员会级CNN模型(99.46%准确率)相当,同时计算效率显著更高,更适合用于FPGA等低功耗硬件。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。