QUICK REVIEW

[論文レビュー] A novel pLSA based Traffic Signs Classification System

Mrinal Haloi|arXiv (Cornell University)|Mar 23, 2015

Advanced Image and Video Retrieval Techniques参考文献 5被引用数 19

ひとこと要約

本稿では、SIFT記述子を用いたpLSA駆動型のビジュアルワード表現と、HOG特徴を用いた形状分類を組み合わせた、新規のpLSAベースの交通標識分類システムを提案する。GTSRBベンチマークにおいて98.14%の精度を達成し、深層学習やSVMベースの手法と比較して計算量が低く、準最先端の性能を発揮する。

ABSTRACT

In this work we developed a novel and fast traffic sign recognition system, a very important part for advanced driver assistance system and for autonomous driving. Traffic signs play a very vital role in safe driving and avoiding accident. We have used image processing and topic discovery model pLSA to tackle this challenging multiclass classification problem. Our algorithm is consist of two parts, shape classification and sign classification for improved accuracy. For processing and representation of image we have used bag of features model with SIFT local descriptor. Where a visual vocabulary of size 300 words are formed using k-means codebook formation algorithm. We exploited the concept that every image is a collection of visual topics and images having same topics will belong to same category. Our algorithm is tested on German traffic sign recognition benchmark (GTSRB) and gives very promising result near to existing state of the art techniques.

研究の動機と目的

先進ドライバー補助システム（ADAS）および自動運転用途に適した、計算効率が高く正確な交通標識分類システムの開発。
視覚的に類似した交通標識（形状や色の微小な違い）を、遮蔽、照明変化、視点変化といった実世界の条件下でも正しく分類する課題への対処。
pLSAによる教師なしトピックモデリングを活用し、畳み込みニューラルネットワーク（CNN）やSVMといった複雑な教師ありモデルへの依存を低減しながら分類精度を向上させること。
2段階分類パイプラインの導入：まずHOGとテンプレートマッチングを用いて標識の形状を分類し、その後SIFTベースのビジュアルワードを用いてpLSAを適用し、最終的なカテゴリ予測を実行する。

提案手法

入力画像を90×97ピクセルにリサイズし、アフィン変換を適用して視点変化の影響を軽減する。
HOG特徴とテンプレートマッチングを用いて、6つの形状カテゴリ（三角形、四角形、円形、単一円形、長方形、六角形）に交通標識を分類する。
学習画像からのSIFT記述子を用いてk-meansクラスタリングを実行し、300語のビジュアルボキャブラリーを構築する。
局所制約付き線形符号化（LLC）を用いて、テスト画像をpLSA入力用のビジュアルワードヒストグラムに符号化する。
実験的に最適とされた35トピックを用いてpLSAモデルを学習し、画像内の潜在的トピックを発見し、トピック確率を計算する。
pLSA符号化特徴に対してKNN分類を適用し、最大後確率に基づいて最終的なクラスラベルを割り当てる。

実験結果

リサーチクエスチョン

RQ1pLSAのような教師なしトピックモデリング手法は、深層学習やSVMベースの手法と比較して計算量を低減しつつ、準最先端の性能を達成できるか？
RQ2まずHOG特徴を用いて形状を分類し、その後SIFT特徴を用いてpLSAを適用する2段階分類パイプラインは、微細な交通標識認識における精度向上にどの程度効果的か？
RQ3pLSAにおける最適なトピック数は、精度と計算効率のバランスを取るためにどの程度か？
RQ4本手法は、実世界の交通標識画像において、視点変化、遮蔽、照明変化に対してどの程度耐性を示すか？

主な発見

提案されたpLSAベースのシステムは、GTSRBデータセットで全体で98.14%の精度を達成し、LDAとHOGやランダムフォレストといった従来手法を上回った。
「ユニーク」カテゴリでは100%の精度を達成し、「必須」標識では96.86%を超える精度を示し、特に挑戦的なサブカテゴリでも優れた性能を発揮した。
pLSAモデルにおける最適なトピック数は35であり、29～44のトピックの範囲で精度がピークに達した。
「速度制限」カテゴリでは98.82%の精度を達成し、サブカテゴリ全体にわたる良好な一般化性能を示した。
アフィン変換による前処理のおかげで、視点変化に対する耐性が向上し、回転や平行移動を加えた複数の画像バージョンでもテストされた。
pLSAベースの手法は、コンSENSUS CNN（99.46%）に匹敵する準最先端の結果を達成したが、はるかに計算量が少なく、FPGAのような低消費電力ハードウェアにも適した特性を有していた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。