QUICK REVIEW

[論文レビュー] Vehicle Color Recognition using Convolutional Neural Network

Reza Fuad Rachmadi, I Ketut Eddy Purnama|arXiv (Cornell University)|Oct 26, 2015

Image Enhancement Techniques参考文献 8被引用数 50

ひとこと要約

本稿では、Chenデータセットで94.47%の精度を達成することで、先行研究を上回る畳み込みニューラルネットワーク（CNN）ベースの車両色認識手法を提案する。本手法はRGB、HSV、CIE Labの色空間を用い、複数の畳み込み層およびプーリング層を通じて色分布特徴を学習する。この結果、形状ベースの学習を目的として設計されたCNNでも、色の分類に効果的に機能することが示された。

ABSTRACT

Vehicle color information is one of the important elements in ITS (Intelligent Traffic System). In this paper, we present a vehicle color recognition method using convolutional neural network (CNN). Naturally, CNN is designed to learn classification method based on shape information, but we proved that CNN can also learn classification based on color distribution. In our method, we convert the input image to two different color spaces, HSV and CIE Lab, and run it to some CNN architecture. The training process follow procedure introduce by Krizhevsky, that learning rate is decreasing by factor of 10 after some iterations. To test our method, we use publicly vehicle color recognition dataset provided by Chen. The results, our model outperform the original system provide by Chen with 2% higher overall accuracy.

研究の動機と目的

照明や画像品質の変動に強い、インテリジェント交通システム（ITS）向けの堅牢な車両色認識システムの開発。
形状認識を目的として設計されたCNNが、色分布に基づいて効果的に学習・分類できるかどうかの検証。
RGB、HSV、CIE Labの異なる色空間を用いたCNNの性能比較。
CPUおよびGPUハードウェアにおけるモデルの実行効率の評価。実時間ITSアプリケーションへの実用的導入を想定。

提案手法

入力画像をRGB、HSV、CIE Labの3つの色空間に変換し、分類性能に与える影響を調査。
合計16層の2本のブランチを持つCNNアーキテクチャを採用。畳み込みおよびプーリング処理後に、2つの並列ネットワークの特徴を統合。
初期層ではReLU活性化関数、局所的応答正規化、マックスプーリングを用い、特徴学習を強化し、過学習を低減。
収束性を向上させるために、Krizhevskyらの手法に従い、学習率の段階的減少を用いた確率的勾配降下法でモデルを学習。
最初の畳み込み層の特徴マップを可視化し、ネットワークが赤青、緑グレー、シアン風の特徴など、色のパターンをどのように捉えているかを分析。
GPUアクセラレーションを活用したクライアント・サーバー型アーキテクチャを採用。448コアGPU上では分類処理時間を0.156秒まで短縮し、リアルタイム推論を実現。

実験結果

リサーチクエスチョン

RQ1形状特徴抽出を主眼に設計されたCNNが、色分布に基づいて効果的に学習・分類できるか。
RQ2RGB、HSV、CIE Labの色空間の選択が、CNNベースの車両色認識性能に与える影響は。
RQ3Chenらの最先端システムと比較して、本提案CNNモデルが全体の精度およびさまざまな色クラスにおける耐障害性において優れているか。
RQ4CPUとGPUハードウェアにおける本CNNモデルの推論速度はどの程度か。また、ITSアプリケーションにおけるリアルタイム導入を可能にするか。

主な発見

提案されたCNNモデルは全体で94.47%の精度を達成し、Chenらのシステムを2ポイント上回った。
RGB色空間で最も高い性能を示した。これは、各チャネルの寄与度が等しいとして色認識に不適切であるとされる従来の仮定に反する。
イエロー、ホワイト、ブルー、レッド、グレー、ブラック、グリーンの各色クラスで優れた性能を示した。シアンクラスの精度はChenらのシステムと比較して0.7%の低下にとどまった。
混同行列の分析から、緑とグレーのクラス間での誤分類は、特に金属質または低コントラストの塗装による色の類似性に起因していることが判明。
実行時間は単一コアCPU上では3秒から、448コアGPU上では0.156秒にまで短縮され、実用的なリアルタイム導入が可能になった。
最初の畳み込み層の可視化から、カーネルがシアン風、赤青、緑グレー、オレンジ風の特徴を明確に学習していることが確認され、ネットワークが色固有の特徴を効果的に捉えられることを裏付けた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。