Skip to main content
QUICK REVIEW

[論文レビュー] Novel Deep Learning Model for Traffic Sign Detection Using Capsule Networks

Amara Dinesh Kumar|arXiv (Cornell University)|May 11, 2018
Advanced Neural Network Applications参考文献 21被引用数 65
ひとこと要約

本論文は、ポーズと方位を捉えるカプセルネットワークベースの交通標識検出アーキテクチャを提案し、German Traffic Sign Recognition Benchmark (GTSRB) で97.6%の精度を達成します。

ABSTRACT

Convolutional neural networks are the most widely used deep learning algorithms for traffic signal classification till date but they fail to capture pose, view, orientation of the images because of the intrinsic inability of max pooling layer.This paper proposes a novel method for Traffic sign detection using deep learning architecture called capsule networks that achieves outstanding performance on the German traffic sign dataset.Capsule network consists of capsules which are a group of neurons representing the instantiating parameters of an object like the pose and orientation by using the dynamic routing and route by agreement algorithms.unlike the previous approaches of manual feature extraction,multiple deep neural networks with many parameters,our method eliminates the manual effort and provides resistance to the spatial variances.CNNs can be fooled easily using various adversary attacks and capsule networks can overcome such attacks from the intruders and can offer more reliability in traffic sign detection for autonomous vehicles.Capsule network have achieved the state-of-the-art accuracy of 97.6% on German Traffic Sign Recognition Benchmark dataset (GTSRB).

研究の動機と目的

  • 交通標識認識において物体の姿勢と方向を捉えるモデルの必要性を動機づけ、CNNの最大プーリングの制約に対処する。
  • 堅牢な交通標識検出のためのカプセルネットワークベースのアーキテクチャを提案する。
  • 手動特徴量抽出を排除し、空間的歪みや敵対的様 perturbations のような摂動に対する耐性を向上させる。
  • German Traffic Sign Recognition Benchmark (GTSRB) における最先端の性能を示す。

提案手法

  • カプセルを用いて物体のインスタンス化パラメータ(姿勢、方位)を表現するカプセルネットワークを用いる。
  • カプセル間で動的ルーティング(合意に基づくルーティング)を適用し、空間情報を保持する。
  • 手動特徴量設計と多くのパラメータを持つ従来のマルチネットワークパイプラインを回避する。
  • GTSRBで評価して精度を報告する。
  • 空間的摂動に対する頑健性と敵対的様な攻撃に対する潜在的耐性を主張する。

実験結果

リサーチクエスチョン

  • RQ1従来のCNNと比較して、カプセルネットワークは姿勢と方位情報を保持することで交通標識認識を改善できるか?
  • RQ2カプセルベースのアプローチはGTSRBデータセットで従来の方法より高い精度を達成するか?
  • RQ3提案モデルは交通標識検出における空間的歪みと潜在的な敵対的摂動に対してより頑健か?

主な発見

  • GTSRBデータセットで97.6%の最先端精度を達成。
  • カプセルネットワークは姿勢や方位などのインスタンス化パラメータを表現し、最大プーリングの制約に対処する。
  • 手動特徴量抽出を排除し、マルチネットワークアーキテクチャへの依存を減らす。
  • 空間的歪みに対する耐性を示し、自動運転における交通標識検出の信頼性を向上させる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。