QUICK REVIEW

[논문 리뷰] Novel Deep Learning Model for Traffic Sign Detection Using Capsule Networks

Amara Dinesh Kumar|arXiv (Cornell University)|2018. 05. 11.

Advanced Neural Network Applications참고 문헌 21인용 수 65

한 줄 요약

논문은 포즈와 방향 정보를 포착하는 캡슐 네트워크 기반 아키텍처를 통해 교통 표지 인식에서 독일 교통 표지 인식 벤치마크(GTSRB)에서 97.6%의 정확도를 달성한다.

ABSTRACT

Convolutional neural networks are the most widely used deep learning algorithms for traffic signal classification till date but they fail to capture pose, view, orientation of the images because of the intrinsic inability of max pooling layer.This paper proposes a novel method for Traffic sign detection using deep learning architecture called capsule networks that achieves outstanding performance on the German traffic sign dataset.Capsule network consists of capsules which are a group of neurons representing the instantiating parameters of an object like the pose and orientation by using the dynamic routing and route by agreement algorithms.unlike the previous approaches of manual feature extraction,multiple deep neural networks with many parameters,our method eliminates the manual effort and provides resistance to the spatial variances.CNNs can be fooled easily using various adversary attacks and capsule networks can overcome such attacks from the intruders and can offer more reliability in traffic sign detection for autonomous vehicles.Capsule network have achieved the state-of-the-art accuracy of 97.6% on German Traffic Sign Recognition Benchmark dataset (GTSRB).

연구 동기 및 목표

트라이프 표지 인식에서 객체의 포즈와 방향 정보를 포착해야 할 필요성을 제시하고, CNN의 최대풀링 한계를 다룬다.
캡슐 네트워크 기반 아키텍처를 제안하여 강건한 교통 표지 인식 모델을 제시한다.
수동 피처 추출을 제거하고 공간 왜곡 및 적대적 유사扰 perturbations에 대한 내성을 개선한다.
독일 교통 표지 인식 벤치마크(GTSRB)에서 최첨단 성능을 입증한다.

제안 방법

캡슐 네트워크를 사용하여 포즈, 방향 등의 객체 인스턴스 매개변수를 캡슐로 표현한다.
캡슐 간 다이내믹 루팅(합의에 의한 라우팅)을 적용하여 공간 정보를 보존한다.
수동 피처 엔지니어링 및 다수의 매개변수를 가진 전통적 멀티-네트워크 파이프라인을 피한다.
GTSRB를 평가 대상으로 정확도를 보고한다.
공간 왜곡에 대한 강건성과 적대적 유사 공격에 대한 저항성을 주장한다.

실험 결과

연구 질문

RQ1캡슐 네트워크가 포즈와 방향 정보를 보존하여 전통 CNN에 비해 교통 표지 인식 성능을 개선할 수 있는가?
RQ2캡슐 기반 접근 방식이 이전 방법보다 GTSRB 데이터셋에서 더 높은 정확도를 달성하는가?
RQ3제안된 모델이 교통 표지 인식에서 공간 왜곡 및 잠재적 적대 perturbations에 더 강건한가?

주요 결과

GTSRB 데이터셋에서 최첨단 정확도 97.6%를 달성한다.
캡슐 네트워크는 포즈와 방향과 같은 인스턴스 매개변수를 나타내며 최대 풀링의 한계를 해결한다.
수동 피처 추출을 제거하고 다중 네트워크 아키텍처 의존도를 줄인다.
공간 왜곡에 대한 저항성을 보이고 자율 주행 교통 표지 인식의 신뢰성을 향상시킨다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.